-
Data: 2015-10-06 01:09:20
Temat: Re: asm - przesuwanie wektora bajtow
Od: Waldek Hebisch <h...@a...uni.wroc.pl> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]szemrany <s...@o...off> wrote:
> Witam
>
> Potrzebuj? przesun?? tablic?/wektor bajt?w w lewo o zadan? liczb? bit?w. Po
> jakim? tam czasie czytania i pr?b zrobi?em prock? opart? o instrukcj? RCL
> przesuwaj?ca o jeden bit:
>
>
> mov ebx, x // liczba bajt?w w wektorze
> mov eax, end_byte // adres ostatniego elementu
> clc
> @@loop:
> mov cl, byte ptr [eax]
> rcl cl, 1
> mov byte ptr [eax], CL
> dec eax
> dec ebx
> jne @@loop
>
> Teraz, gdy chc? przesun?? o 3 bity to wykonuj? ten kod w p?tli trzy razy.
>
> Czy ten kod mo?na zoptymalizowa? bardziej?
> Czy mo?na to zrobi? inaczej, bez RCL?
>
Napisz w C (niekompletne i nieprzetestowane):
carry = 0
for(i = 0; i < n; i++) {
val = *src++;
*dst++ = val<<k | carry;
carry = val>>(M-k);
}
gdzie val i carry sa odpowidniego typu bez znaku, M to ilosc bitow
w tym typie, n to ilosc jednostek do przesuniecia, k to i ile bitow
przesuwamy. Jesli jednostka jest bajt to przy przesuwaniu o jeden
bit ta twoja petla ma szanse byc szybsza (ale RCL to powolna
intrukcja...). Przy przesuwaniu w wiecej niz jeden bit metoda
z dwoma przesunieciami bedzie szybsza. To wyzej moze pracowac
na wiekszych jednostkach, np. po 64 bity. Ta sama metoda
uzywajac SSE pozwala przerobic 128 bitow na krok. Oczywiscie
wtedy jest problem z wyrownywaniem (podzielnoscia adresow
przez 8 czy 16) i koncowka. Ale jak masz dluzsze ciagi to
sie oplaca. Jesli masz troche luzu w pamieci to naprosciej
od razu dzialac na ciagach odpowiednio dlugich slow.
Jeszcze jedno: jak przesuwasz o 0 bitow to ten kod wyzej ma
prawo nie dzialac, po prostu wtedy nalezy kopiowac.
P.S. Jesli koniecznie chcesz w asm, to kompilator Ci powie
jak to wyglada, zreszta recznie tez latwo przetlumaczyc.
--
Waldek Hebisch
Następne wpisy z tego wątku
- 06.10.15 06:55 slawek
- 06.10.15 10:26 Radoslaw Szwed
- 06.10.15 12:06 M.M.
Najnowsze wątki z tej grupy
- Arch. Prog. Nieuprzywilejowanych w pełnej wer. na nowej s. WWW energokod.pl
- 7. Raport Totaliztyczny: Sprawa Qt Group wer. 424
- TCL - problem z escape ostatniego \ w nawiasach {}
- Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- testy-wyd-sort - Podsumowanie
- Tworzenie Programów Nieuprzywilejowanych Opartych Na Wtyczkach
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
- Re: (PDF) Surgical Pathology of Non-neoplastic Gastrointestinal Diseases by Lizhi Zhang
- CfC 28th Ada-Europe Int. Conf. Reliable Software Technologies
Najnowsze wątki
- 2024-12-28 Antyradar
- 2024-12-28 Deweloper przegral w sadzie musi zwrócic pieniądze Posypia sie kolejne pozwy?
- 2024-12-28 Warszawa => Full Stack .Net Engineer <=
- 2024-12-28 Warszawa => Sales Assistant <=
- 2024-12-28 Warszawa => Programista Full Stack .Net <=
- 2024-12-28 Warszawa => Full Stack web developer (obszar .Net Core, Angular6+) <=
- 2024-12-28 Katowice => Head of Virtualization Platform Management and Operating S
- 2024-12-28 Błonie => Analityk Systemów Informatycznych (TMS SPEED) <=
- 2024-12-28 Warszawa => Senior Frontend Developer (React + React Native) <=
- 2024-12-28 Żerniki => Employer Branding Specialist <=
- 2024-12-28 ale zawziętość i cierpliwość
- 2024-12-27 most kilometrowy
- 2024-12-27 Dyplomaci a alkomaty
- 2024-12-27 Zmiana kary
- 2024-12-27 Chiński elektrolizer tester wody