-
Data: 2011-11-06 08:53:00
Temat: Re: asm/c grrrrreat
Od: "Bogdan (bogdro)" <b...@p...gazeta.pl> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]W dniu 05.11.2011 20:43, fir pisze:
> jestem zadowolony (pewnie do czasu az natkne sie na jakas
> przeszkode) bo udalo mi sie napisac proste add w sse
> i dziala, tylko mam pewne watpliwosci co do sposobu
> przekazywania parametrow
>
> ;implementacja "int __cdecl asm_add_float4vectors_sse(float4* a, float4* b,
> float4* ret);"
>
> asm_add_float4vectors_sse:
>
> enter 0,0
>
> mov eax,[ebp+8] ; first argument
> mov ebx,[ebp+12] ; second argument
> mov ecx,[ebp+16] ; third argument
>
> movups xmm0, [eax]
> movups xmm1, [ebx]
> addps xmm0, xmm1
> movups [ecx], xmm0
>
> leave
> ret
>
> czy powinno sie uzywac __cdecl - i czy to wogole jest poprawnie?
Skoro używasz kompilatora C, to domyślnie konwencja wywołania jest
dla języka C, więc nie trzeba pisać "__cdecl". Ale nie zaszkodzi.
Co do kodu - funkcjonalnie wygląda poprawnie, ale może "nie dogadać"
się z programem pisanym w C. Musisz zachować i przywrócić zawartość
rejestru EBX lub skorzystać z takiego, który wolno zamazać, np. EDX.
Poczytaj o konwencjach wywołań ("calling conventions").
Pewnie dałoby się też wnętrze funkcji skompresować do 3 instrukcji:
movups xmm0, [eax]
addps xmm0, [ebx]
movups [ecx], xmm0
Ale to kwestia optymalizacji, a nie funkcjonalności.
--
Pozdrawiam/Regards - Bogdan (GNU/Linux & FreeDOS)
Kurs asemblera x86 (DOS, GNU/Linux):http://rudy.mif.pg.gda.pl/~bogdro
Grupy dyskusyjne o asm: pl.comp.lang.asm alt.pl.asm alt.pl.asm.win32
www.Xiph.org www.TorProject.org Soft (EN): miniurl.pl/bogdro-soft
Następne wpisy z tego wątku
Najnowsze wątki z tej grupy
- Xiaomi [Chiny - przyp. JMJ] produkuje w całkowitych ciemnościach i bez ludzi
- Prezydent SZAP/USONA Trump ułaskawił prezydenta Hondurasu Hernandeza skazanego na 45 lat więzienia
- Rosjanie chwalą się prototypem komputera kwantowego. "Najważniejszy projekt naukowy Rosji"
- A Szwajcarzy kombinują tak: FinalSpark grows human neurons from stem cells and connects them to electrode arrays
- Re: Najgorszy język programowania
- NOWY: 2025-09-29 Alg., Strukt. Danych i Tech. Prog. - komentarz.pdf
- Na grupie comp.os.linux.advocacy CrudeSausage twierdzi, że Micro$lop używa SI do szyfrowania formatu dok. XML
- Błąd w Sofcie Powodem Wymiany 3 Duńskich Fregat Typu Iver Huitfeldt
- Grok zaczął nadużywać wulgaryzmów i wprost obrażać niektóre znane osoby
- Can you activate BMW 48V 10Ah Li-Ion battery, connecting to CAN-USB laptop interface ?
- We Wrocławiu ruszyła Odra 5, pierwszy w Polsce komputer kwantowy z nadprzewodzącymi kubitami
- Ada-Europe - AEiC 2025 early registration deadline imminent
- John Carmack twierdzi, że gdyby gry były optymalizowane, to wystarczyły by stare kompy
- Ada-Europe Int.Conf. Reliable Software Technologies, AEiC 2025
- Linuks od wer. 6.15 przestanie wspierać procesory 486 i będzie wymagać min. Pentium
Najnowsze wątki
- 2026-01-15 Konto na zdalnym NAS - jak zabezpieczyc pliki?
- 2026-01-15 Myślenice => Junior SAP CO Consultant <=
- 2026-01-15 Wyjaśnienie patologii opisanej w art. pt. "Przeciw bezkarności biznesu"
- 2026-01-15 Wyjaśnienie patologii opisanej w art. pt. "Przeciw bezkarności biznesu"
- 2026-01-15 "deficyt budżetowy [na 2026r. -przyp. JMJ] jest prognozowany na poziomie 271,7"Gzł, czyli 74.52G$
- 2026-01-15 Miliardy z podatków znów popłynęły do TVP
- 2026-01-14 #Motodziennik test - Jaecoo E5 - słabe auto, słaby elektryk. A ZIMĄ NAWET BARDZO
- 2026-01-14 Piaseczno cd
- 2026-01-14 Robert do ciebie
- 2026-01-14 Prątki to zawalidrogi
- 2026-01-14 Naruszenie immunitetu ZP-RE Romanowskiego bezkarne (umorzenie śledztwa żurkotury)
- 2026-01-14 Prezydent Trzaskowski nie będzie mógł ułaskawić Tuska, Sienkiewicza, Bodnara, ... przed prawomocnym wyrokiem?
- 2026-01-14 Do Kongresu SZAP/USONA Złożono Proj. ,,Ustawy o aneksji i statusie stanowym Grenlandii"
- 2026-01-13 STREFA CZYSTEGO TRANSPORTU. O tym nie mówią nam WŁADZE
- 2026-01-13 To nie koniec




5 Najlepszych Programów do Księgowości w Chmurze - Ranking i Porównanie [2025]