-
Data: 2013-04-19 21:43:15
Temat: Re: Rozwijanie petli
Od: firr kenobi <p...@g...com> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]W dniu czwartek, 18 kwietnia 2013 23:05:57 UTC+2 użytkownik 3d napisał:
> W ciemnym zaułku dnia Thu, 18 Apr 2013 04:47:50 -0700 (PDT), firr
>
> kenobi <p...@g...com> wymamrotal:
>
> > no spoko, w sumie nawet ciekawe
>
> > (sam kod avx wlasciwie taki sam
>
> > jak ta wersja softlab testowana
>
> > przeze mnie - skad pomysl by to
>
> > tak rozwinac na 12 pikseli ?
>
> > 12 pikseli dziala najszybciej ?
>
>
>
> Metodą prób i błędów.
>
>
>
> Gdybym miał dorabiać teorię, w obu algorytmach 12
>
> było optymalne pewnie przez wysycenie jednostek i
>
> kolejki. Samo liczenie po 4 wykorzystuje operacje
>
> ale w asm oprócz przepustowości w cyklach liczy
>
> się też latency - np 2 operacje na cykl ale wynik jest
>
> po 3 cyklach. Dlatego liczenie z przeplotem mogło
>
> dac wynik 2x szybciej.
>
no wlasnie to zdaje sie nie dlatego f1() f2() f1() f2()
jest szybsze ze bo f1-f2 rozgrzewają sobie kaszę tylko
dlatego ze f1() f1() f1() f1() blokuje sama siebie
np z moich pobieznych testów (niezbyt dokladnych
i moga byc bledy wyszlo ze mov [edx], xmm kosztuje
bardzo malo mov xmm, [edx] tez malo choc chyba wiecej
natomiast para mov [edx], xmm mov xmm, [edx] nagle
kilkukrotnie wiecej, to pewnie jest przypadek gdy
troughput spada do konfliktów na latency
Następne wpisy z tego wątku
- 20.04.13 09:43 M.M.
- 21.04.13 17:58 Edek
- 21.04.13 19:31 Edek
- 22.04.13 01:26 3d
- 23.04.13 12:13 M.M.
- 23.04.13 20:54 Edek
- 27.04.13 22:08 M.M.
Najnowsze wątki z tej grupy
- Popr. 14. Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- Arch. Prog. Nieuprzywilejowanych w pełnej wer. na nowej s. WWW energokod.pl
- 7. Raport Totaliztyczny: Sprawa Qt Group wer. 424
- TCL - problem z escape ostatniego \ w nawiasach {}
- Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- testy-wyd-sort - Podsumowanie
- Tworzenie Programów Nieuprzywilejowanych Opartych Na Wtyczkach
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
- Re: (PDF) Surgical Pathology of Non-neoplastic Gastrointestinal Diseases by Lizhi Zhang
Najnowsze wątki
- 2025-01-06 Popr. 14. Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- 2025-01-06 Ostrów Wielkopolski => Area Sales Manager OZE <=
- 2025-01-06 Do IO i innych elektrooszolomow, tu macie prawdziwe smrody
- 2025-01-06 Białystok => Full Stack .Net Engineer <=
- 2025-01-06 Kraków => Business Development Manager - Network and Network Security
- 2025-01-06 Katowice => Regionalny Kierownik Sprzedaży (OZE) <=
- 2025-01-06 Warszawa => Spedytor Międzynarodowy <=
- 2025-01-06 Lublin => Programista Delphi <=
- 2025-01-06 Gdańsk => Specjalista ds. Sprzedaży <=
- 2025-01-06 śnieg
- 2025-01-05 Żarówka do lampy z czujnikiem ruchu
- 2025-01-05 Rozkręcają się
- 2025-01-04 pozew za naprawę sprzętu na youtube
- 2025-01-04 gasik
- 2025-01-04 13. Raport Totaliztyczny: Powszechna Deklaracja Praw Człowieka Nie Chroni Przed Wyzyskiem Ani Przed Eksploatacją