-
Data: 2013-04-19 21:43:15
Temat: Re: Rozwijanie petli
Od: firr kenobi <p...@g...com> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]W dniu czwartek, 18 kwietnia 2013 23:05:57 UTC+2 użytkownik 3d napisał:
> W ciemnym zaułku dnia Thu, 18 Apr 2013 04:47:50 -0700 (PDT), firr
>
> kenobi <p...@g...com> wymamrotal:
>
> > no spoko, w sumie nawet ciekawe
>
> > (sam kod avx wlasciwie taki sam
>
> > jak ta wersja softlab testowana
>
> > przeze mnie - skad pomysl by to
>
> > tak rozwinac na 12 pikseli ?
>
> > 12 pikseli dziala najszybciej ?
>
>
>
> Metodą prób i błędów.
>
>
>
> Gdybym miał dorabiać teorię, w obu algorytmach 12
>
> było optymalne pewnie przez wysycenie jednostek i
>
> kolejki. Samo liczenie po 4 wykorzystuje operacje
>
> ale w asm oprócz przepustowości w cyklach liczy
>
> się też latency - np 2 operacje na cykl ale wynik jest
>
> po 3 cyklach. Dlatego liczenie z przeplotem mogło
>
> dac wynik 2x szybciej.
>
no wlasnie to zdaje sie nie dlatego f1() f2() f1() f2()
jest szybsze ze bo f1-f2 rozgrzewają sobie kaszę tylko
dlatego ze f1() f1() f1() f1() blokuje sama siebie
np z moich pobieznych testów (niezbyt dokladnych
i moga byc bledy wyszlo ze mov [edx], xmm kosztuje
bardzo malo mov xmm, [edx] tez malo choc chyba wiecej
natomiast para mov [edx], xmm mov xmm, [edx] nagle
kilkukrotnie wiecej, to pewnie jest przypadek gdy
troughput spada do konfliktów na latency
Następne wpisy z tego wątku
- 20.04.13 09:43 M.M.
- 21.04.13 17:58 Edek
- 21.04.13 19:31 Edek
- 22.04.13 01:26 3d
- 23.04.13 12:13 M.M.
- 23.04.13 20:54 Edek
- 27.04.13 22:08 M.M.
Najnowsze wątki z tej grupy
- 7. Raport Totaliztyczny: Sprawa Qt Group wer. 424
- TCL - problem z escape ostatniego \ w nawiasach {}
- Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- testy-wyd-sort - Podsumowanie
- Tworzenie Programów Nieuprzywilejowanych Opartych Na Wtyczkach
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
- Re: (PDF) Surgical Pathology of Non-neoplastic Gastrointestinal Diseases by Lizhi Zhang
- CfC 28th Ada-Europe Int. Conf. Reliable Software Technologies
- Młodzi programiści i tajna policja
Najnowsze wątki
- 2024-11-29 Białystok => Programista Full Stack (.Net Core) <=
- 2024-11-29 Gdańsk => Software .Net Developer <=
- 2024-11-29 Wrocław => Key Account Manager <=
- 2024-11-29 Gdańsk => Specjalista ds. Sprzedaży <=
- 2024-11-29 Chrzanów => Specjalista ds. public relations <=
- 2024-11-27 Re: UseGalileo -- PRODUKTY I APLIKACJE UŻYWAJĄ JUŻ DZIŚ SYSTEMU GALILEO
- 2024-11-27 Re: UseGalileo -- PRODUKTY I APLIKACJE UŻYWAJĄ JUŻ DZIŚ SYSTEMU GALILEO
- 2024-11-28 droga laweta
- 2024-11-28 Co tam się odpierdala w tej Warszawie?
- 2024-11-28 skąd się biorą tacy debile?
- 2024-11-28 JDG i utylizacja sprzetu
- 2024-11-27 Identyfikacja układ SO8 w sterowniku migających światełek choinkowych
- 2024-11-28 Katowice => Technical Artist <=
- 2024-11-28 Katowice => Technical Artist <=
- 2024-11-28 Bydgoszcz => QA Engineer <=