-
Data: 2012-02-15 22:31:30
Temat: Re: [hrdw] ssd ze zrownoleglaniem
Od: " " <f...@g...pl> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]bartekltg <b...@g...com> napisał(a):
> W dniu 2012-02-15 21:26, f...@g...pl pisze:
>
> > bylo fajnie zaznaczone ze storage na wspolczesnych kompach jest
> > struktura hierarchicznÄ o pieciu a nawet siedmu stopniach, najnizej
> > jest dysk twardy a najwyzej (tu byc moze mala niespodzianka):
> > rejestry
>
> Ale co w tym dziwnego. PrzecieĹź to od zawsze
> 'jest na wykĹadach'
> http://wazniak.mimuw.edu.pl/index.php?title=MN06#Hie
rarchia_pami.C4.99ci
> Ĺťadne zaskoczenie, Ĺźadna tajemnica;)
>
>
> > bylo pokazywane ze rejestry maja ok 6 razy wieksza przepustowosc niz
> > najlepszy cache (uzasadniane bylo jakos tym ze adresowanie rejestru
> > wymaga kilka bitow a cache wiele razy wiecej itp) - i ze korzystnie
> > jest miec
>
> Bardzo rozsÄ dne wytĹumaczenie tĹumaczenie.
> Hmm, coĹ nie mogÄ znaleĹÄ porĂłwnania prÄdkoĹÄi
> mov rejest rejestr
> mov rejestr pamiec
> mov pamiec rejestr
>
> http://www.intel.com/content/dam/doc/manual/64-ia-32
-architectures-software-
dev
> eloper-instruction-set-reference-manual-325383.pdf
> ale te pĂłĹtora tysiÄ ca stron mogĹo to gdzieĹ ukryÄ;)
>
> > ich duzo (mz przydalo by sie przynajmniej 16 a jeszcze lepiej i z 64
> > czemu nie) tak by przynajmniej fastcalle moc robic bez problemu -
> > tymczasem x86 ma biedne pare i dla mnie jest to niewytlumaczalne (tj
> > niezrozumiale ale jakos nie moge sie doszukac wytlumaczenia)
>
> JeĹli doĹźa liczba rejestrĂłw jest potrzebne 'aby szybko
> robiÄ fastcall' to napraqwdÄ jest to najmniejszy problem:)
>
> RejestrĂłw nie jest tak maĹo
>
> 16 bitĂłr miaĹy 6+2
> 32 bity majÄ 6+2
> 64 bity majÄ 14+2
>
> wyglÄ da wiÄc, Ĺźe cie posĹuchali i zwiÄkszyli ich iloĹÄ;)
>
> No i do tego mamy jeszcze sporo rejestrĂłw 'dodatkowych'
> koprocesora/MMX (8 po 80/64 bitĂłw)
> i 16 XMM (po 128bitĂłw) przynajmniej na x64.
>
> RÄcznie bym tego nie ogarnÄ Ĺ;)
>
> > obok innych ciekawych informacji bylo nt tego ze kosci ramu sa 50
> > nanosekundowe (a byla to ksiazka chyba gdzies tak z 2003 czyli dosyc
> > stara) i nietrafienie w cache kosztuje wlasnie te 50 ns - wiec tu
> > przynajmniej nie jest tak zle bo ta liczba (czyli totalne
> > nietrafienie) dla mnie urastala juz do legendy :/
>
> Widzisz ten link na samej gĂłrze. ByĹ na tej grupie jakieĹ 5 razy.
>
> Jest tam tabelka:
>
> Algorytm ijk ikj bikj(16) bikj(32) DGEMM ATLAS DGEMM
> Czas (s) 320.49 24.28 8.68 30.45 25.72 2.58
> Mflop/s 10.06 132.67 371.11 105.79 125.24 1248.53
>
> Te algorytmy robiÄ to samo. Praktycznie tak samo (tyle samo mnoĹźeĹ!
> bardziej skomplikowane algorytmy robiÄ nawet wiÄcej dodatkowych rzeczy)
> GĹĂłwna róşnica to 'inna kolejnoĹÄ dziaĹaĹ'.
>
> Algorytm naiwny olewajÄ cy sprawÄ cache jest ponad 100 razy gorszy.
>
> Przeanalizuj róşnicÄ miÄdzy "ijk" a "ikj". Trywialna zamiana,
> a przyspieszenie o kilkanaĹcie razy.
>
> [na róşnych precesorach wyniki sÄ oczywisÄie róşne. choÄby
> algorytmy blokowe majÄ optimum dla róşnych rozmiarĂłw bloku,
> ale prawidĹowoĹÄ pozostaje
> T_naiwny >> T_{z pomysĹem} > T_specjalistyczny ]
>
> OczywiĹcie, trzeba wiedzieÄ, gdzie to jest istotne.
> Tu mielimy wielokrotnie dany obszar, wiÄc zysk jest duĹźy.
> Gdzie indziej moĹźe nie byÄ. W przeszukiwaniu binarnym bazy
> danych nie bÄdzie;)
>
>
mniej chodzi o zaskoczenie czy tajemnice (choc chyba rejestry
maja swoje powody by byc szybsze ) co po prostu o zwykla istotnosc
tego faktu
--
Wysłano z serwisu Usenet w portalu Gazeta.pl -> http://www.gazeta.pl/usenet/
Następne wpisy z tego wątku
- 15.02.12 22:38 Edek
- 15.02.12 23:11 bartekltg
- 15.02.12 23:16 bartekltg
- 15.02.12 23:50 Edek
- 16.02.12 16:17 bartekltg
- 16.02.12 20:13 Edek
- 17.02.12 09:56 M.M.
- 17.02.12 10:00 Adam Klobukowski
- 17.02.12 10:39 M.M.
- 17.02.12 10:51 M.M.
- 17.02.12 13:23 bartekltg
- 17.02.12 14:37 M.M.
- 17.02.12 15:05 bartekltg
Najnowsze wątki z tej grupy
- Popr. 14. Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- Arch. Prog. Nieuprzywilejowanych w pełnej wer. na nowej s. WWW energokod.pl
- 7. Raport Totaliztyczny: Sprawa Qt Group wer. 424
- TCL - problem z escape ostatniego \ w nawiasach {}
- Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- testy-wyd-sort - Podsumowanie
- Tworzenie Programów Nieuprzywilejowanych Opartych Na Wtyczkach
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
- Re: (PDF) Surgical Pathology of Non-neoplastic Gastrointestinal Diseases by Lizhi Zhang
Najnowsze wątki
- 2025-01-20 huta ruszyla
- 2025-01-20 piece wodorowe
- 2025-01-20 Lublin => Programista Delphi <=
- 2025-01-20 Warszawa => Architekt rozwiązań (doświadczenie w obszarze Java, AWS
- 2025-01-20 Mińsk Mazowiecki => Area Sales Manager OZE <=
- 2025-01-20 Bieruń => Spedytor Międzynarodowy (handel ładunkami/prowadzenie flo
- 2025-01-19 Test - nie czytać
- 2025-01-19 qqqq
- 2025-01-19 Tauron przysyła aneks
- 2025-01-19 Nowa ładowarka Moya a Twizy -)
- 2025-01-18 Power BANK z ładowaniem przelotowym robi PRZERWY
- 2025-01-18 Pomoc dla Filipa ;)
- 2025-01-18 znowu kradno i sie nie dzielo
- 2025-01-18 Zieloni oszuchiści
- 2025-01-18 Zielonka => Specjalista ds. public relations <=