-
Path: news-archive.icm.edu.pl!agh.edu.pl!news.agh.edu.pl!newsfeed2.atman.pl!newsfeed.
atman.pl!.POSTED!not-for-mail
From: Edek <e...@g...com>
Newsgroups: pl.comp.programming
Subject: Re: [trochę OT] Petaflopy
Date: Mon, 21 Jul 2014 18:17:13 +0000 (UTC)
Organization: ATMAN - ATM S.A.
Lines: 62
Message-ID: <lqjlf9$9k2$1@node1.news.atman.pl>
References: <lqeli6$ajg$1@node2.news.atman.pl>
<5...@g...com>
<b...@g...com>
NNTP-Posting-Host: 178-36-249-91.adsl.inetia.pl
Mime-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit
X-Trace: node1.news.atman.pl 1405966633 9858 178.36.249.91 (21 Jul 2014 18:17:13 GMT)
X-Complaints-To: u...@a...pl
NNTP-Posting-Date: Mon, 21 Jul 2014 18:17:13 +0000 (UTC)
User-Agent: Pan/0.139 (Sexual Chocolate; GIT bf56508 git://git.gnome.org/pan2)
Xref: news-archive.icm.edu.pl pl.comp.programming:206378
[ ukryj nagłówki ]Szarym od mżawki świtem Mon, 21 Jul 2014 10:31:18 -0700, firr wyrzucił
pustą ćwiartkę i oznajmił:
> ps co do zwyklych pecetóf to operuja one w skali gigafloatów (kiedys juz byla o tym
mowa tj podawalem
> swoje oszacowania ile to moze byc, nawet juz nie pamietam ile to wychodzilo, ale
moje obecne oszacowania
>
> CPU
>
> "memory bandwidth" - 1-2 GigaFlopa, podobno dla danych w cache to moze byc 6x
szybciej ale ja tego nie
> obserwowalem, dominujacy czynnik to jest ta zwykla wartosc
> "prosta arytmetyka" - tutaj w zasadzie nie wiem dokladnie ale z czytanych jakichs
tam benchmarkow
> i z wlasnych oszacowan wynikalo by ze jest to okolo
> 2 gigaflopa dla kody skalarnego i ok 6 Gigaflopow
> dla sse (na rdzeń) - nie sa to do konca pewne dla mnie wartosci ale chyba dosyc
rozsadne w realnym kodzie pewnie mozna osciagnac jakies wyniki pod to podchodzace
(czyli mozn anp ze 4 razy gorsze)
>
> GPU
>
> gpu sa podobno rozne i te slabsze 'na rynku' sa chyba kilkukrotnie slabsze niz te
mocniejsze
>
> "memory bandwith" podobno gpu maja wiekszą wewnetrzna 'memory bandwidth' jesli
chodzi o ich wewnetrzny vram (za to te przesylowa ram->vram podobno jest mw taka sama
lub nawet ciut wolniejsza niz ta typowa dla ram i cpu - acz tego nie jestem pewiem
ale ponoc) - zalezy chyba od karty ale np dla
> mocniejszej karty jest to np 30 Gigaflopow (czyli kilkanascie razy wiecej)
>
> "prosta arytmatyka" - zalezy od karty ale podobno moze siegac tak ze 400 Gigaflopow
(moze to jest troche przesadzone ale podobno) Porownywanie ze
> skalarnym rczeniem dawalo by 200x wieksza moc,
> z sse tak z 70x wieksza moc, z 8 rdzeniami z sse
> 10 x wieksza moc (moze to jest i realistyczne
> ale to jest dla mocnej karty, pewnie ta ktora ja mam jest akurat z 10 razy slabsza)
>
> podsumowujac
> cpu 1-2 GF mem /2-6 x cores, GF arithmetic
> gpu 3?-30? GF mem / 40? - 400? GF arithmetic
>
> sa to dane z roznych opinie w necie i troche z
> moich testow jesli chodzi o cpu (te dane dot
> gpu moga byc troche niepewne) ale z grubsza
> jakos tak to chyba musi wygladac
>
> w jeszcze wiekszym skrócie cpu mem 1-2 GFloata
> cpu arithmetic 5 GFloatow na rdzen, gpu kilka do
> 30 razy lepiej niz cpu (z tym tez ze podobno
> moc gpu szybko spada dla troche bardziej trudnych i rozgalezionych kerneli)
>
> (nie sa to dokladne dane ale chodzi o to by miec jakies wyobrazenie
Topowe:
330 GB/s RAM, jakieś 70 razy tyle pamięć na GPU. 5 TFlopów single precision.
http://en.wikipedia.org/wiki/List_of_Nvidia_graphics
_processing_units#GeForce_700_Series
http://en.wikipedia.org/wiki/List_of_Nvidia_graphics
_processing_units#Tesla
Wybrane:
GTX 650 Ti: 1.4 TFlopa, 80GB/s, 110W, jakieś 6 stówek czyli mniej niż porównywalne
cpu.
Oczywiście to są idealne dane, w real life ma się jakieś 70-90% przepustowości,
zależnie od możliwości algorytmu może być dużo mniej. Najwolniejsze jest kopiowanie
po PCIe.
Poza tym nie wiem skąd masz dane o cpu, wyglądają antycznie albo laptopowo żeby nie
powiedzieć kosmicznie.
--
Edek
Następne wpisy z tego wątku
- 21.07.14 22:40 firr
- 22.07.14 03:01 firr
- 22.07.14 09:35 Borneq
- 22.07.14 10:03 A.L.
- 24.07.14 12:39 firr
- 24.07.14 22:11 firr
- 21.11.15 16:04 Borneq
- 22.11.15 23:43 M.M.
- 22.11.15 23:51 Sebastian Biały
- 23.11.15 16:59 M.M.
- 23.11.15 19:36 Sebastian Biały
- 23.11.15 20:03 M.M.
- 23.11.15 20:24 szemrany
- 23.11.15 20:40 M.M.
- 23.11.15 20:47 RW
Najnowsze wątki z tej grupy
- Alg. kompresji LZW
- Popr. 14. Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- Arch. Prog. Nieuprzywilejowanych w pełnej wer. na nowej s. WWW energokod.pl
- 7. Raport Totaliztyczny: Sprawa Qt Group wer. 424
- TCL - problem z escape ostatniego \ w nawiasach {}
- Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- testy-wyd-sort - Podsumowanie
- Tworzenie Programów Nieuprzywilejowanych Opartych Na Wtyczkach
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
Najnowsze wątki
- 2025-02-12 Warszawa => Expert Recruiter 360 <=
- 2025-02-12 Ostrów Wielkopolski => Area Sales Manager OZE <=
- 2025-02-12 Bieruń => Regionalny Kierownik Sprzedaży (OZE) <=
- 2025-02-12 Dęblin => Node.js / Fullstack Developer <=
- 2025-02-12 Kraków => PHP Full Stack Developer <=
- 2025-02-12 Karta dźwiękowa stereo
- 2025-02-12 Dęblin => JavaScript / Node / Fullstack Developer <=
- 2025-02-12 Gdańsk => Specjalista ds. Sprzedaży <=
- 2025-02-12 Łódź => NodeJS Developer <=
- 2025-02-12 Błonie => Sales Specialist <=
- 2025-02-12 Dziwne zachowanie magistrali adresowej w 8085
- 2025-02-11 Mini pecet
- 2025-02-10 Spalił się spaliniak
- 2025-02-10 zarowka wifi - z sensowna apka lub lepiej albo lokalnie lub przez web. I zeby harmonogram miala
- 2025-02-10 Chrzanów => Programista NodeJS <=