-
Path: news-archive.icm.edu.pl!news.icm.edu.pl!newsfeed.pionier.net.pl!news.glorb.com!
peer01.iad.highwinds-media.com!news.highwinds-media.com!feed-me.highwinds-media
.com!post01.iad.highwinds-media.com!fx03.iad.POSTED!not-for-mail
From: A.L. <a...@a...com>
Newsgroups: pl.comp.programming
Subject: Re: python...
Message-ID: <c...@4...com>
References: <f...@g...com>
<3...@g...com>
<d...@g...com>
<d...@g...com>
<3...@g...com>
<d...@g...com>
<3...@g...com>
<e...@g...com>
User-Agent: ForteAgent/7.00.32.1200
MIME-Version: 1.0
Content-Type: text/plain; charset=ISO-8859-2
Content-Transfer-Encoding: 8bit
Lines: 71
X-Complaints-To: a...@e...com
Organization: Forte - www.forteinc.com
X-Complaints-Info: Please be sure to forward a copy of ALL headers otherwise we will
be unable to process your complaint properly.
Date: Sat, 24 Jan 2015 14:56:05 -0600
X-Received-Bytes: 4894
X-Received-Body-CRC: 2281788734
Xref: news-archive.icm.edu.pl pl.comp.programming:207541
[ ukryj nagłówki ]On Sat, 24 Jan 2015 01:53:24 -0800 (PST), "M.M." <m...@g...com>
wrote:
>On Saturday, January 24, 2015 at 12:17:19 AM UTC+1, firr wrote:
>> W dniu piątek, 23 stycznia 2015 23:35:27 UTC+1 użytkownik M.M. napisał:
>> > On Friday, January 23, 2015 at 10:57:27 PM UTC+1, firr wrote:
>> > > W dniu piątek, 23 stycznia 2015 16:50:43 UTC+1 użytkownik M.M. napisał:
>> > > > On Friday, January 23, 2015 at 1:08:03 AM UTC+1, firr wrote:
>> > > > > W dniu piątek, 23 stycznia 2015 00:38:59 UTC+1 użytkownik Wojciech Muła
napisał:
>> > > > > > On Thursday, January 22, 2015 at 9:47:08 PM UTC+1, M.M. wrote:
>> > > > > > > On Thursday, January 22, 2015 at 12:40:00 PM UTC+1, firr wrote:
>> > > > > > > > tak naprawde chyba jesli dzis chce sie mowic o wydajnosci to nalezy
>> > > > > > > > pisac pod gpu opencl/cuda, cos takiego
>> > > > > > > W większości przypadków chyba masz rację. Obliczeniówka powinna być
>> > > > > > > na gpu.
>> > > > > >
>> > > > > > Model obliczeniowy GPU zakłada równoległość danych, co się sprawdza
>> > > > > > we względnie niewielu zastosowaniach.
>> > > > Zapomniałem, że ja ciągle trafiam na niestatystyczne przypadki :D
>> > > > Nie wiem jak często Wam się trafiają zadania trudne obliczeniowe, które
>> > > > można optymalizować przez zrównoleglenie.
>> > > >
>> > > > > > Do tego pamięci GPU i CPU są
>> > > > > > rozłączne, więc zachodzi konieczność transferu danych, co obniża
>> > > > > > całkowite przyspieszenie.
>> > > > Niestety, narzut na transfery to pewnie problem.
>> > > >
>> > > > > >
>> > > > > mozna poszukac nawet zwykle konsumerskie testy, np
>> > > > >
>> > > > > http://www.dobreprogramy.pl/Komputer-okazal-sie-nie-
dosc-szybki-OpenCL-moze-postawic-kwestie-wydajnosci-
na-glowie,News,58947.html
>> > > > >
>> > > > > jesli sa jako tako dobrze zrobione
>> > > > > (o tym to nigdy nie wiadomo ale
>> > > > > pewnie z grubsza ok) to pokazuje ze
>> > > > > mozliwe jest "mw" kilkukrotne przyspieszenie a wiec wydaje sie
>> > > > Słyszałem że jak coś da się wrzucić do pamięci karty i potem w
>> > > > pętli mielić przez całe godziny, to uzyskuje się przyspieszenie
>> > > > 100-200 razy. Obawiam się jednak, że to jest możliwe tylko pod
>> > > > warunkiem optymalizacji na jedną konkretną kartę - ale nie wiem
>> > > > na pewno. Może ogólnie to jest tylko kilkukrotne przyspieszenie.
>> > > >
>> > >
>> > > 200-300 to mz bajki gpu nie jest
>> > > az tyle mocniejsze, mysle ze dobre gpu jest najwyzej kilkanascie razy
mocniejsze niz dobre cpu przy tym
>> > > jest tez o wiele badziej podoatne na
>> > > spowolnienia
>> > >
>> > > kilkukrotnie to jednak nie jest malo, (!) - jest to calkiem sporo
>> > > chyab tez te trudnosci w kodowaniu
>> > > opencl sa przesadzone, chyba nie jest az tak zle
>> > > - byc moze nidlugo wykonam jakies testy
>> >
>> > Mnie chodziło m/w o takie porównanie. Bierzemy z 5 algorytmów w miarę
>> > podatnych na zrównoleglanie. Robimy wyżyłowaną implementację w asemblerze
>> > na cpu i na gpu. Oczywiście też na cpu równolegle. No i mierzymy czasy.
>> > Nie wyjdzie 100 razy szybciej na najnowszych teslach czy odpowiednikach
>> > z konkurencji?
>> >
>> nie wydaje mi sie.. tak jak mowilem mz raczej to jest zakres kilka-kilkanascie
razy, (przynajmniej co do ogolnej przepustowosci, moze czytsa arytmetyka bylaby
szybsza (?) ale czysta arytmetyka jest raczej mniej przydatna -- pewnie mozna
poszukac info w necie, i moze sam zrobie testy, na razie odpoczywam
>
>Widziałem kiedyś takie benchmarki. Niestety do szczegółów się nie dokopałem,
>ani nie mam pewności, że były zrobione uczciwie, bo robił producent gpu.
>Niemniej jednak wydajność była rzędu 100-200 razy większa, a konfiguracja
>sprzętowa to 2cpu vs 4gpu.
>Pozdrawiam
>
Pieprzenie.
A.L.
Następne wpisy z tego wątku
- 25.01.15 10:52 firr
- 26.01.15 02:29 Roman W
- 26.01.15 19:12 M.M.
- 26.01.15 20:15 Wojciech Muła
- 26.01.15 20:43 firr
- 27.01.15 00:06 M.M.
- 27.01.15 04:02 A.L.
- 27.01.15 08:12 firr
- 27.01.15 11:48 M.M.
- 27.01.15 12:34 firr
- 27.01.15 13:13 M.M.
- 27.01.15 14:06 IDKrzych
- 27.01.15 20:09 M.M.
- 27.01.15 20:27 Kviat
- 27.01.15 21:47 M.M.
Najnowsze wątki z tej grupy
- Perfidne ataki krakerów z KRLD na skrypciarzy JS i Pajton
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- U nas propagują modę na SI, a w Chinach naukowcy SI po kolei umierają w wieku 40-50lat
- C++. Podróż Po Języku - komentarz
- "Wuj dobra rada" z KDAB rozważa: Choosing the Right Programming Language for Your Embedded Linux Device
- Nowa ustawa o ochronie praw autorskich - opis problemu i szkic ustawy
- Alg. kompresji LZW
- Popr. 14. Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- Arch. Prog. Nieuprzywilejowanych w pełnej wer. na nowej s. WWW energokod.pl
- 7. Raport Totaliztyczny: Sprawa Qt Group wer. 424
- TCL - problem z escape ostatniego \ w nawiasach {}
- Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- testy-wyd-sort - Podsumowanie
Najnowsze wątki
- 2025-04-27 czy nieroby zablokują znowu Zakopiankę
- 2025-04-26 e-Doręczenia w praktyce.
- 2025-04-26 Warszawa => Konsultant Wiodący SAP PP <=
- 2025-04-26 Warszawa => Developer Microsoft Dynamics 365 Finance & Operations (D36
- 2025-04-26 Warszawa => Programista Microsoft Dynamics 365 Finance & Operations (D
- 2025-04-26 Środa Wielkopolska => SAP FI/CO Internal Consultant <=
- 2025-04-26 Patrole obywatelskie.
- 2025-04-26 Warszawa => Presales Engineer IT <=
- 2025-04-26 Gdynia => Przedstawiciel handlowy / KAM (branża TSL) <=
- 2025-04-26 Rudno => IT network administrator <=
- 2025-04-26 Dęblin => Node.js / Fullstack Developer <=
- 2025-04-25 Sprawdzić czy spółka ma sprawy w sądzie
- 2025-04-25 Solarny Palnik Wodorowy
- 2025-04-25 amperomierz w plusie
- 2025-04-25 nie wyłączam silnika