-
X-Received: by 2002:a25:c507:0:b0:ba7:7bd5:e063 with SMTP id
v7-20020a25c507000000b00ba77bd5e063mr2422319ybe.6.1684072810280; Sun, 14
May 2023 07:00:10 -0700 (PDT)
X-Received: by 2002:a25:c507:0:b0:ba7:7bd5:e063 with SMTP id
v7-20020a25c507000000b00ba77bd5e063mr2422319ybe.6.1684072810280; Sun, 14
May 2023 07:00:10 -0700 (PDT)
Path: news-archive.icm.edu.pl!news.icm.edu.pl!newsfeed.pionier.net.pl!2.eu.feeder.erj
e.net!feeder.erje.net!border-1.nntp.ord.giganews.com!nntp.giganews.com!news-out
.google.com!nntp.google.com!postnews.google.com!google-groups.googlegroups.com!
not-for-mail
Newsgroups: pl.comp.programming
Date: Sun, 14 May 2023 07:00:10 -0700 (PDT)
In-Reply-To: <u3q9gj$2jdsa$1@dont-email.me>
Injection-Info: google-groups.googlegroups.com; posting-host=92.67.160.10;
posting-account=5sNFBgoAAAAxlae8lv99mPyGsDs6ynwB
NNTP-Posting-Host: 92.67.160.10
References: <9...@g...com>
<u3o5jn$248lr$1@dont-email.me>
<a...@g...com>
<f...@g...com>
<u3q9gj$2jdsa$1@dont-email.me>
User-Agent: G2/1.0
MIME-Version: 1.0
Message-ID: <3...@g...com>
Subject: Re: Ile cykli zajmuje mnożenie liczb 64-bitowych?
From: "o...@g...com" <o...@g...com>
Injection-Date: Sun, 14 May 2023 14:00:10 +0000
Content-Type: text/plain; charset="UTF-8"
Content-Transfer-Encoding: quoted-printable
Lines: 79
Xref: news-archive.icm.edu.pl pl.comp.programming:215947
[ ukryj nagłówki ]niedziela, 14 maja 2023 o 11:28:17 UTC+2 Bogdan napisał(a):
> On 13/05/2023 19:43, o...@g...com wrote:
> > Swoją drogą mierzę sobie względną szybkość generatorów PRNG za pomocą:
> >
> > https://quick-bench.com
> >
> > Jedyne sensowne zestawienie, po zliczeniu przez mnie ręcznie liczby cykli na
operacje (wynik 22 do 13), które wykonują algorytmy, dostaję, gdy włączam optim=None.
Jeżeli zaś włączę OFast xoroshiro dostaje takiego przyspieszenia, że wyprzedza drugi
PRNG, według tego benchmarku.
> >
> > W samym xoroshiro liczę operację:
> >
> > const uint64_t s0 = s[0];
> >
> > jako jeden cykl, bo następuje wywołanie zmiennej z tablicy. Ale nie jestem
pewien, czy to tak należy szacować.
> To zależy od poziomu optymalizacji.
> Bez optymalizacji na samo to wziąłbym 1 cykl na kopię z pamięci do
> rejestru i 1 na kopię z rejestru do innej pamięci. Ale wspomniany
> dokument podaje np. 3 cykle na kopiowanie do pamięci, więc nawet to
> nie jest takie oczywiste.
> Z optymalizacją jest szansa, że "s0" siedzi w rejestrze, więc
> wystarczy pewnie 1 cykl na załadowanie.
> Oczywiście, jeśli s[0] jest ułożone na równym adresie.
> Oczywiście, jeśli s[0] siedzi w cache, bo jeśli nie, to w najgorszym
> przypadku mogą być może dziesiątki, jak nie setki cykli na pobranie z
> głównej pamięci.
> I pewnie jeszcze różne inne warunki, więc tabelki tabelkami, ale
> najlepiej albo pomierzyć (RDTSC), albo użyć narzędzi mówiących, co ile
> potrwa (kiedyś było np. jakieś VTune Analyzer).
> --
> Pozdrawiam/Regards - Bogdan (GNU/Linux & FreeDOS)
> Kurs asemblera x86 (DOS, GNU/Linux): http://bogdro.evai.pl
> Grupy dyskusyjne o asm: pl.comp.lang.asm alt.pl.asm alt.pl.asm.win32
> www.Xiph.org www.TorProject.org Soft(EN): http://bogdro.evai.pl/soft
Ok, czyli liczę to raczej prawidłowo. Przykładowe szacunki:
class xoroshiro256plus {
uint64_t s[4] = { 5, 11, 13, 99 };
static uint64_t rotl(const uint64_t x, int k)
{
return (x << k) | (x >> (64 - k));
}
public:
uint64_t next() noexcept
{
const uint64_t result = s[0] + s[3]; // 3 cycles
const uint64_t t = s[1] << 17; // 2 cycles
s[2] ^= s[0]; // 4 cycles
s[3] ^= s[1]; // 4 cycles
s[1] ^= s[2]; // 4 cycles
s[0] ^= s[3]; // 4 cycles
s[2] ^= t; // 2 cycles
s[3] = rotl(s[3], 45); // 6 cycles
return result;
}
};
//Xoroshiro256+ ma 29 cykli.
Następne wpisy z tego wątku
- 14.05.23 16:39 o...@g...com
- 15.05.23 14:00 Bogdan
- 15.05.23 14:03 Bogdan
- 15.05.23 15:10 o...@g...com
- 15.05.23 18:02 o...@g...com
- 22.05.23 19:30 Wojciech Muła
- 02.06.23 11:01 o...@g...com
- 02.06.23 14:11 o...@g...com
Najnowsze wątki z tej grupy
- Can you activate BMW 48V 10Ah Li-Ion battery, connecting to CAN-USB laptop interface ?
- We Wrocławiu ruszyła Odra 5, pierwszy w Polsce komputer kwantowy z nadprzewodzącymi kubitami
- Ada-Europe - AEiC 2025 early registration deadline imminent
- John Carmack twierdzi, że gdyby gry były optymalizowane, to wystarczyły by stare kompy
- Ada-Europe Int.Conf. Reliable Software Technologies, AEiC 2025
- Linuks od wer. 6.15 przestanie wspierać procesory 486 i będzie wymagać min. Pentium
- ,,Polski przemysł jest w stanie agonalnym" - podkreślił dobitnie, wskazując na brak zamówień.
- Rewolucja w debugowaniu!!! SI analizuje zrzuty pamięci systemu M$ Windows!!!
- Brednie w wiki - hasło Dehomag
- Perfidne ataki krakerów z KRLD na skrypciarzy JS i Pajton
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- U nas propagują modę na SI, a w Chinach naukowcy SI po kolei umierają w wieku 40-50lat
- C++. Podróż Po Języku - komentarz
Najnowsze wątki
- 2025-07-14 granice
- 2025-07-14 Awaria VM?
- 2025-07-14 Gdańsk => Programista Kotlin <=
- 2025-07-14 Warszawa => Junior Rekruter <=
- 2025-07-14 Warszawa => Specjalista rekrutacji IT <=
- 2025-07-14 Wkłady do zniczy...
- 2025-07-14 Warszawa => Specjalista ds. Sprzętu Komputerowego <=
- 2025-07-14 Re: PO chroniło i chroni policyjnych bandziorów [zawiasy za katowanie obywatela (Poznań czerwiec 2012)]
- 2025-07-14 Warszawa => International Freight Forwarder <=
- 2025-07-14 Warszawa => Recruiter 360 <=
- 2025-07-14 Re: Rz?Âd ZAKAZUJE magazyn?Â?w energii ?!! Nowe prawo od 14 lipca to SZOK! ??Â
- 2025-07-14 Warszawa => Sales Assistant <=
- 2025-07-13 Fałszywe alerty
- 2025-07-12 dlaczego gadacie z tym debilem
- 2025-07-13 Unia Europejska przygotowuje nowy podatek