-
Data: 2017-12-24 08:32:56
Temat: testy krzyżowe generatorów liczb losowych
Od: "M.M." <m...@g...com> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]Najpierw link do źródła:
https://pastebin.com/9gNn76rk
Potem link do tabelek z wynikami (z dwóch uruchomień dla innych zarodków):
https://pastebin.com/tXyMMiE0
Pod tabelkami widać, że testy trwały ponad 100 godzin.
Wzajemnie testowało się sześć generatorów:
typedef LinRnd Rnd0;
typedef FibRnd Rnd1;
typedef std::mt19937_64 Rnd2;
typedef std::ranlux48 Rnd3;
typedef std::minstd_rand0 Rnd4;
typedef std::minstd_rand Rnd5;
Kolejność generatorów jest taka sama ja kolejność kolumn i wierszy w
tabelkach z wynikami.
Najważniejsza linia kodu z generatora LinRnd
return x = ( x * 122949823ull + 2468776129ull) % 25191867719ull;
I najważniejsza linia kodu z generatora FibRnd
return x[c] = x[a] + x[b];
Cały kod jest w źródle. Pozostałe generatory znacie.
Generatory do samo-testowania wykorzystywały, tak samo jak poprzednio,
test urodzinowy. Rok był krótki: 2^12. Ilość urodzin mała: 2^4. Wyniki
były wrzucane do 5 kubełków.
W tabelkach nazbierało się 90 wyników. Żaden wynik nie jest
mniejszy niż 0.01, a aż 22 wyniki są większe niż 0.99. Wnioski:
chi-kwadrat często miało dużą wartość, a rzadko małą. Problem
generatorów zazwyczaj polegał na tym, że generowane rozkłady
mocno się od siebie różniły. Natomiast nie występował problem
odwrotny, czyli że generowane rozkłady były zbyt podobne do
siebie. 22 wyniki większe niż 99% zniechęcają do jakichkolwiek
dalszych badań na niezależność.
Z tabelek usuwam wyniki dwóch liniowych generatorów:
typedef std::minstd_rand0 Rnd4;
typedef std::minstd_rand Rnd5;
Zostaje 46 wyników. Tym razem tylko(?) 4 wyniki są powyżej wartości 99%.
Można pokusić się o jakieś testy na niezależność. Weźmy dwa kubełki,
jeden poniżej 0.5, drugi powyżej. W kubełku powinny być 23 elementy, jest:
10 i 36. Chi-kwadrat wynosi 14,7. Skumulowany rozkład chi wynosi 0.9998736625.
Czyli mamy zaledwie 0,013% szans, na uzyskanie takiego rozkładu przy
pomocy losowego generatora. [PS. to by można policzyć (chyba) dokładniej
przy pomocy skumulowanego rozkładu dwumianowego]
Dajmy jeszcze trzy kubełki. W pierwszym kubełku jest tylko 7 elementów, w
drugim też 7, w trzecim są aż 32 elementy. Na oko już jest podejrzane.
Test chi ma wartość zaledwie 0,00013%.
Moim zdaniem test niezaliczony. Więc także usuwam z wyników pierwszy
generator linowy:
typedef LinRnd Rnd0;
Zostają tylko 24 wyniki. Przy podziale na dwa kubełki wartość oczekiwana w
kubełku wynosi więc 12. Tymczasem mamy w pierwszym kubełku 7 elementów, a
w drugim 17. Test chi-kwadrat daje ponad 4% szans na uzyskanie takiego
rozkładu w sposób losowy - mało, ale znacznie więcej niż przed usunięciem
generatora liniowego.
Niewielki jest sens dzielenia 24 wyników na 3 kubełki, ale podzielmy.
W pierwszym kubełku mamy 4, w drugim też 4, w trzecim 16 elementów.
Test chi-kwadrat daje zaledwie 0,248% szans na uzyskanie takiego
wyniku losowym generatorem.
Jak to podsumować....
1) Na pewno widać jak na dłoni, że po odrzuceniu generatorów
liniowych test jest bardziej podobny do testu na naprawdę losowych
generatorach.
2) Problem generatorów zazwyczaj polega na tym, że dają rozkłady zbyt
różnorodne, a nie zbyt podobne do siebie.
3) Test dobrych generatorów (MT, RanLux, Fibonacci) nie do końca się
udał, bo jest zbyt mało danych. Niemniej przy podziale na dwa kubełki
mamy 4% szans na uzyskanie takiego samego wyniku generatorami naprawdę
losowymi.
4) Test urodzinowy był ułatwiony, krótki rok, mało urodzin.
Pozdrawiam
Następne wpisy z tego wątku
Najnowsze wątki z tej grupy
- Can you activate BMW 48V 10Ah Li-Ion battery, connecting to CAN-USB laptop interface ?
- We Wrocławiu ruszyła Odra 5, pierwszy w Polsce komputer kwantowy z nadprzewodzącymi kubitami
- Ada-Europe - AEiC 2025 early registration deadline imminent
- John Carmack twierdzi, że gdyby gry były optymalizowane, to wystarczyły by stare kompy
- Ada-Europe Int.Conf. Reliable Software Technologies, AEiC 2025
- Linuks od wer. 6.15 przestanie wspierać procesory 486 i będzie wymagać min. Pentium
- ,,Polski przemysł jest w stanie agonalnym" - podkreślił dobitnie, wskazując na brak zamówień.
- Rewolucja w debugowaniu!!! SI analizuje zrzuty pamięci systemu M$ Windows!!!
- Brednie w wiki - hasło Dehomag
- Perfidne ataki krakerów z KRLD na skrypciarzy JS i Pajton
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- U nas propagują modę na SI, a w Chinach naukowcy SI po kolei umierają w wieku 40-50lat
- C++. Podróż Po Języku - komentarz
Najnowsze wątki
- 2025-07-03 ROG
- 2025-07-03 OZE dały Polsce więcej prądu niż elektrownie węglowe
- 2025-07-03 Dlaczego nikt nie powiadamia służb!
- 2025-07-02 Jaka ładowarka sieciowa do Iphona?
- 2025-07-02 ,,The Plot to Get RFK" (,,Spisek, by pozbyć się RFK")
- 2025-07-02 Rozkaz 17-2025: O Zaprzestaniu Zaciągania Kredytów
- 2025-07-02 Rozkaz 16-2025: 2025-06-19 Apelacja Do Wyroku Sądu Rej. w Sprawie IVRNs 295-23
- 2025-07-02 Rozkaz 17-2025: O Zaprzestaniu Zaciągania Kredytów
- 2025-07-02 Inżynierowie... inżynierzy...
- 2025-07-02 Can you activate BMW 48V 10Ah Li-Ion battery, connecting to CAN-USB laptop interface ?
- 2025-07-02 Kto potrafi sprawdzić aku BMW 48V 10Ah Li-Ion do mini hybrydy, czy sprawny ?
- 2025-07-02 Warszawa => Senior IT Recruitment Consultant <=
- 2025-07-02 Gdańsk => Konsultant wdrożeniowy (systemy controlingowe) <=
- 2025-07-02 Warszawa => IT Hardware Specialist - Wsparcie i Konfiguracja <=
- 2025-07-02 Warszawa => Inżynier oprogramowania .Net <=