-
X-Received: by 2002:a05:6214:144e:: with SMTP id b14mr22391763qvy.8.1629491574804;
Fri, 20 Aug 2021 13:32:54 -0700 (PDT)
X-Received: by 2002:a05:6214:144e:: with SMTP id b14mr22391763qvy.8.1629491574804;
Fri, 20 Aug 2021 13:32:54 -0700 (PDT)
Path: news-archive.icm.edu.pl!news.icm.edu.pl!newsfeed.pionier.net.pl!2.eu.feeder.erj
e.net!feeder.erje.net!newsreader4.netcologne.de!news.netcologne.de!peer02.ams1!
peer.ams1.xlned.com!news.xlned.com!peer01.iad!feed-me.highwinds-media.com!news.
highwinds-media.com!news-out.google.com!nntp.google.com!postnews.google.com!goo
gle-groups.googlegroups.com!not-for-mail
Newsgroups: pl.comp.programming
Date: Fri, 20 Aug 2021 13:32:54 -0700 (PDT)
In-Reply-To: <f...@g...com>
Injection-Info: google-groups.googlegroups.com; posting-host=37.128.16.171;
posting-account=xjvq9QoAAAATMPC2X3btlHd_LkaJo_rj
NNTP-Posting-Host: 37.128.16.171
References: <6...@g...com>
<0...@g...com>
<1...@g...com>
<f...@g...com>
<5...@g...com>
<2...@g...com>
<f...@g...com>
User-Agent: G2/1.0
MIME-Version: 1.0
Message-ID: <4...@g...com>
Subject: Re: Jak zrobić test za pomocą PractRand?
From: "M.M." <m...@g...com>
Injection-Date: Fri, 20 Aug 2021 20:32:54 +0000
Content-Type: text/plain; charset="UTF-8"
Content-Transfer-Encoding: quoted-printable
X-Received-Bytes: 7464
Xref: news-archive.icm.edu.pl pl.comp.programming:215503
[ ukryj nagłówki ]On Friday, August 20, 2021 at 8:45:23 PM UTC+2, o...@g...com wrote:
> > Jeśli dane są w pliku binarnym to tak:
> > cat dane_binarne.bin | ./PractRand stdin [tu wpisz opcje PractRand]
> Jakie są te opcje PractRand? Ja uruchamiam to w ten sposób:
>
> cat plik.data | ./RNG_test stdin
>
> Niestety zwiększenie rozmiaru pliku do 230 GB nie pomogło, a więcej nie zmieści mi
się na dysku. Wciąż dziwią mnie te oblane testy, podczas, gdy wszystkie testy
Dieharder ten generator zdawał. Albo PractRand jest o tyle bardziej wymagający, albo
nadal coś jest nie tak.
> > > Wydaje mi się, że prędzej, niż ogarnę C++ zrobię odpowiedni plik.
> > Można ,ale dobre testowanie wymaga dużo danych. Osobiście testowałem generatory
minimum
> > godzinę, maksimum (o ile pamiętam) dwa tygodnie na jednym wątku. Przez ten czas,
szczególnie
> > przez dwa tygodnie, generator jest w stanie wygenerować sporo liczb i program
testowy sporo skonsumować.
> > Liczby z dwóch tygodni nie wiem czy zmieszczą się na dysku.
> Na pewno się nie zmieszczą. Już osiągnąłem limit. Z jakichś powodów zresztą bardzo
szybko udało mi się to wygenerować i zapisać do pliku (godzina z hakiem), tak jakby
liczby w formacie binarnym zapisywały się szybciej. 50 GB liczb 32-bitowych w
formacie dziesiętnym zapisywało mi się kilka godzin.
>
> Ile GB w takim przetestowałeś, skoro robiłeś testy nawet 2 tygodnie?
> > > Przepisanie kodu z Pythona do C++ musiałbym raczej komuś zlecić.
> > Co tam konkretnie jest do napisania? Może coś podobnego jest to gotowe pod
linkami które podałem?
> Przykładowy program:
>
> https://pastebin.com/K164URZQ
>
> Liczby 128-bitowe są tam ładowanie po prostu do listy allstream, ale oczywiście
można to zaaranżować inaczej.
> > > Pytanie, czy będę w stanie wygenerować odpowiedni plik w odpowiednim czasie (bo
pomimo, że generatory, które testuję są
> > > jednymi z najszybszych na świecie, co do zasady są podobne do PCG generators,
to Python nie dość, że bywa 50-100 razy
> > > wolniejszy niż C++, to jeszcze do tego sam zapis do pliku trwa długo i jak
szybki nie byłby generator - nie da się tego procesu
> > > przyspieszyć). Ile PractRand potrzebuje danych?
> > Zapis całego dużego dysku to np. jedna doba, ale zależy jaki szybki/duży dysk,
może być godzina, może być tydzień. Trudno
> > bez testów powiedzieć czy wolniejszy będzie zapis czy powolne generowanie
najszybszym generatorem na świecie. PractRand
> > tym lepiej testuje im więcej danych otrzyma.
> Ja zapisałem cały dysk w godzinę z hakiem.
> > > żeby generator nie oblewał testów (gdy danych było za mało plik był zawijany i
do testów był brane w kółko te same liczby, do
> > > powodowało oblewanie testów). A i tak zawijał niektóre próbki, tzw. "
rewounds".
> > Temat jest trudniejszy, może generator na małych zapętlonych danych przechodzić
test, na na długich oblewać.
> W każdym razie wszystkie testy przy odpowiedniej ilości danych zdawał. Wystarczyło
50 GB danych, zapisanych w formacie dziesiętnym jako liczby 32-bitowe.
> > Chyba najlepiej odtworzyć te same dane losowe co były użyte w programie, aby mieć
pewność że program
> > pracował na losowych danych które przechodzą testy statystyczne.
> Używam tych samych danych. A mimo to w PractRand pełno testów jest niezdanych.
> > Zadziała, ale jeśli tester nie wspomaga plików tekstowych, to trzeba samemu
napisać program który zamieni dane tekstowe na binarne.
> > Potem dam przykładowy kod w C++, może dziś wieczorem, to kilka linijek.
> Wygenerowałem plik .data. Zapisałem tam liczby w formacie binarnym. Wszystko
wskazuje na to, że to powinno działać. Może po prostu generator nie zdaje testów. Z
drugiej jednak strony, jeśli Ty piszesz, że testowałeś generator nawet kilka dni, to
jest nic w porównaniu z danymi, które ja dostarczyłem do testów, wygenerowanymi
zaledwie w godzinę. Może po prostu jest ich za mało. Ale, czy 230 GB to za mało?
> > Teraz nie mogę, potem dam kod program który przekonwertuje plik tekstowy do
binarnego. Proszę, pokaż ( i jeśli trzeba to opisz )
> > jak wygląda oryginalny plik tekstowy.
> Jeżeli zapisuję dane to pliku .txt, to wygląda to tak:
>
> "010101010101000101111010101010101110100101111101011
0111110...010101010101010100101010101010010101010101
00101010101011111"
>
> Po prostu pseudolosowy ciąg zer i jedynek, nic więcej.
Ok.
Pobierz ten plik źródłowy i skompiluj konwerter.
https://github.com/mmarszik/01ToBin/blob/main/main.c
pp
Potem uruchom tak:
TwójGeneratorZerIJedynek | ./01ToBin | ./PractRand stdin
Albo gorzej tak:
cat PlikZerIJedynek | ./01ToBin | ./PractRand stdin
Nie testowałem, jak nie zadziała, to będzie trzeba sprawdzić czy konwerter nie ma
jakiś błędów
Pozdrawiam
Następne wpisy z tego wątku
- 20.08.21 23:56 o...@g...com
- 21.08.21 00:11 M.M.
- 21.08.21 00:20 o...@g...com
- 21.08.21 00:27 o...@g...com
- 21.08.21 00:49 M.M.
- 21.08.21 01:55 o...@g...com
- 21.08.21 11:40 M.M.
- 21.08.21 13:27 M.M.
- 21.08.21 16:53 o...@g...com
- 21.08.21 17:18 M.M.
- 21.08.21 17:51 o...@g...com
- 21.08.21 18:30 M.M.
- 21.08.21 19:16 o...@g...com
- 21.08.21 21:24 o...@g...com
- 21.08.21 21:48 M.M.
Najnowsze wątki z tej grupy
- 7. Raport Totaliztyczny: Sprawa Qt Group wer. 424
- TCL - problem z escape ostatniego \ w nawiasach {}
- Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- testy-wyd-sort - Podsumowanie
- Tworzenie Programów Nieuprzywilejowanych Opartych Na Wtyczkach
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
- Re: (PDF) Surgical Pathology of Non-neoplastic Gastrointestinal Diseases by Lizhi Zhang
- CfC 28th Ada-Europe Int. Conf. Reliable Software Technologies
- Młodzi programiści i tajna policja
Najnowsze wątki
- 2024-12-17 Rodzaj przekładni planetarnej z
- 2024-12-17 Z instrukcji do kitu
- 2024-12-17 Re: W telefonie brak szufladki na drugą kartę SIM
- 2024-12-17 nie wyrzucaj starych opon
- 2024-12-17 znów elektryk:P
- 2024-12-17 "Ręczny" a przegląd.
- 2024-12-17 Warszawa => Senior Frontend Developer (React + React Native) <=
- 2024-12-17 Warszawa => Fullstack Developer <=
- 2024-12-17 Warszawa => Starszy Konsultant AWS <=
- 2024-12-17 Kraków => Full Stack .Net Engineer <=
- 2024-12-17 Kraków => Programista Full Stack (.Net Core) <=
- 2024-12-17 Kraków => Software .Net Developer <=
- 2024-12-17 Rozproszona Kontrola Konstytucyjności WYBORNE ;-)
- 2024-12-17 dotacja dla PiS
- 2024-12-17 wolny rynek