-
Path: news-archive.icm.edu.pl!news.icm.edu.pl!news.man.rzeszow.pl!news.nask.pl!news.n
ask.org.pl!news.internetia.pl!newsfeed.neostrada.pl!unt-exc-02.news.neostrada.p
l!unt-spo-a-01.news.neostrada.pl!news.neostrada.pl.POSTED!not-for-mail
From: "slawek" <s...@h...pl>
Newsgroups: pl.comp.programming
References: <k8frhm$5pg$1@node1.news.atman.pl>
<50abbc9e$0$1214$65785112@news.neostrada.pl>
<k8p9ei$h43$1@mx1.internetia.pl> <s...@n...notb-home>
<k8qe1s$9fo$2@mx1.internetia.pl> <s...@n...notb-home>
<50b0d20b$0$26710$65785112@news.neostrada.pl>
<1...@g...com>
<1...@g...com>
<6...@g...com>
<s...@n...notb-home>
<d...@g...com>
<4...@g...com>
<a...@g...com>
<s...@n...notb-home>
<50c50ce9$0$26686$65785112@news.neostrada.pl>
<c...@g...com>
In-Reply-To: <c...@g...com>
Subject: Re: Potyczki
Date: Wed, 19 Dec 2012 21:38:56 +0100
MIME-Version: 1.0
Content-Type: text/plain; format=flowed; charset="iso-8859-2"; reply-type=original
Content-Transfer-Encoding: 8bit
X-Priority: 3
X-MSMail-Priority: Normal
Importance: Normal
X-Newsreader: Microsoft Windows Live Mail 14.0.8117.416
X-MimeOLE: Produced By Microsoft MimeOLE V14.0.8117.416
Lines: 56
Message-ID: <50d225d6$0$1232$65785112@news.neostrada.pl>
Organization: Telekomunikacja Polska
NNTP-Posting-Host: 62.69.230.89
X-Trace: 1355949526 unt-rea-b-01.news.neostrada.pl 1232 62.69.230.89:63389
X-Complaints-To: a...@n...neostrada.pl
Xref: news-archive.icm.edu.pl pl.comp.programming:201474
[ ukryj nagłówki ]
Użytkownik "M.M." <m...@g...com> napisał w wiadomości grup
dyskusyjnych:cbc6eb9c-b9e3-4cdd-aeba-1d0d569e74c3@go
oglegroups.com...
> Pamięci nie ma, więc trzeba posortować na dysku. Plik posortowany miałby
> rozmiar plik_wejsciowy * dlugosc_podciagu. Nie wiem na ile to będzie
Owszem, ale przecież można trzymać tylko coś
(tablicę/listę/drzewo/korkociąg) uchwytów/wskaźników/adresów do ciągów.
Dla 1 GiB = 2^30 bajtów powinno to być nie więcej niż 2^30 wskaźników, czyli
czterobajtowe i będzie tego cztery razy mniej (bo ciągi były jak pamiętam 16
bajtowe).
Ogólniej - "brute force" to będzie tak jak piszesz. Wic w tym, żeby znaleźć
jakieś genijalne rozwiązanie... może wystarczy tego na magisterkę z
informatyki, a może nawet na Nobla.
> A jakby tak po prostu wczytać tyle danych ile się zmieści do RAM. Potem
> wczytywać dane z pliku i wybrać najczęściej powtarzający się element?
A jak wszystkie sekwencje będą unikalne? Jest 2^(16*8) unikalnych sekwencji
16-bajtowych (tj. oktetowych?!), a to jest 2^128 > 10^36 możliwości. Masz
jakieś 10^20 GiB RAM?
> Fajne zadanie, szkoda że mam tyle klepatologii stosowanej i nie
> mam na nic czasu, byśmy zrobili benchmark.
Fajne zadanie. A przyszło mi w kontekście szperania po np. logach - chcemy
wyłapać coś, co pojawia się częściej niż statystycznie uzasadnione. Ok,
dlaczego akurat 16 bajtów? No bo przecież jak potrafimy dla 16-tu, to i dla
15-tu, 14-tu. A przy 16 bajtach to się pewnie da załapać nagłówki TCP itp.
itd.
Jak to się dzieje, że mózgownica łapie deja vu, że łapiemy się na czytaniu
tego samego cytatu drugi raz? To też tak w kontekście. (Ok, mamy masywne
przetwarzanie równoległe w galaretce zwanej mózgiem.)
> (w zadaniu nic
> nie ma o tym, czy mamy dodatkową pamięć dyskową).
Mamy, nie mamy, ... bez znaczenia. Załóżmy - mamy! Tzn. dysk twardy 1 GB to
mniej niż tydzień pracy informatyka, więc chyba lepiej kupić dysk, niż
męczyć się nad problemem dodatkowy tydzień?! Z drugiej strony... kusi aby
nie kupować, bo może program ma chodzić na paru milionach smartfonów (a te
nie mają HDD)?
Zadanko jest abstrakcyjno/teoretycznie - miało nie tyle "być rozwiązane" -
ale ilustrować, co ja rozumiem za problem informatyczny. Tj. nie
matematyczny, nie fizyczny, chemiczny czy humanistyczny... ale właśnie
informatyczny.
Za rozwiązanie nie przewiduję nagród.
Najnowsze wątki z tej grupy
- Popr. 14. Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- Arch. Prog. Nieuprzywilejowanych w pełnej wer. na nowej s. WWW energokod.pl
- 7. Raport Totaliztyczny: Sprawa Qt Group wer. 424
- TCL - problem z escape ostatniego \ w nawiasach {}
- Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- testy-wyd-sort - Podsumowanie
- Tworzenie Programów Nieuprzywilejowanych Opartych Na Wtyczkach
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
- Re: (PDF) Surgical Pathology of Non-neoplastic Gastrointestinal Diseases by Lizhi Zhang
Najnowsze wątki
- 2025-02-06 PROGRAM DOPŁAT DO AUT ELEKTRYCZNYCH TO ABSURD. ZA ŚRODKI Z KPO KUPIMY NIEMIECKIE I CHIŃSKIE AUTA
- 2025-02-05 ceny OC
- 2025-02-05 Re: ceny OC
- 2025-02-05 Re: ceny OC
- 2025-02-07 Smar do video
- 2025-02-06 Litowe baterie AA Li/FeS2 a alkaliczne
- 2025-02-07 Gliwice => Business Development Manager - Network and Network Security
- 2025-02-07 Warszawa => System Architect (Java background) <=
- 2025-02-07 Warszawa => System Architect (background deweloperski w Java) <=
- 2025-02-07 Warszawa => Solution Architect (Java background) <=
- 2025-02-07 Gliwice => Ekspert IT (obszar systemów sieciowych) <=
- 2025-02-07 Lublin => Programista Delphi <=
- 2025-02-07 Warszawa => Architekt rozwiązań (doświadczenie w obszarze Java, AWS
- 2025-02-07 Dęblin => Node.js / Fullstack Developer <=
- 2025-02-07 Bieruń => Spedytor Międzynarodowy (handel ładunkami/prowadzenie flo