-
Path: news-archive.icm.edu.pl!news.gazeta.pl!newsfeed.pionier.net.pl!news.glorb.com!p
ostnews.google.com!d10g2000yqh.googlegroups.com!not-for-mail
From: Mariusz Marszałkowski <m...@g...com>
Newsgroups: pl.comp.programming
Subject: Re: kompresja danych
Date: Sun, 18 Oct 2009 00:37:55 -0700 (PDT)
Organization: http://groups.google.com
Lines: 27
Message-ID: <3...@d...googlegroups.com>
References: <4...@c...googlegroups.com>
<2...@p...null.onet.pl.invalid>
<8...@s...googlegroups.com>
<2...@p...null.onet.pl.invalid>
<4...@l...googlegroups.com>
<2...@p...null.onet.pl.invalid>
NNTP-Posting-Host: 89.229.16.190
Mime-Version: 1.0
Content-Type: text/plain; charset=ISO-8859-2
Content-Transfer-Encoding: quoted-printable
X-Trace: posting.google.com 1255851476 22126 127.0.0.1 (18 Oct 2009 07:37:56 GMT)
X-Complaints-To: g...@g...com
NNTP-Posting-Date: Sun, 18 Oct 2009 07:37:56 +0000 (UTC)
Complaints-To: g...@g...com
Injection-Info: d10g2000yqh.googlegroups.com; posting-host=89.229.16.190;
posting-account=xjvq9QoAAAATMPC2X3btlHd_LkaJo_rj
User-Agent: G2/1.0
X-HTTP-UserAgent: Mozilla/5.0 (Windows; U; Windows NT 5.2; pl; rv:1.9.1.3)
Gecko/20090824 Firefox/3.5.3,gzip(gfe),gzip(gfe)
Xref: news-archive.icm.edu.pl pl.comp.programming:183835
[ ukryj nagłówki ]On 18 Paź, 02:55, Wojciech Muła
<w...@p...null.onet.pl.invalid> wrote:
> Mariusz Marszałkowski <m...@g...com> wrote:
> > Pewnie najlepiej wypadnie najpierw długość serii + zamiana
> > wartości na pozycję + jakaś metda LZ. Długość serii dekompresuje
> > się błyskawicznie, zamiana wartości na pozycję trochę gorzej,
> > LZ też jest bardzo szybkie.
>
> > Więc pozostaje pytanie jaką metodą zmienić kolejność rekordów,
> > aby jakoś kompresji była jak najlepsza.
>
> Przeanalizowałem pierwszy milion rekordów i moje wnioski
> są następujące. Po odrzuceniu niektórych kolumn, liczba
> różnych kombinacji wartości w rekordach jest stosunkowo mała.
> Odrzuciłem kolumny 0, 21, 22 i 23 - liczba kombinacji
> to mniej niż 100 tysięcy. Pewnie jakby odrzucić trochę więcej,
> ta liczba spadłaby (jest już późno, nie chce mi się bawić).
>
> Więc można wpierw pogrupować rekordy wg tych kombinacji, np.
> wrzucić do hashmapy; od razu znasz wartości 20-kilku kolumn.
> Zaś pozostałe kolumny można już kompresować, albo nawet zapisać
> wprost, pewnie byś się zmieścił w kilku bajtach na rekord.
Dziękuję serdecznie.
Następne wpisy z tego wątku
- 17.10.09 14:08 Wiktor S.
- 18.10.09 17:11 Mariusz Marszałkowski
- 19.10.09 13:36 Daniel Janus
Najnowsze wątki z tej grupy
- 7. Raport Totaliztyczny: Sprawa Qt Group wer. 424
- TCL - problem z escape ostatniego \ w nawiasach {}
- Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- testy-wyd-sort - Podsumowanie
- Tworzenie Programów Nieuprzywilejowanych Opartych Na Wtyczkach
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
- Re: (PDF) Surgical Pathology of Non-neoplastic Gastrointestinal Diseases by Lizhi Zhang
- CfC 28th Ada-Europe Int. Conf. Reliable Software Technologies
- Młodzi programiści i tajna policja
Najnowsze wątki
- 2024-11-29 Dławik CM
- 2024-11-29 [OT] Lewe oprogramowanie
- 2024-11-29 Błonie => Sales Specialist <=
- 2024-11-29 Warszawa => IT Expert (Network Systems area) <=
- 2024-11-29 Warszawa => Ekspert IT (obszar systemów sieciowych) <=
- 2024-11-29 Warszawa => Head of International Freight Forwarding Department <=
- 2024-11-29 Białystok => Inżynier Serwisu Sprzętu Medycznego <=
- 2024-11-29 Pómpy ciepła darmo rozdajoo
- 2024-11-29 Białystok => Application Security Engineer <=
- 2024-11-29 Białystok => Programista Full Stack (.Net Core) <=
- 2024-11-29 Gdańsk => Software .Net Developer <=
- 2024-11-29 Wrocław => Key Account Manager <=
- 2024-11-29 Gdańsk => Specjalista ds. Sprzedaży <=
- 2024-11-29 Chrzanów => Specjalista ds. public relations <=
- 2024-11-27 Re: UseGalileo -- PRODUKTY I APLIKACJE UŻYWAJĄ JUŻ DZIŚ SYSTEMU GALILEO