-
Data: 2009-10-18 07:37:55
Temat: Re: kompresja danych
Od: Mariusz Marszałkowski <m...@g...com> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]On 18 Paź, 02:55, Wojciech Muła
<w...@p...null.onet.pl.invalid> wrote:
> Mariusz Marszałkowski <m...@g...com> wrote:
> > Pewnie najlepiej wypadnie najpierw długość serii + zamiana
> > wartości na pozycję + jakaś metda LZ. Długość serii dekompresuje
> > się błyskawicznie, zamiana wartości na pozycję trochę gorzej,
> > LZ też jest bardzo szybkie.
>
> > Więc pozostaje pytanie jaką metodą zmienić kolejność rekordów,
> > aby jakoś kompresji była jak najlepsza.
>
> Przeanalizowałem pierwszy milion rekordów i moje wnioski
> są następujące. Po odrzuceniu niektórych kolumn, liczba
> różnych kombinacji wartości w rekordach jest stosunkowo mała.
> Odrzuciłem kolumny 0, 21, 22 i 23 - liczba kombinacji
> to mniej niż 100 tysięcy. Pewnie jakby odrzucić trochę więcej,
> ta liczba spadłaby (jest już późno, nie chce mi się bawić).
>
> Więc można wpierw pogrupować rekordy wg tych kombinacji, np.
> wrzucić do hashmapy; od razu znasz wartości 20-kilku kolumn.
> Zaś pozostałe kolumny można już kompresować, albo nawet zapisać
> wprost, pewnie byś się zmieścił w kilku bajtach na rekord.
Dziękuję serdecznie.
Następne wpisy z tego wątku
- 17.10.09 14:08 Wiktor S.
- 18.10.09 17:11 Mariusz Marszałkowski
- 19.10.09 13:36 Daniel Janus
Najnowsze wątki z tej grupy
- Alg. kompresji LZW
- Popr. 14. Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- Arch. Prog. Nieuprzywilejowanych w pełnej wer. na nowej s. WWW energokod.pl
- 7. Raport Totaliztyczny: Sprawa Qt Group wer. 424
- TCL - problem z escape ostatniego \ w nawiasach {}
- Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- testy-wyd-sort - Podsumowanie
- Tworzenie Programów Nieuprzywilejowanych Opartych Na Wtyczkach
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
Najnowsze wątki
- 2025-02-19 Lista afer
- 2025-02-19 Lista afer
- 2025-02-19 Lista afer PIS
- 2025-02-19 Ogrodzenie dla krów szkockich "Highland"
- 2025-02-19 Gdańsk => System Architect (background deweloperski w Java) <=
- 2025-02-19 Gdańsk => Solution Architect (Java background) <=
- 2025-02-19 Białystok => Data Engineer (Tech Leader) <=
- 2025-02-19 Kraków => Ekspert IT (obszar systemów sieciowych) <=
- 2025-02-19 Warszawa => Architekt rozwiązań (doświadczenie w obszarze Java, AWS
- 2025-02-19 Rzeszów => International Freight Forwarder <=
- 2025-02-19 Poznań => Konsultant wdrożeniowy Comarch XL/Optima (Księgowość i
- 2025-02-19 Chrzanów => Spedytor Międzynarodowy (handel ładunkami/prowadzenie f
- 2025-02-19 Bieruń => Regionalny Kierownik Sprzedaży (OZE) <=
- 2025-02-19 Nigdy
- 2025-02-19 Katowice => Key Account Manager (ERP) <=