-
Data: 2009-10-18 00:55:43
Temat: Re: kompresja danych
Od: Wojciech Muła <w...@p...null.onet.pl.invalid> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]Mariusz Marszałkowski <m...@g...com> wrote:
> Pewnie najlepiej wypadnie najpierw długość serii + zamiana
> wartości na pozycję + jakaś metda LZ. Długość serii dekompresuje
> się błyskawicznie, zamiana wartości na pozycję trochę gorzej,
> LZ też jest bardzo szybkie.
>
> Więc pozostaje pytanie jaką metodą zmienić kolejność rekordów,
> aby jakoś kompresji była jak najlepsza.
Przeanalizowałem pierwszy milion rekordów i moje wnioski
są następujące. Po odrzuceniu niektórych kolumn, liczba
różnych kombinacji wartości w rekordach jest stosunkowo mała.
Odrzuciłem kolumny 0, 21, 22 i 23 - liczba kombinacji
to mniej niż 100 tysięcy. Pewnie jakby odrzucić trochę więcej,
ta liczba spadłaby (jest już późno, nie chce mi się bawić).
Więc można wpierw pogrupować rekordy wg tych kombinacji, np.
wrzucić do hashmapy; od razu znasz wartości 20-kilku kolumn.
Zaś pozostałe kolumny można już kompresować, albo nawet zapisać
wprost, pewnie byś się zmieścił w kilku bajtach na rekord.
dobranoc
w.
Następne wpisy z tego wątku
- 18.10.09 07:37 Mariusz Marszałkowski
- 17.10.09 14:08 Wiktor S.
- 18.10.09 17:11 Mariusz Marszałkowski
- 19.10.09 13:36 Daniel Janus
Najnowsze wątki z tej grupy
- Alg. kompresji LZW
- Popr. 14. Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- Arch. Prog. Nieuprzywilejowanych w pełnej wer. na nowej s. WWW energokod.pl
- 7. Raport Totaliztyczny: Sprawa Qt Group wer. 424
- TCL - problem z escape ostatniego \ w nawiasach {}
- Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- testy-wyd-sort - Podsumowanie
- Tworzenie Programów Nieuprzywilejowanych Opartych Na Wtyczkach
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
Najnowsze wątki
- 2025-02-17 Białystok => System Architect (Java background) <=
- 2025-02-17 Białystok => Solution Architect (Java background) <=
- 2025-02-17 Gliwice => Team Lead / Tribe Lead FrontEnd <=
- 2025-02-17 Gdańsk => PHP Developer <=
- 2025-02-17 Warszawa => Senior ASP.NET Developer <=
- 2025-02-17 Gliwice => Business Development Manager - Network and Network Security
- 2025-02-17 Mińsk Mazowiecki => Area Sales Manager OZE <=
- 2025-02-17 Odśnieżanie samochodu
- 2025-02-17 Katowice => Regionalny Kierownik Sprzedaży (OZE) <=
- 2025-02-17 Dęblin => JavaScript / Node / Fullstack Developer <=
- 2025-02-17 Pompiarze...
- 2025-02-16 PV teraz
- 2025-02-16 Czy chodzenie jest ekologiczne?
- 2025-02-15 skurwiałe miasto
- 2025-02-16 Puszka lub gniazdo trójfazowe na balkonie