-
Data: 2009-10-04 19:59:34
Temat: Re: sortowanie
Od: Mateusz Loskot <s...@s...net> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]Mariusz Marszałkowski wrote:
> Hey
>
> Muszę napisać (albo skądś dorwać gotową) bardzo wydajną implementację
> sortowania. Sortowana będzie wielokrotnie tablica o rozmiarze około
> 2-10mln elementów. Jeden element będzie miał rozmiar około 12-20
> bajtów. Elementy będą miały przypisane wartości z mało licznego
> zbioru, np wartości całkowite z zakresu od 1 do 50.
>
> Pierwsza kwestia od jakiego rozmiaru elementu opłaca się użyć tablicy
> wskaźników. Jeśli element jest duży to opłaca się użyć wskaźników
> zamiast kopiowania, pytanie czy 12-20 bajtów to już duży element?
Nic nie piszesz o tym, czy zależy Ci na szybkości, czy na oszczędności
pamięci.
Może widok się nada. Polecam artykuł Macieja Sobczaka:
http://www.ddj.com/showArticle.jhtml?articleID=18440
1789
oraz View Template Library.
Rozwiązanie koncepcyjnie podobne do wskaźników, ale zamiast wskaźników,
możesz sortować indeksy (zakładając, że istnieją) z kolekcji macierzystej.
Najgorszy przypadek to będzie sortowanie kolekcji ~0.5 GB danych.
Do tego widok sortujący to dodatkowe ok 10% z w/w pamięci.
Wszystkie indeksy są o tym samym rozmiarze, czyli np. 10 mln * 4 bajty.
> Druga sprawa to wybór algorytmu. Na pewno qsort odpada dla małej
> ilości wartości. Chyba jakieś sortowanie kubełkowe?
Albo to:
http://en.wikipedia.org/wiki/Polyphase_merge_sort
Jak pamięci brak, to istnieje też STXXL (http://stxxl.sourceforge.net/)
implementujące 2 lub 3 tzw. algorytmy external sorting.
Jak pamięci jest dość, a ma być szybko, to być może jest sens aby to
zrównoleglić (choć czytałem jakąś analizę znanych algorytmów z
sekwencyjnych implementacji ale wykonanych z użyciem OpenMP i wyniki nie
były jednoznacznie "za MP", AFAIR).
Pozdrawiam
--
Mateusz Loskot, http://mateusz.loskot.net
Charter Member of OSGeo, http://osgeo.org
Następne wpisy z tego wątku
- 04.10.09 23:18 Mariusz Marszałkowski
- 05.10.09 05:40 Maciej Pilichowski
- 05.10.09 15:54 luckboy
- 05.10.09 15:58 Mariusz Marszałkowski
- 05.10.09 18:34 luckboy
- 05.10.09 19:39 Mariusz Marszałkowski
- 05.10.09 22:51 Wiktor S.
- 16.11.09 23:12 Bastion
Najnowsze wątki z tej grupy
- Alg. kompresji LZW
- Popr. 14. Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- Arch. Prog. Nieuprzywilejowanych w pełnej wer. na nowej s. WWW energokod.pl
- 7. Raport Totaliztyczny: Sprawa Qt Group wer. 424
- TCL - problem z escape ostatniego \ w nawiasach {}
- Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- testy-wyd-sort - Podsumowanie
- Tworzenie Programów Nieuprzywilejowanych Opartych Na Wtyczkach
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
Najnowsze wątki
- 2025-03-14 Spalił się autobus :-)
- 2025-03-14 Policjanci z Piątku
- 2025-03-14 Lublin => JavaScript / Node / Fullstack Developer <=
- 2025-03-14 Warszawa => Account Manager - Sprzedaż Usług Rekrutacyjnych <=
- 2025-03-14 Gliwice => Business Development Manager - Dział Sieci i Bezpieczeńst
- 2025-03-14 VAT-R Umowa najmu na adres zamieszkania
- 2025-03-14 Gliwice => IT Expert (Network Systems area) <=
- 2025-03-14 Warszawa => Junior Rekruter <=
- 2025-03-14 Wrocław => Konsultant wdrożeniowy Comarch XL/Optima (Księgowość i
- 2025-03-14 China-Kraków => Senior PHP Symfony Developer <=
- 2025-03-14 Żerniki => Dyspozytor Międzynarodowy <=
- 2025-03-13 Raspberry Pi 3 Model B+
- 2025-03-13 Kuchenka elektryczna
- 2025-03-12 test
- 2025-03-13 własny ekran startowy