eGospodarka.pl
eGospodarka.pl poleca

eGospodarka.plGrupypl.comp.programmingPotyczkiRe: Potyczki
  • Path: news-archive.icm.edu.pl!agh.edu.pl!news.agh.edu.pl!newsfeed2.atman.pl!newsfeed.
    atman.pl!.POSTED!not-for-mail
    From: bartekltg <b...@g...com>
    Newsgroups: pl.comp.programming
    Subject: Re: Potyczki
    Date: Sat, 24 Nov 2012 12:53:01 +0100
    Organization: ATMAN - ATM S.A.
    Lines: 40
    Message-ID: <k8qceu$29l$1@node2.news.atman.pl>
    References: <k8frhm$5pg$1@node1.news.atman.pl>
    <50abbc9e$0$1214$65785112@news.neostrada.pl>
    <k8p9ei$h43$1@mx1.internetia.pl> <k8qbgp$ls0$1@node1.news.atman.pl>
    NNTP-Posting-Host: 144-mi3-6.acn.waw.pl
    Mime-Version: 1.0
    Content-Type: text/plain; charset=UTF-8; format=flowed
    Content-Transfer-Encoding: 8bit
    X-Trace: node2.news.atman.pl 1353757982 2357 85.222.69.144 (24 Nov 2012 11:53:02 GMT)
    X-Complaints-To: u...@a...pl
    NNTP-Posting-Date: Sat, 24 Nov 2012 11:53:02 +0000 (UTC)
    User-Agent: Mozilla/5.0 (Windows NT 6.1; WOW64; rv:16.0) Gecko/20121026
    Thunderbird/16.0.2
    In-Reply-To: <k8qbgp$ls0$1@node1.news.atman.pl>
    Xref: news-archive.icm.edu.pl pl.comp.programming:201167
    [ ukryj nagłówki ]

    W dniu 2012-11-24 12:36, bartekltg pisze:

    >
    > Mając dodatkową pamięć dysku równo pierwotnej tablicy
    > (a tak naprawdę 0.5) możemy posortować tablicę
    > w 4 przebiegach _sekwencyjnego_ odczytu/zapisu.
    >
    > Dominantę w posortowanej tablicy znajdujemy już
    > liniowo i szybko.
    >
    > Jak sortujemy: pobieramy paczki po 512MB (albo mnijsze,
    > jeśli nasze 512MB jest sztywne i nie możemy dodać tym
    > czegoś lon(n)), sortujemy w RAM czymkolwiek sprawnym.
    >
    > Mamy 8 posortowanych fragmentów pliku. Łączymy je mergesortem.
    > w 4, w 2, i w końcu w posortowany.
    >
    > Co istotne, merga robimy nie bezpośrednio na dysku, ale na
    > buforach w ramie. Pobieramy odcinki po jakies 100MB,
    > kręcimy procedurą w mergesort, jak któryś bufor się wyczerpie,
    > napełniamy go ponownie kolejnymi danymi z dysku.
    >
    > Dzięki temu czytamy sekwencyjnie, dysk nie lata ciągle np między
    > początkiem a środkiem pliku.
    >
    > Niestety, nadal n log (n) i n*log(n/|RAM|) operacji (Sekwencyjnych)
    > na dysku, ale równoważnych przesłaniu tych kilkudziesięciu GB
    > - robialne.

    Optymalizacja: znajdowanie dominanty można upchnąć w ostatnią
    fazę mergesorta. Odpada jeden odczyt.
    Jeśli posortowana tablica nie jest nam do szczęścia potrzebna,
    możemy też jej nie zapisywać.
    Czyli 4 odczyty i 3 zapisy (4 zapisy, jeśli chcemy zachować
    posortowaną tablicę na potem)
    oba +1 jeśli użyjemy kawałków po 256MB.

    pzdr
    bartek

Podziel się

Poleć ten post znajomemu poleć

Wydrukuj ten post drukuj


Następne wpisy z tego wątku

Najnowsze wątki z tej grupy


Najnowsze wątki

Szukaj w grupach

Eksperci egospodarka.pl

1 1 1

Wpisz nazwę miasta, dla którego chcesz znaleźć jednostkę ZUS.

Wzory dokumentów

Bezpłatne wzory dokumentów i formularzy.
Wyszukaj i pobierz za darmo: