eGospodarka.pl
eGospodarka.pl poleca

eGospodarka.plGrupypl.rec.foto.cyfrowawyszukiwarka duplikatów jpg › Re: wyszukiwarka duplikatów jpg
  • Path: news-archive.icm.edu.pl!news.gazeta.pl!newsfeed.pionier.net.pl!news.dialog.net.
    pl!not-for-mail
    From: nb <n...@n...net>
    Newsgroups: pl.rec.foto.cyfrowa
    Subject: Re: wyszukiwarka duplikatów jpg
    Date: Sat, 13 Mar 2010 01:24:50 +0100
    Organization: Dialog Net
    Lines: 53
    Message-ID: <hnem0h$sud$1@news.dialog.net.pl>
    References: <131ddhlxu2to$.1peuy2chhff0d.dlg@40tude.net>
    <hnbcpf$bpu$1@mx1.internetia.pl> <hnbon0$gul$1@nemesis.news.neostrada.pl>
    Reply-To: n...@n...net
    NNTP-Posting-Host: dynamic-62-87-247-180.ssp.dialog.net.pl
    Mime-Version: 1.0
    Content-Type: text/plain; charset=utf-8
    Content-Transfer-Encoding: 8Bit
    X-Trace: news.dialog.net.pl 1268439889 29645 62.87.247.180 (13 Mar 2010 00:24:49 GMT)
    X-Complaints-To: a...@d...net.pl
    NNTP-Posting-Date: Sat, 13 Mar 2010 00:24:49 +0000 (UTC)
    Xref: news-archive.icm.edu.pl pl.rec.foto.cyfrowa:851218
    [ ukryj nagłówki ]

    at Thu 11 of Mar 2010 22:40, Cezary Grądys wrote:

    > Kris pisze:
    >
    >> tylko i wylacznie
    >> DoubleKiller
    >> szukasz wg wlasnych kryteriow
    >> jak i sum crc32
    >>
    >
    > Jak to według sum crc32? Czyli cały plik czytany, żeby stwierdzić
    > różnicę, która może na 10 bajcie już jest?

    Zawartość plików jest porównywana tylko wtedy, kiedy ich wielkość
    jest jednakowa. Wówczas prawdopodobieństwo że ich zawartość jest
    identyczna (a więc konieczność porównywania całych plików bajt
    po bajcie) radykalnie rośnie. W mojej praktyce 99% czasu
    działania fdupes to strata na jednakowych plikach.

    I przykład jak to może wyglądać w praktyce:


    ~ls -l # mamy dwa bardzo duże pliki
    -r--r--r-- 1 root wheel 1466035052 13 Mar 00:37 K2.avi
    -r--r--r-- 1 root wheel 1466035052 22 Oct 2007 Kolja-DVD.avi

    #time crc32 K* # szybkośc obliczenia crc
    bb2b61ee K2.avi
    bb2b61ee Kolja-DVD.avi
    real 0m42.831s
    user 0m7.646s
    sys 0m7.237s

    #time fdupes . # szybkość działania fdupes
    ./Kolja-DVD.avi
    ./K2.avi
    real 5m33.525s
    user 4m36.092s
    sys 0m14.206s

    Widać, że patent z crc jest około 8 razy szybszy.
    Nawet md5 (wykluczający przypadkową zbieżność crc)
    będzie pięć razy szybszy.


    > Było by to dobre jakby było większość plików jednakowych i chcieli
    > byśmy wśród nich jeden inny (lub kilka) znaleźć.

    A jakiś przykład podobny do mojego?


    --
    nb

Podziel się

Poleć ten post znajomemu poleć

Wydrukuj ten post drukuj


Następne wpisy z tego wątku

Najnowsze wątki z tej grupy


Najnowsze wątki

Szukaj w grupach

Eksperci egospodarka.pl

1 1 1

Wpisz nazwę miasta, dla którego chcesz znaleźć jednostkę ZUS.

Wzory dokumentów

Bezpłatne wzory dokumentów i formularzy.
Wyszukaj i pobierz za darmo: