eGospodarka.pl
eGospodarka.pl poleca

eGospodarka.plGrupypl.comp.programmingzadanieRe: zadanie
  • Path: news-archive.icm.edu.pl!news.gazeta.pl!not-for-mail
    From: " " <f...@g...SKASUJ-TO.pl>
    Newsgroups: pl.comp.programming
    Subject: Re: zadanie
    Date: Sun, 12 Feb 2012 09:56:21 +0000 (UTC)
    Organization: "Portal Gazeta.pl -> http://www.gazeta.pl"
    Lines: 80
    Message-ID: <jh82c5$qq8$1@inews.gazeta.pl>
    References: <jh6dp3$km6$1@inews.gazeta.pl> <jh7t8u$uh3$1@julia.coi.pw.edu.pl>
    <12519929.1528.1329036423922.JavaMail.geo-discussion-forums@vbcl10>
    <o...@a...home>
    NNTP-Posting-Host: localhost
    Content-Type: text/plain; charset=ISO-8859-2
    Content-Transfer-Encoding: 8bit
    X-Trace: inews.gazeta.pl 1329040581 27464 172.20.26.238 (12 Feb 2012 09:56:21 GMT)
    X-Complaints-To: u...@a...pl
    NNTP-Posting-Date: Sun, 12 Feb 2012 09:56:21 +0000 (UTC)
    X-User: fir
    X-Forwarded-For: 31.61.128.250
    X-Remote-IP: localhost
    Xref: news-archive.icm.edu.pl pl.comp.programming:195259
    [ ukryj nagłówki ]

    Jordan Szubert <u...@j...us.to> napisał(a):

    > Dnia 12-02-2012 o 09:47:03 Adam Klobukowski <a...@g...com> =
    > =
    >
    > napisa=B3(a):
    >
    > > Przy por=F3wnywaniu plik=F3w najlepiej dla ka=BFdego pliku wliczy=E6 h=
    > ash i u=BFy=E6 =
    >
    > > tabeli hashuj=B1cej. To jest najszybsza metoda. Jak si=EA trafi=B1 2 =
    >
    > > identyczne hashe - dla pewno=B6ci por=F3wna=E6 ca=B3y plik.
    >
    > dla sha1 chyba jeszcze nikt nie znalaz=B3 kolizji, wi=EAc mo=BFna by by=B3=
    > o to =
    >
    > pewnie sobie darowa=E6, dla du=BFej ilo=B6ci duplikat=F3w mog=B3oby to i=
    > stotnie =
    >
    > przyspieszy=E6, a je=B6li nie, to koniecznie wypisywa=E6 informacje o =
    >
    > znalezionej kolizji: s=B3awa i bogactwo czekaj=B1 ;)
    >
    > md5 jest s=B3abszy, ale je=B6li dane nie b=EAd=B1 dobierane z=B3o=B6liwi=
    > e, to te=BF =
    >
    > powinien si=EA nada=E6 nawet bez weryfikacji, a jest AFAIK nieco szybszy=
    >
    >

    zdaje mi sie ze nie nalezy tu hashowac (nie znam sie zreszta na
    hashowaniu)

    kwestia jest tu inna: co sie wiaze z jakimi kosztami, (moje
    osobiste dzialania z plikami nigdy poki co nie wykroczyly
    poza zapisz wczytaj plik), np o ile mozna odpytac system
    o liste plikow w katalogu (vel drzewku) w 'lity' szybki
    sposob bez czytania zawartosci samych plikow to mozna
    odrzucic wiekszosc (> 99%) kombinacji po samych rozmiarach -
    dopiero w ramach pozostalych grup mozna sprawdzac i raczej
    tez szybciej bedzie porownywac po poczatkach plikow (tez
    wiekszosc odpadnie na pierwszych bajtach a te co zostana
    bede juz prawie napewno duplikatami - te trzebby wtedy
    sprawdzic do konca)

    ale jest szereg kwestii czy jest tak jak ja to widze i czy

    1) wczytywanie info o plikach z folderu (vel o calym drzewku
    z podkatalogami) jest pod winda szybkie (widzac jak czasem muli
    mi total komander wydaje mi sie ze cos tu jet nie tak)

    2) czy przy robocie tego rodzaju (na zawartosciach folderow)
    trzeba sie trzymac jakichs specjalnych zasad (typu nie otwierac
    wielu plikow na raz itd)

    3) czy jesli juz mialbym porownywac same poczatki to ile bajtow
    poczatku najlepiej wziac do porownania

    4) itd

    chodzi o to ze sa na pewno jakies zasady ktore odrozniaja
    dobry i szybki sposob zrobienia tego od sposobu ktory by
    mulil w stosunku do pierwszego














    --
    Wysłano z serwisu Usenet w portalu Gazeta.pl -> http://www.gazeta.pl/usenet/

Podziel się

Poleć ten post znajomemu poleć

Wydrukuj ten post drukuj


Następne wpisy z tego wątku

Najnowsze wątki z tej grupy


Najnowsze wątki

Szukaj w grupach

Eksperci egospodarka.pl

1 1 1

Wpisz nazwę miasta, dla którego chcesz znaleźć jednostkę ZUS.

Wzory dokumentów

Bezpłatne wzory dokumentów i formularzy.
Wyszukaj i pobierz za darmo: