eGospodarka.pl
eGospodarka.pl poleca

eGospodarka.plGrupypl.comp.programmingPorównywanie tekstów i DNARe: Porównywanie tekstów i DNA
  • Path: news-archive.icm.edu.pl!agh.edu.pl!news.agh.edu.pl!newsfeed2.atman.pl!newsfeed.
    atman.pl!.POSTED!not-for-mail
    From: "Borneq" <b...@a...hidden.pl>
    Newsgroups: pl.comp.programming
    Subject: Re: Porównywanie tekstów i DNA
    Date: Sun, 5 May 2013 22:56:36 +0200
    Organization: ATMAN - ATM S.A.
    Lines: 28
    Message-ID: <km6h26$c1c$1@node1.news.atman.pl>
    References: <km3t3c$rmm$1@node2.news.atman.pl>
    <c...@4...com>
    <km3vmp$u77$1@node2.news.atman.pl>
    <9...@4...com>
    <km44ph$3q5$1@node2.news.atman.pl> <km4545$nl$1@node1.news.atman.pl>
    NNTP-Posting-Host: 91.239.205.62
    Mime-Version: 1.0
    Content-Type: text/plain; format=flowed; charset="utf-8"; reply-type=response
    Content-Transfer-Encoding: 8bit
    X-Trace: node1.news.atman.pl 1367787398 12332 91.239.205.62 (5 May 2013 20:56:38 GMT)
    X-Complaints-To: u...@a...pl
    NNTP-Posting-Date: Sun, 5 May 2013 20:56:38 +0000 (UTC)
    X-Priority: 3
    X-MSMail-Priority: Normal
    X-Newsreader: Microsoft Outlook Express 6.00.2900.5931
    X-MimeOLE: Produced By Microsoft MimeOLE V6.00.2900.6157
    Xref: news-archive.icm.edu.pl pl.comp.programming:203147
    [ ukryj nagłówki ]

    Użytkownik "bartekltg" <b...@g...com> napisał w wiadomości
    news:km4545$nl$1@node1.news.atman.pl...
    > http://en.wikipedia.org/wiki/Levenshtein_distance
    > http://en.wikipedia.org/wiki/Damerau%E2%80%93Levensh
    tein_distance
    > prześledz też, jakimi algorytmami nakarmiony jest "diff"

    Patrzyłem jak diff działa na dowolnych napisach, w odróżnieniu od
    specjalnych przekładów, nie za bardoz daje się wybrać innej ściezki
    modyfikacji, która by nie była optymalna w sensie LCS, za to miała inne
    cechy.
    Natomiast zauważyłem jeszcze coś:, wziąłem napisy wygeneorwane losowo:
    aacaacaabbab i acaacbcacccaaab
    Diff pokazało:
    aacaa caabbab
    a caacbcacccaa ab
    Tymczasem w ciagu jest aż 5 znaków takich samych w pierwszym i drugim
    napisie
    aacaac a abbab
    acaacbcacccaa ab
    Co więcej, jest to tak samo optymalne jak to co daje diff, minimalna liczba
    edycji i jest lepszym rozwiązaniem, bo spotyka się przy porównywaniu linii
    tekstów, gdzie w przypadku gdy dwie linie są takie same np. linie puste,
    pokazuje nie tą różnicę co trzeba.
    Tutaj i tak i tak mamy rozwiązanie optymalne, cz dałoby się dostroić
    algorytm w ten sposób, aby mając dwa kawałki wspólnego ciągu o długościach
    przykładowo 5 i 1 albo 4 i 2 wybierze pierwszą możliwość maksymalizując
    długość podciągu dłuższego kosztem krótszego?

Podziel się

Poleć ten post znajomemu poleć

Wydrukuj ten post drukuj


Następne wpisy z tego wątku

Najnowsze wątki z tej grupy


Najnowsze wątki

Szukaj w grupach

Eksperci egospodarka.pl

1 1 1

Wpisz nazwę miasta, dla którego chcesz znaleźć jednostkę ZUS.

Wzory dokumentów

Bezpłatne wzory dokumentów i formularzy.
Wyszukaj i pobierz za darmo: