eGospodarka.pl
eGospodarka.pl poleca

eGospodarka.plGrupypl.comp.programmingPorównywanie tekstów i DNARe: Porównywanie tekstów i DNA
  • Path: news-archive.icm.edu.pl!agh.edu.pl!news.agh.edu.pl!newsfeed2.atman.pl!newsfeed.
    atman.pl!.POSTED!not-for-mail
    From: bartekltg <b...@g...com>
    Newsgroups: pl.comp.programming
    Subject: Re: Porównywanie tekstów i DNA
    Date: Mon, 06 May 2013 17:43:40 +0200
    Organization: ATMAN - ATM S.A.
    Lines: 42
    Message-ID: <km8j3c$eed$1@node1.news.atman.pl>
    References: <km3t3c$rmm$1@node2.news.atman.pl>
    <c...@4...com>
    <km3vmp$u77$1@node2.news.atman.pl>
    <9...@4...com>
    <km44ph$3q5$1@node2.news.atman.pl> <km4545$nl$1@node1.news.atman.pl>
    <km6h26$c1c$1@node1.news.atman.pl>
    NNTP-Posting-Host: 89-73-65-59.dynamic.chello.pl
    Mime-Version: 1.0
    Content-Type: text/plain; charset=UTF-8; format=flowed
    Content-Transfer-Encoding: 8bit
    X-Trace: node1.news.atman.pl 1367855020 14797 89.73.65.59 (6 May 2013 15:43:40 GMT)
    X-Complaints-To: u...@a...pl
    NNTP-Posting-Date: Mon, 6 May 2013 15:43:40 +0000 (UTC)
    User-Agent: Mozilla/5.0 (Windows NT 6.1; WOW64; rv:17.0) Gecko/20130328
    Thunderbird/17.0.5
    In-Reply-To: <km6h26$c1c$1@node1.news.atman.pl>
    Xref: news-archive.icm.edu.pl pl.comp.programming:203163
    [ ukryj nagłówki ]

    W dniu 2013-05-05 22:56, Borneq pisze:
    > Użytkownik "bartekltg" <b...@g...com> napisał w wiadomości
    > news:km4545$nl$1@node1.news.atman.pl...
    >> http://en.wikipedia.org/wiki/Levenshtein_distance
    >> http://en.wikipedia.org/wiki/Damerau%E2%80%93Levensh
    tein_distance
    >> prześledz też, jakimi algorytmami nakarmiony jest "diff"
    >
    > Patrzyłem jak diff działa na dowolnych napisach, w odróżnieniu od
    > specjalnych przekładów, nie za bardoz daje się wybrać innej ściezki
    > modyfikacji, która by nie była optymalna w sensie LCS, za to miała inne
    > cechy.
    > Natomiast zauważyłem jeszcze coś:, wziąłem napisy wygeneorwane losowo:
    > aacaacaabbab i acaacbcacccaaab
    > Diff pokazało:
    > aacaa caabbab
    > a caacbcacccaa ab
    > Tymczasem w ciagu jest aż 5 znaków takich samych w pierwszym i drugim
    > napisie
    > aacaac a abbab
    > acaacbcacccaa ab
    > Co więcej, jest to tak samo optymalne jak to co daje diff, minimalna
    > liczba edycji i jest lepszym rozwiązaniem, bo spotyka się przy
    > porównywaniu linii tekstów, gdzie w przypadku gdy dwie linie są takie
    > same np. linie puste, pokazuje nie tą różnicę co trzeba.
    > Tutaj i tak i tak mamy rozwiązanie optymalne, cz dałoby się dostroić

    NIe ma nic takiego jak rozwiązanie optymalne, póki precyzyjnie
    nie zdefiniujesz problemu. Ściśle nie zadasz szukanej funkcji
    do optymalizacji.

    Sam o tym pisałeś w pierwszym poście.

    > algorytm w ten sposób, aby mając dwa kawałki wspólnego ciągu o
    > długościach przykładowo 5 i 1 albo 4 i 2 wybierze pierwszą możliwość
    > maksymalizując długość podciągu dłuższego kosztem krótszego?

    Na pewno się da;)

    pzdr
    bartekltg


Podziel się

Poleć ten post znajomemu poleć

Wydrukuj ten post drukuj

Najnowsze wątki z tej grupy


Najnowsze wątki

Szukaj w grupach

Eksperci egospodarka.pl

1 1 1

Wpisz nazwę miasta, dla którego chcesz znaleźć jednostkę ZUS.

Wzory dokumentów

Bezpłatne wzory dokumentów i formularzy.
Wyszukaj i pobierz za darmo: