-
Data: 2013-05-06 17:43:40
Temat: Re: Porównywanie tekstów i DNA
Od: bartekltg <b...@g...com> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]W dniu 2013-05-05 22:56, Borneq pisze:
> Użytkownik "bartekltg" <b...@g...com> napisał w wiadomości
> news:km4545$nl$1@node1.news.atman.pl...
>> http://en.wikipedia.org/wiki/Levenshtein_distance
>> http://en.wikipedia.org/wiki/Damerau%E2%80%93Levensh
tein_distance
>> prześledz też, jakimi algorytmami nakarmiony jest "diff"
>
> Patrzyłem jak diff działa na dowolnych napisach, w odróżnieniu od
> specjalnych przekładów, nie za bardoz daje się wybrać innej ściezki
> modyfikacji, która by nie była optymalna w sensie LCS, za to miała inne
> cechy.
> Natomiast zauważyłem jeszcze coś:, wziąłem napisy wygeneorwane losowo:
> aacaacaabbab i acaacbcacccaaab
> Diff pokazało:
> aacaa caabbab
> a caacbcacccaa ab
> Tymczasem w ciagu jest aż 5 znaków takich samych w pierwszym i drugim
> napisie
> aacaac a abbab
> acaacbcacccaa ab
> Co więcej, jest to tak samo optymalne jak to co daje diff, minimalna
> liczba edycji i jest lepszym rozwiązaniem, bo spotyka się przy
> porównywaniu linii tekstów, gdzie w przypadku gdy dwie linie są takie
> same np. linie puste, pokazuje nie tą różnicę co trzeba.
> Tutaj i tak i tak mamy rozwiązanie optymalne, cz dałoby się dostroić
NIe ma nic takiego jak rozwiązanie optymalne, póki precyzyjnie
nie zdefiniujesz problemu. Ściśle nie zadasz szukanej funkcji
do optymalizacji.
Sam o tym pisałeś w pierwszym poście.
> algorytm w ten sposób, aby mając dwa kawałki wspólnego ciągu o
> długościach przykładowo 5 i 1 albo 4 i 2 wybierze pierwszą możliwość
> maksymalizując długość podciągu dłuższego kosztem krótszego?
Na pewno się da;)
pzdr
bartekltg
Najnowsze wątki z tej grupy
- Nowa ustawa o ochronie praw autorskich - opis problemu i szkic ustawy
- Alg. kompresji LZW
- Popr. 14. Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- Arch. Prog. Nieuprzywilejowanych w pełnej wer. na nowej s. WWW energokod.pl
- 7. Raport Totaliztyczny: Sprawa Qt Group wer. 424
- TCL - problem z escape ostatniego \ w nawiasach {}
- Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- testy-wyd-sort - Podsumowanie
- Tworzenie Programów Nieuprzywilejowanych Opartych Na Wtyczkach
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
Najnowsze wątki
- 2025-03-20 Re: Dlaczego tak odstają od Tesli?
- 2025-03-19 Brak ograniczeń dla chińskiego kapitału - wam nie do rządu, tylko na zmywak do chińskiej knajpy!!!
- 2025-03-19 Wietnam wykłada 500M$ i chce zbudować fabrykę za 50G$
- 2025-03-19 szal-Unia == federacja policyjna
- 2025-03-19 Polsza == państwo policyjne
- 2025-03-19 Grzegorz Płaczek o programie szczepień dzieci. ,,Stworzono eldorado dla firm farmaceutycznych"
- 2025-03-19 Wietnam wykłada 500M$ i chce zbudować fabrykę za 50G$
- 2025-03-19 Gemini
- 2025-03-19 Mokry sen Zenka :)
- 2025-03-19 Re: Dlaczego tak odstają od Tesli?
- 2025-03-19 Czy grupa p.s.prawo przetrwa najbliższe wybory (prezydenta)?
- 2025-03-19 Warszawa => Frontend Developer (obszar Angular13+) <=
- 2025-03-19 Czy "niedopuszczony pełnomocnik" jest w prawie się na to skarżyć jak "świadek" zmarła bez zostawienia mu takiej instrukcji?
- 2025-03-19 Kraków => Business Development Manager - Network and Network Security
- 2025-03-19 Ostrów Świętokrzy => Node.js / Fullstack Developer <=