-
Data: 2013-05-05 22:56:36
Temat: Re: Porównywanie tekstów i DNA
Od: "Borneq" <b...@a...hidden.pl> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]Użytkownik "bartekltg" <b...@g...com> napisał w wiadomości
news:km4545$nl$1@node1.news.atman.pl...
> http://en.wikipedia.org/wiki/Levenshtein_distance
> http://en.wikipedia.org/wiki/Damerau%E2%80%93Levensh
tein_distance
> prześledz też, jakimi algorytmami nakarmiony jest "diff"
Patrzyłem jak diff działa na dowolnych napisach, w odróżnieniu od
specjalnych przekładów, nie za bardoz daje się wybrać innej ściezki
modyfikacji, która by nie była optymalna w sensie LCS, za to miała inne
cechy.
Natomiast zauważyłem jeszcze coś:, wziąłem napisy wygeneorwane losowo:
aacaacaabbab i acaacbcacccaaab
Diff pokazało:
aacaa caabbab
a caacbcacccaa ab
Tymczasem w ciagu jest aż 5 znaków takich samych w pierwszym i drugim
napisie
aacaac a abbab
acaacbcacccaa ab
Co więcej, jest to tak samo optymalne jak to co daje diff, minimalna liczba
edycji i jest lepszym rozwiązaniem, bo spotyka się przy porównywaniu linii
tekstów, gdzie w przypadku gdy dwie linie są takie same np. linie puste,
pokazuje nie tą różnicę co trzeba.
Tutaj i tak i tak mamy rozwiązanie optymalne, cz dałoby się dostroić
algorytm w ten sposób, aby mając dwa kawałki wspólnego ciągu o długościach
przykładowo 5 i 1 albo 4 i 2 wybierze pierwszą możliwość maksymalizując
długość podciągu dłuższego kosztem krótszego?
Następne wpisy z tego wątku
- 06.05.13 17:43 bartekltg
Najnowsze wątki z tej grupy
- Nowa ustawa o ochronie praw autorskich - opis problemu i szkic ustawy
- Alg. kompresji LZW
- Popr. 14. Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- Arch. Prog. Nieuprzywilejowanych w pełnej wer. na nowej s. WWW energokod.pl
- 7. Raport Totaliztyczny: Sprawa Qt Group wer. 424
- TCL - problem z escape ostatniego \ w nawiasach {}
- Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- testy-wyd-sort - Podsumowanie
- Tworzenie Programów Nieuprzywilejowanych Opartych Na Wtyczkach
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
Najnowsze wątki
- 2025-03-20 Re: Dlaczego tak odstają od Tesli?
- 2025-03-19 Brak ograniczeń dla chińskiego kapitału - wam nie do rządu, tylko na zmywak do chińskiej knajpy!!!
- 2025-03-19 Wietnam wykłada 500M$ i chce zbudować fabrykę za 50G$
- 2025-03-19 szal-Unia == federacja policyjna
- 2025-03-19 Polsza == państwo policyjne
- 2025-03-19 Grzegorz Płaczek o programie szczepień dzieci. ,,Stworzono eldorado dla firm farmaceutycznych"
- 2025-03-19 Wietnam wykłada 500M$ i chce zbudować fabrykę za 50G$
- 2025-03-19 Gemini
- 2025-03-19 Mokry sen Zenka :)
- 2025-03-19 Re: Dlaczego tak odstają od Tesli?
- 2025-03-19 Czy grupa p.s.prawo przetrwa najbliższe wybory (prezydenta)?
- 2025-03-19 Warszawa => Frontend Developer (obszar Angular13+) <=
- 2025-03-19 Czy "niedopuszczony pełnomocnik" jest w prawie się na to skarżyć jak "świadek" zmarła bez zostawienia mu takiej instrukcji?
- 2025-03-19 Kraków => Business Development Manager - Network and Network Security
- 2025-03-19 Ostrów Świętokrzy => Node.js / Fullstack Developer <=