-
Data: 2013-05-06 17:43:40
Temat: Re: Porównywanie tekstów i DNA
Od: bartekltg <b...@g...com> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]W dniu 2013-05-05 22:56, Borneq pisze:
> Użytkownik "bartekltg" <b...@g...com> napisał w wiadomości
> news:km4545$nl$1@node1.news.atman.pl...
>> http://en.wikipedia.org/wiki/Levenshtein_distance
>> http://en.wikipedia.org/wiki/Damerau%E2%80%93Levensh
tein_distance
>> prześledz też, jakimi algorytmami nakarmiony jest "diff"
>
> Patrzyłem jak diff działa na dowolnych napisach, w odróżnieniu od
> specjalnych przekładów, nie za bardoz daje się wybrać innej ściezki
> modyfikacji, która by nie była optymalna w sensie LCS, za to miała inne
> cechy.
> Natomiast zauważyłem jeszcze coś:, wziąłem napisy wygeneorwane losowo:
> aacaacaabbab i acaacbcacccaaab
> Diff pokazało:
> aacaa caabbab
> a caacbcacccaa ab
> Tymczasem w ciagu jest aż 5 znaków takich samych w pierwszym i drugim
> napisie
> aacaac a abbab
> acaacbcacccaa ab
> Co więcej, jest to tak samo optymalne jak to co daje diff, minimalna
> liczba edycji i jest lepszym rozwiązaniem, bo spotyka się przy
> porównywaniu linii tekstów, gdzie w przypadku gdy dwie linie są takie
> same np. linie puste, pokazuje nie tą różnicę co trzeba.
> Tutaj i tak i tak mamy rozwiązanie optymalne, cz dałoby się dostroić
NIe ma nic takiego jak rozwiązanie optymalne, póki precyzyjnie
nie zdefiniujesz problemu. Ściśle nie zadasz szukanej funkcji
do optymalizacji.
Sam o tym pisałeś w pierwszym poście.
> algorytm w ten sposób, aby mając dwa kawałki wspólnego ciągu o
> długościach przykładowo 5 i 1 albo 4 i 2 wybierze pierwszą możliwość
> maksymalizując długość podciągu dłuższego kosztem krótszego?
Na pewno się da;)
pzdr
bartekltg
Najnowsze wątki z tej grupy
- Alg. kompresji LZW
- Popr. 14. Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- Arch. Prog. Nieuprzywilejowanych w pełnej wer. na nowej s. WWW energokod.pl
- 7. Raport Totaliztyczny: Sprawa Qt Group wer. 424
- TCL - problem z escape ostatniego \ w nawiasach {}
- Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- testy-wyd-sort - Podsumowanie
- Tworzenie Programów Nieuprzywilejowanych Opartych Na Wtyczkach
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
Najnowsze wątki
- 2025-02-27 Kraków => Frontend Vue Developer <=
- 2025-02-27 Re: Zwolniony z IKEA za "wąty" przeciw firmowej promocji LGBT-IQ+ przywrócony do pracy - SN odrzucił kasacje (sygn. akt I PSK 62/24)
- 2025-02-27 Częstochowa => Manager ds. produktu <=
- 2025-02-27 Warszawa => Business Systems Analyst <=
- 2025-02-27 Nagranie poglądowe
- 2025-02-26 Zasilacz USB na ścianę.
- 2025-02-26 Błonie => Specjalista ds. public relations <=
- 2025-02-26 Zielonka => Team Lead / Tribe Lead FrontEnd <=
- 2025-02-26 Warszawa => Specjalista ds. Sprzedaży (transport drogowy) <=
- 2025-02-26 Białystok => Data Engineer (Tech Leader) <=
- 2025-02-26 Kraków => Business Development Manager - Dział Sieci i Bezpieczeńst
- 2025-02-26 Kraków => Business Development Manager - Network and Network Security
- 2025-02-26 Warszawa => Młodszy Specjalista ds. wsparcia sprzedaży <=
- 2025-02-26 Białystok => Architekt rozwiązań (doświadczenie w obszarze Java, A
- 2025-02-26 Warszawa => Sales Assistant <=