-
Data: 2010-08-12 17:33:59
Temat: Re: Wykrywanie sensu (:)
Od: "slawek" <s...@h...pl> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]
Użytkownik "MoonWolf" <m...@p...com> napisał w wiadomości grup
dyskusyjnych:i40dt9$ski$...@n...onet.pl...
> Zastanawiam się czy istnieje sposób na wykrycie 'sensu' w ciągu znaków.
> Chodzi o sprawdzenie czy jest to przypadkowy ciąg, czy też zdanie w
> języku polskim. Da się coś takiego zrobić?
Podpowiem ci coś wprost odwrotnego - da się zrobić generator "bezsensu" -
ale taki, że będziesz potrzebował pewnego wysiłku, aby się połapać.
Czyli innymi słowy - da się "zawiesić" "oprogramowanie" mózgu na tyle
skutecznie, że - podobnie jak przy innych złudzeniach - jest to aż nie do
wiary.
Algorytm jest prosty, wymaga np. książki (jakiegoś długiego tekstu w danym
języku). Wybierasz losowe miejsce w książce i patrzysz, jaka jest w tym
miejscu litera zaczynająca wyraz. Następnie wybierasz inne losowe miejsce w
książce i szukasz litery takiej, że przed nią jest poprzednio znaleziona
litera. Potem jeszcze raz - ale szukasz bigramu (tj. dwóch liter, takich jak
pierwsza i druga). Odstęp też traktujesz jak literę. Odstęp resetuje - po
nim, gdy wypiszesz już ciąg znaków będący "słowem" (w istocie jest to
przypadkowy zlepek liter) - restartujesz.
Oczywiste jest, że tekst jest zupełnie przypadkowy. Jednak bez trudu można
np. odróżnić tak wygenerowany tekst "niemiecki" od "polskiego". Cały dowcip
w tym, że taka generacja tekstu zachowuje statystyczne jego właściwości.
Pojawiają się zlepki liter charakterystyczne dla danego języka.
slawek
Następne wpisy z tego wątku
- 12.08.10 17:42 slawek
- 12.08.10 18:33 Marcin Kral
- 12.08.10 19:30 Mariusz Marszałkowski
- 12.08.10 20:11 Piotr M Kuć
- 12.08.10 21:13 Maciej Sobczak
- 12.08.10 21:32 Segmentation Fault
- 12.08.10 21:37 Segmentation Fault
- 12.08.10 23:11 Daniel Janus
- 13.08.10 06:53 slawek
- 13.08.10 07:17 Mariusz Kruk
- 13.08.10 08:46 Adam Przybyla
- 20.08.10 15:19 Sebastian Kaliszewski
- 20.08.10 16:55 Waldek M.
Najnowsze wątki z tej grupy
- Alg. kompresji LZW
- Popr. 14. Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- Arch. Prog. Nieuprzywilejowanych w pełnej wer. na nowej s. WWW energokod.pl
- 7. Raport Totaliztyczny: Sprawa Qt Group wer. 424
- TCL - problem z escape ostatniego \ w nawiasach {}
- Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- testy-wyd-sort - Podsumowanie
- Tworzenie Programów Nieuprzywilejowanych Opartych Na Wtyczkach
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
Najnowsze wątki
- 2025-03-05 Środa Wielkopolska => Konsultant wewnętrzny SAP FI/CO <=
- 2025-03-05 Zielona Góra => Senior Field Sales (system ERP) <=
- 2025-03-05 Warszawa => Data Engineer (Tech Lead) <=
- 2025-03-05 Kraków => Business Development Manager - Network and Network Security
- 2025-03-05 Zaniepokojeni mieszkańcy
- 2025-03-05 Ile pieniędzy ma bank?
- 2025-03-05 Ostrów Świętokrzy => Node.js / Fullstack Developer <=
- 2025-03-05 Białystok => Architekt rozwiązań (doświadczenie w obszarze Java, A
- 2025-03-05 Warszawa => Frontend Developer (Angular13+) <=
- 2025-03-05 Warszawa => Frontend Developer (obszar Angular13+) <=
- 2025-03-05 Chiny-Kraków => Backend Developer (Node + Java) <=
- 2025-03-05 Warszawa => JavaScript / Node / Fullstack Developer <=
- 2025-03-05 China-Kraków => Key Account Manager IT <=
- 2025-03-05 China-Kraków => Senior PHP Symfony Developer <=
- 2025-03-05 Gdańsk => Specjalista ds. Sprzedaży <=