eGospodarka.pl
eGospodarka.pl poleca

eGospodarka.plGrupypl.comp.programmingalgorytm stringi › Re: algorytm stringi
  • X-Received: by 10.50.158.227 with SMTP id wx3mr1220710igb.2.1357764913632; Wed, 09
    Jan 2013 12:55:13 -0800 (PST)
    X-Received: by 10.50.158.227 with SMTP id wx3mr1220710igb.2.1357764913632; Wed, 09
    Jan 2013 12:55:13 -0800 (PST)
    Path: news-archive.icm.edu.pl!news.icm.edu.pl!newsfeed.pionier.net.pl!feed.xsnews.nl!
    border-1.ams.xsnews.nl!goblin2!goblin1!goblin.stu.neva.ru!ld4no7753808pbb.0!new
    s-out.google.com!6ni95569pbd.1!nntp.google.com!f6no10200845pbd.1!postnews.googl
    e.com!glegroupsg2000goo.googlegroups.com!not-for-mail
    Newsgroups: pl.comp.programming
    Date: Wed, 9 Jan 2013 12:55:13 -0800 (PST)
    In-Reply-To: <kceu17$8cf$1@node1.news.atman.pl>
    Complaints-To: g...@g...com
    Injection-Info: glegroupsg2000goo.googlegroups.com; posting-host=89.229.34.123;
    posting-account=xjvq9QoAAAATMPC2X3btlHd_LkaJo_rj
    NNTP-Posting-Host: 89.229.34.123
    References: <kceu17$8cf$1@node1.news.atman.pl>
    User-Agent: G2/1.0
    MIME-Version: 1.0
    Message-ID: <c...@g...com>
    Subject: Re: algorytm stringi
    From: "M.M." <m...@g...com>
    Injection-Date: Wed, 09 Jan 2013 20:55:13 +0000
    Content-Type: text/plain; charset=ISO-8859-2
    Content-Transfer-Encoding: quoted-printable
    Xref: news-archive.icm.edu.pl pl.comp.programming:201605
    [ ukryj nagłówki ]

    W dniu poniedziałek, 7 stycznia 2013 17:44:25 UTC+1 użytkownik identyfikator:
    20040501 napisał:
    > zna Ktoś może jakiś cwany, to znaczy prosty algorytm wyszukiwania ciągu w
    > ciągu?
    Jakoś to się robiło taką sumę, którą można obliczać "przyrostowo", i jak
    suma dla wzorca i podciągu była taka sama, to dopiero wtedy porównywało się
    znak po znaku - szczegółów nie pamiętam w tej chwili. Im "lepiej" policzymy
    sumę, tym mniej porównań znak po znaku. To po pierwsze.

    Po drugie, być może potrzebujesz wiele razy wyszukiwać różny wzorzec w
    tym samym tekście - wtedy warto zastanowić się nad jakimś zahashowaniem
    par (suma,pozycja w tekscie).

    Po trzecie, być może tekst w którym wyszukujesz, czasami się zmienia - wtedy
    warto pomyśleć o jakimś zahashowaniu które da się modyfikować.

    Gdy tekst nie mieści się cały w RAM i jest na dysku - to następna wariacja
    na temat. Gdy tekst jest na wielu dyskach w rozproszonym środowisku
    komputerów - następna wariacja. Gdy tekst jest na taśmie a nie na dysku
    z ruchomą głowicą - jeszcze inna wariacja. Gdy tekst jest w bazie danych, a
    baza danych udostępnia gotowe narzędzia - jeszcze inna sprawa.

    Kiedyś pisałem programik do gry w odmianę scrabli, tam z kolei było wiele
    wzorców (powiedzmy że średnio 100 wzorców) i wiele tekstów do przeszukania -
    te teksty to pojedyncze słowa z języka polskiego. Czyli dochodzimy do ciągu
    ze znakiem uniwersalnym (który pasuje do dowolnego znaku) i przeszukiwania
    milionów króciutkich tekstów...

    A niby to tylko wyszukiwanie tekstu w tekście....

    Pozdrawiam




Podziel się

Poleć ten post znajomemu poleć

Wydrukuj ten post drukuj


Następne wpisy z tego wątku

Najnowsze wątki z tej grupy


Najnowsze wątki

Szukaj w grupach

Eksperci egospodarka.pl

1 1 1

Wpisz nazwę miasta, dla którego chcesz znaleźć jednostkę ZUS.

Wzory dokumentów

Bezpłatne wzory dokumentów i formularzy.
Wyszukaj i pobierz za darmo: