eGospodarka.pl
eGospodarka.pl poleca

eGospodarka.plGrupypl.comp.programmingAlgorytm szukania podobny do Google › Re: Algorytm szukania podobny do Google
  • X-Received: by 10.157.5.212 with SMTP id 78mr104207otd.8.1465306610733; Tue, 07 Jun
    2016 06:36:50 -0700 (PDT)
    X-Received: by 10.157.5.212 with SMTP id 78mr104207otd.8.1465306610733; Tue, 07 Jun
    2016 06:36:50 -0700 (PDT)
    Path: news-archive.icm.edu.pl!news.icm.edu.pl!news.nask.pl!news.nask.org.pl!news.unit
    0.net!usenet.blueworldhosting.com!feeder01.blueworldhosting.com!peer01.iad.high
    winds-media.com!news.highwinds-media.com!feed-me.highwinds-media.com!q32no47799
    41qgq.0!news-out.google.com!z5ni85qge.0!nntp.google.com!p34no3760185qgp.1!postn
    ews.google.com!glegroupsg2000goo.googlegroups.com!not-for-mail
    Newsgroups: pl.comp.programming
    Date: Tue, 7 Jun 2016 06:36:50 -0700 (PDT)
    In-Reply-To: <nj6f0k$26n$1@node2.news.atman.pl>
    Complaints-To: g...@g...com
    Injection-Info: glegroupsg2000goo.googlegroups.com; posting-host=178.37.232.66;
    posting-account=xjvq9QoAAAATMPC2X3btlHd_LkaJo_rj
    NNTP-Posting-Host: 178.37.232.66
    References: <nj6f0k$26n$1@node2.news.atman.pl>
    User-Agent: G2/1.0
    MIME-Version: 1.0
    Message-ID: <c...@g...com>
    Subject: Re: Algorytm szukania podobny do Google
    From: "M.M." <m...@g...com>
    Injection-Date: Tue, 07 Jun 2016 13:36:50 +0000
    Content-Type: text/plain; charset=UTF-8
    Content-Transfer-Encoding: quoted-printable
    X-Received-Bytes: 2527
    X-Received-Body-CRC: 1512296936
    Xref: news-archive.icm.edu.pl pl.comp.programming:209450
    [ ukryj nagłówki ]

    On Tuesday, June 7, 2016 at 2:34:29 PM UTC+2, Borneq wrote:
    > Mam wiele dokumentów i mam sprawdzić czy dany tekst znajduje się w
    > którymś. Zamiast szukania wszystkich, lepiej skorzystać z indeksu. Stąd,
    > wyszukiwać będę całe słowa a nie części słów.
    > Algorytm szukania Google opisany jest:
    > rakaposhi.eas.asu.edu/cse494/notes/f05-google.ppt
    > infolab.stanford.edu/pub/papers/google.pdf
    > jak to wygląda? Jest lista alfabetyczna słów, albo jakaś zhaszowana. Dla
    > każdego słowa jest lista dokumentów? Jest to linked-list?
    > No dobrze, a co gdy mam szukać word1 AND word2 albo word1 - word2?
    > albo ważna kolejność: "word1 word2" ?

    Podstawą jest zahasowany słownik słów. Każde słowo ma listę stron na
    których ono wstępuje. Lista jest uporządkowana według trafności. Trafność
    liczą jakimś algorytmem - dobry algorytm wydaje się bardziej
    problematyczny. Jeśli wyszukiwanie z minusem, to jeszcze strona musi
    mieć zahasowany słownik słów. Jeśli z operatorem and, to część wspólna
    urli. Problemem jest zrównoleglenie i osiągnięcie dużej wydajności.


    Pozdrawiam

Podziel się

Poleć ten post znajomemu poleć

Wydrukuj ten post drukuj


Następne wpisy z tego wątku

Najnowsze wątki z tej grupy


Najnowsze wątki

Szukaj w grupach

Eksperci egospodarka.pl

1 1 1

Wpisz nazwę miasta, dla którego chcesz znaleźć jednostkę ZUS.

Wzory dokumentów

Bezpłatne wzory dokumentów i formularzy.
Wyszukaj i pobierz za darmo: