-
Path: news-archive.icm.edu.pl!news.icm.edu.pl!newsfeed2.atman.pl!newsfeed.atman.pl!.P
OSTED!not-for-mail
From: Borneq <b...@a...hidden.pl>
Newsgroups: pl.comp.programming
Subject: Re: Algorytm szukania podobny do Google
Date: Tue, 7 Jun 2016 22:31:22 +0200
Organization: ATMAN - ATM S.A.
Lines: 14
Message-ID: <nj7auq$3i4$1@node1.news.atman.pl>
References: <nj6f0k$26n$1@node2.news.atman.pl>
<c...@g...com>
<nj6j3r$7db$1@node2.news.atman.pl> <nj6pik$edr$1@dont-email.me>
NNTP-Posting-Host: apn-37-7-7-80.dynamic.gprs.plus.pl
Mime-Version: 1.0
Content-Type: text/plain; charset=utf-8; format=flowed
Content-Transfer-Encoding: 8bit
X-Trace: node1.news.atman.pl 1465331482 3652 37.7.7.80 (7 Jun 2016 20:31:22 GMT)
X-Complaints-To: u...@a...pl
NNTP-Posting-Date: Tue, 7 Jun 2016 20:31:22 +0000 (UTC)
User-Agent: Mozilla/5.0 (Windows NT 10.0; WOW64; rv:45.0) Gecko/20100101
Thunderbird/45.1.1
In-Reply-To: <nj6pik$edr$1@dont-email.me>
Xref: news-archive.icm.edu.pl pl.comp.programming:209454
[ ukryj nagłówki ]W dniu 07.06.2016 o 17:34, Piotr Chamera pisze:
> słowa w leksykonie sprowadza się zwykle do jakiejś podstawowej postaci
> (ang. stemming), np. kota, kotu, kocie -> kot
Tu też potrzebny jakiś algorytm aby nie trzeba używać całej bazy
polimorfologika
> słowa, które występują bardzo często i nie wnoszą żadnej informacji
> do wyszukiwania się po prostu pomija
Chociaż tu z pomijaniem byłbym ostrożny, bo w Google podoba mi się to,
że nie pomija nawet częstych słów, a w wyszukiwaniu na forach
internetowych nie podoba mi się gdy zgłasza się "to słowo zbyt często
występuje"
Następne wpisy z tego wątku
Najnowsze wątki z tej grupy
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
- Re: (PDF) Surgical Pathology of Non-neoplastic Gastrointestinal Diseases by Lizhi Zhang
- CfC 28th Ada-Europe Int. Conf. Reliable Software Technologies
- Młodzi programiści i tajna policja
- Ada 2022 Language Reference Manual to be Published by Springer
- Press Release - AEiC 2023, Ada-Europe Reliable Softw. Technol.
- Ada-Europe - AEiC 2023 early registration deadline approaching
- Ada-Europe Int.Conf. Reliable Software Technologies, AEiC 2023
- Ile cykli zajmuje mnożenie liczb 64-bitowych?
Najnowsze wątki
- 2024-07-05 eSIM na czym polega
- 2024-07-15 Roaming poza unią
- 2024-07-16 Jak tanio dzwonic do Wielkiej Brytani?
- 2024-07-16 Dzień bez ICE
- 2024-07-15 Spalinówki płoną doszczętnie
- 2024-07-15 Pojemność akumulatora
- 2024-07-15 Elektryk8i dalej płoną.
- 2024-07-15 Motodziennik #284 NOWY MG HS z hybrydą oraz wraca FORD CAPRI (jako SUV)
- 2024-07-14 [FILM] SAMOCHODY ELEKTRYCZNE DO WIELKIE ŚCIEMA? TYLKO FAKTY!
- 2024-07-14 Znieczulica w narodzie
- 2024-07-13 Protect Your PC with IObit Malware Fighter Pro 11.3.0.1346 Multilingual
- 2024-07-13 Advanced SystemCare Pro 17.5.0.255: Complete Performance and Health Optimization
- 2024-07-15 stara idea nowe hardware
- 2024-07-14 Dzwonek gong z transformatorem
- 2024-07-14 espnow przerywa na jeziorze?