-
Path: news-archive.icm.edu.pl!agh.edu.pl!news.agh.edu.pl!polsl.pl!not-for-mail
From: Adam Przybyla <a...@r...pl>
Newsgroups: pl.comp.programming,pl.comp.lang.c
Subject: Re: darmowy silnik wyszukiwarki
Date: Mon, 9 Jan 2012 16:07:53 +0000 (UTC)
Organization: Politechnika Slaska, Gliwice
Lines: 24
Sender: Adam Przybyla <a...@s...ertel.com.pl>
Message-ID: <jef3cp$tgc$1@polsl.pl>
References: <jdssgg$fgl$1@mx1.internetia.pl> <jeet6f$64p$1@mx1.internetia.pl>
NNTP-Posting-Host: smtp.ertel.com.pl
Mime-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit
X-Trace: polsl.pl 1326125273 30220 62.182.231.178 (9 Jan 2012 16:07:53 GMT)
X-Complaints-To: n...@p...pl
NNTP-Posting-Date: Mon, 9 Jan 2012 16:07:53 +0000 (UTC)
User-Agent: tin/1.8.3-20070201 ("Scotasay") (UNIX) (Linux/2.6.18-194.8.1.el5xen
(i686))
Xref: news-archive.icm.edu.pl pl.comp.programming:194661 pl.comp.lang.c:297588
[ ukryj nagłówki ]In pl.comp.programming MarlonB <z...@w...kon> wrote:
>
> Użytkownik "Szyk" <s...@o...pl> napisał w wiadomości
> news:jdssgg$fgl$1@mx1.internetia.pl...
>> Witam
>>
>> Mam plik XML ponad 20GB. Z tego pliku sobie wyciągam kawałki tekstu. Te
>> kawałki chcę sobie zindeksować, tak bym mógł określić częstość
>> występowania poszczególnych wyrazów i fraz (sekwencji kilku wyrazów -
>> kolejność wyrazów ma znacznie). Indeks wyszukiwarki chcę zrobić na własny
>> użytek. Indeks nie musi być super szybki ale musi odpowiadać w jakimś
>> rozsądnym czasie (do 10s).
>>
>> Domyślam się, że istnieją jakieś darmowe silniki wyszukiwania (raczej
>> tylko w C/C++) jakie mogłyby sprostać temu zadaniu. Myślę też że problem
>> nie jest zbyt specyficzny by nie spytać się na grupach dyskusyjnych. Więc:
>>
>> Jakie silniki wyszukiwania byście polecili do realizacji tego zadania.
>>
>
> Widziałeś to http://vtd-xml.sourceforge.net/ ? Może Ci przypasi. Ja
> korzystam z tego w javie.
... mysql+sphinx?;-) Z powazaniem
Adam Przybyla
Najnowsze wątki z tej grupy
- Arch. Prog. Nieuprzywilejowanych w pełnej wer. na nowej s. WWW energokod.pl
- 7. Raport Totaliztyczny: Sprawa Qt Group wer. 424
- TCL - problem z escape ostatniego \ w nawiasach {}
- Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- testy-wyd-sort - Podsumowanie
- Tworzenie Programów Nieuprzywilejowanych Opartych Na Wtyczkach
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
- Re: (PDF) Surgical Pathology of Non-neoplastic Gastrointestinal Diseases by Lizhi Zhang
- CfC 28th Ada-Europe Int. Conf. Reliable Software Technologies
Najnowsze wątki
- 2024-12-30 Warszawa => Key Account Manager <=
- 2024-12-30 Katowice => Key Account Manager (ERP) <=
- 2024-12-28 Śmiechu KOOOOOOPA ;-)
- 2024-12-29 Pomiar amplitudy w zegarku mechanicznym
- 2024-12-28 Antyradar
- 2024-12-28 Deweloper przegral w sadzie musi zwrócic pieniądze Posypia sie kolejne pozwy?
- 2024-12-28 Warszawa => Full Stack .Net Engineer <=
- 2024-12-28 Warszawa => Sales Assistant <=
- 2024-12-28 Warszawa => Programista Full Stack .Net <=
- 2024-12-28 Warszawa => Full Stack web developer (obszar .Net Core, Angular6+) <=
- 2024-12-28 Katowice => Head of Virtualization Platform Management and Operating S
- 2024-12-28 Błonie => Analityk Systemów Informatycznych (TMS SPEED) <=
- 2024-12-28 Warszawa => Senior Frontend Developer (React + React Native) <=
- 2024-12-28 Żerniki => Employer Branding Specialist <=
- 2024-12-28 ale zawziętość i cierpliwość