-
Data: 2010-09-11 14:12:00
Temat: Re: inteligentne wyszukiwanie
Od: qertoip <q...@g...com> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]On Sep 4, 8:16 pm, Mariusz Marszałkowski <m...@g...com> wrote:
> Jest bardzo dużo plików tekstowych na dysku. Pliki trzeba
> jakoś sprytnie zaindeksować, tak, aby później było możliwe
> szybkie wyszukanie wszystkich plików które zawierają
> jakąś frazę, albo nawet wzorzec, typu program*anie.
> Idealnie byłoby jakby jeszcze był jakiś ranking, np.
> tym większa liczba im strona lepiej pasuje do wzorca.
Sphinx jest bardzo szybki i niezawodny. Domyślnie działa nad bazą
danych, ale można go też nakarmić samemu (np. via XML). Pozostaje więc
rekurencyjny odczyt plików tekstowych w zadanym katalogu. To jest
łatwe zadanie niezależnie od języka. Drobnym problemem może być
jeszcze niezawodne rozróżnienie plików tekstowych od binarnych. Jeśli
platforma Javy, to polecam do tego bibliotekę istext.jar (GitHub).
--
http://qertoip.typepad.com - programista kontra rzeczywistość czyli
blog zawodowego swetra
Najnowsze wątki z tej grupy
- Popr. 14. Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- Arch. Prog. Nieuprzywilejowanych w pełnej wer. na nowej s. WWW energokod.pl
- 7. Raport Totaliztyczny: Sprawa Qt Group wer. 424
- TCL - problem z escape ostatniego \ w nawiasach {}
- Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- testy-wyd-sort - Podsumowanie
- Tworzenie Programów Nieuprzywilejowanych Opartych Na Wtyczkach
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
- Re: (PDF) Surgical Pathology of Non-neoplastic Gastrointestinal Diseases by Lizhi Zhang
Najnowsze wątki
- 2025-02-01 Śmierć mózgu a narządy do pobrania
- 2025-01-31 A niektórym to naprawdę zależy na ekologi w miastach LPG POWRACA ;-)
- 2025-01-31 Lublin => Programista Delphi <=
- 2025-01-31 Łódź => Programista NodeJS <=
- 2025-01-31 Wrocław => Senior SAP Support Consultant (SD) <=
- 2025-01-31 Warszawa => Full Stack web developer (obszar .Net Core, Angular6+) <=
- 2025-01-31 Gdańsk => iOS Developer (Swift experience) <=
- 2025-01-31 Kraków => UX Designer <=
- 2025-01-31 Warszawa => Data Engineer (Tech Leader) <=
- 2025-01-31 Gliwice => Business Development Manager - Dział Sieci i Bezpieczeńst
- 2025-01-31 Gliwice => Business Development Manager - Network and Network Security
- 2025-01-31 Warszawa => Architekt rozwiązań (doświadczenie w obszarze Java, AWS
- 2025-01-31 Warszawa => Full Stack .Net Engineer <=
- 2025-01-31 Warszawa => Programista Full Stack (.Net Core) <=
- 2025-01-31 Gdańsk => Programista Full Stack .Net <=