-
1. Data: 2011-11-10 15:04:39
Temat: Proste jezyki kwerendowania
Od: Jacek Czerwinski <...@...z.pl>
Jaki powinien być fajny "język" kwerendowania dla zwykłego śmiertelnika?
Czy co pisać w okienku 'Szukaj' ?
Czy jest jakaś przeciwwaga dla narodu urobionego googlem?
słowo - wyszukiwanie tego słowa - pytanie: pełnego czy substringu *)
=słowo - wyraźne wskazanie na TYLKO dokładne słowo (lub tylko na
początku pola?, lub tylko równość pola a nie zawieranie)
słowo drugie - połączone AND (co wcale nie jest oczywiste, kiedyś
defautem było OR). Skoro defaultem jest AND, to jak pisać OR?
słowo* - elementy wyrażeń regularnych (raczej notacja gwiazdka niż
SQL-owy procent)
[słowo] - podpatrzone na stackoverflow wyszukiwanie tag'u - oczywiście
da się łączyć z wyszukiwaniem zwykłego słowa.
(,) - podpatrzone na ebay'u do notacji AND, OR i ich złączenia. To jakoś
tak działa, ze lista z przecinkami w nawiasach to OR, a za nawiasem to AND
JAK by pisać nazwisko=Mickiewicz (tzn eliminować ulicę Mickiewicza)
Dla ciekawskich, podsystemy będę zaimplementowane na gruncie Lucene, ale
nie wszystkie.
*) Rzecz raczej na gruncie języka polskiego, ale że chodzi w znacznym
stopniu o realia firmowe (notatki w CRM, słowa z branży, nie z
literackiego języka itd, dane adresowe i różne różności), synonimy mile
widziane i sposoby na typowe błędne zapisanie słowa, ale nie wiem jak
się uda.
-
2. Data: 2011-11-10 16:47:55
Temat: Re: Proste jezyki kwerendowania
Od: " " <f...@g...SKASUJ-TO.pl>
Jacek Czerwinski <...@...z.pl> napisał(a):
> Jaki powinien być fajny "język" kwerendowania dla zwykłego śmiertelnika?
> Czy co pisać w okienku 'Szukaj' ?
> Czy jest jakaś przeciwwaga dla narodu urobionego googlem?
>
> słowo - wyszukiwanie tego słowa - pytanie: pełnego czy substringu *)
> =słowo - wyraźne wskazanie na TYLKO dokładne słowo (lub tylko na
> początku pola?, lub tylko równość pola a nie zawieranie)
> słowo drugie - połączone AND (co wcale nie jest oczywiste, kiedyś
> defautem było OR). Skoro defaultem jest AND, to jak pisać OR?
> słowo* - elementy wyrażeń regularnych (raczej notacja gwiazdka niż
> SQL-owy procent)
> [słowo] - podpatrzone na stackoverflow wyszukiwanie tag'u - oczywiście
> da się łączyć z wyszukiwaniem zwykłego słowa.
> (,) - podpatrzone na ebay'u do notacji AND, OR i ich złączenia. To jakoś
> tak działa, ze lista z przecinkami w nawiasach to OR, a za nawiasem to AND
> JAK by pisać nazwisko=Mickiewicz (tzn eliminować ulicę Mickiewicza)
>
> Dla ciekawskich, podsystemy będę zaimplementowane na gruncie Lucene, ale
> nie wszystkie.
> *) Rzecz raczej na gruncie języka polskiego, ale że chodzi w znacznym
> stopniu o realia firmowe (notatki w CRM, słowa z branży, nie z
> literackiego języka itd, dane adresowe i różne różności), synonimy mile
> widziane i sposoby na typowe błędne zapisanie słowa, ale nie wiem jak
> się uda.
>
>
trudno powiedziec, mozna by sprobowac wyszukiwane ciagi
oznaczac w cudzyslowie "sssdd" a wszystkie slowa poza cudzyslowami
traktowac jako kontrolne przy czym zdefiniowac je w jezyku
naturalnym np
"aaa" i "bbb"
"aaa" bez "cc"
"aa" na poczatku lini
"aaa" przed "bb"
strony z "aaa" przed "bb"
wiersze z "xxz" na poczatku lini
--
Wysłano z serwisu Usenet w portalu Gazeta.pl -> http://www.gazeta.pl/usenet/
-
3. Data: 2011-11-10 17:49:26
Temat: Re: Proste jezyki kwerendowania
Od: A.L. <l...@a...com>
On Thu, 10 Nov 2011 16:04:39 +0100, Jacek Czerwinski <...@...z.pl> wrote:
>Jaki powinien być fajny "język" kwerendowania dla zwykłego śmiertelnika?
>Czy co pisać w okienku 'Szukaj' ?
>Czy jest jakaś przeciwwaga dla narodu urobionego googlem?
>
>słowo - wyszukiwanie tego słowa - pytanie: pełnego czy substringu *)
>=słowo - wyraźne wskazanie na TYLKO dokładne słowo (lub tylko na
>początku pola?, lub tylko równość pola a nie zawieranie)
>słowo drugie - połączone AND (co wcale nie jest oczywiste, kiedyś
>defautem było OR). Skoro defaultem jest AND, to jak pisać OR?
>słowo* - elementy wyrażeń regularnych (raczej notacja gwiazdka niż
>SQL-owy procent)
>[słowo] - podpatrzone na stackoverflow wyszukiwanie tag'u - oczywiście
>da się łączyć z wyszukiwaniem zwykłego słowa.
>(,) - podpatrzone na ebay'u do notacji AND, OR i ich złączenia. To jakoś
>tak działa, ze lista z przecinkami w nawiasach to OR, a za nawiasem to AND
>JAK by pisać nazwisko=Mickiewicz (tzn eliminować ulicę Mickiewicza)
>
>Dla ciekawskich, podsystemy będę zaimplementowane na gruncie Lucene, ale
>nie wszystkie.
>*) Rzecz raczej na gruncie języka polskiego, ale że chodzi w znacznym
>stopniu o realia firmowe (notatki w CRM, słowa z branży, nie z
>literackiego języka itd, dane adresowe i różne różności), synonimy mile
>widziane i sposoby na typowe błędne zapisanie słowa, ale nie wiem jak
>się uda.
>
http://www.ijcsi.org/papers/IJCSI-8-2-600-608.pdf
http://www.cosc.canterbury.ac.nz/research/reports/Ho
nsReps/1999/hons_9904.pdf
http://turing.cs.washington.edu/papers/nli-iui03.pdf
Plizzzz. Nie odkrywaj kola. Pogogluj na "natural language interface to
SQL" i cos podobnego
-
4. Data: 2011-11-10 18:18:35
Temat: Re: Proste jezyki kwerendowania
Od: Jacek Czerwinski <...@...z.pl>
W dniu 2011-11-10 18:49, A.L. pisze:
> http://www.ijcsi.org/papers/IJCSI-8-2-600-608.pdf
> http://www.cosc.canterbury.ac.nz/research/reports/Ho
nsReps/1999/hons_9904.pdf
> http://turing.cs.washington.edu/papers/nli-iui03.pdf
>
>
> Plizzzz. Nie odkrywaj kola. Pogogluj na "natural language interface to
> SQL" i cos podobnego
Dzięki za linki, już rzuciłem i jeszcze dłużej przeczytam. Zwrócę jednak
uwagę na "drobne" róznice bo art pochodzą z ok 2000.
a) Nie jesteśmy w środowisku uniwersyteckim (gdzie mimo bezstresowości
nauki, jeszcze nie zaniknęła umiejętność wyszukiwania np. książek)
W l. 1980-tych student kierunku 'zaganianie, wyganianie i język
rosyjski' miał zajęcia bilioteczne, uczyli go jak systematycznie ma
sobie książkę znaleźć.
b) wśród milionów użytkowników komputerów nastąpił straszliwy zjazd
ŚREDNIEGO poziomu sensownego używania IT. Ani moja wina, ani twoja, ale
jak już przeglądarki są bez adresu URL - tylko w wyszukiwarką, to o
czymś świadczy. Umiejętność klasyfikowania informacji jest de facto
żadna. Na naszych oczach zaczyna umierać oznaczanie przez 'tag'-i, co
miało być zbawienne, obecnie coraz częściej są one nadawanie
półautomatycznie, bez refleksji żywego użytkownika - a wtedy ich wartość
dramatycznie spada.
c) są w r 2011 pewne de facto standardy (nie dyskutuję dobre czy złe),
ale w funkcjonalności tego rodzaju nie da się od tego zupełnie uciec.
Można podchwycić podstawowy sposób kontaktu, i na nim zbudować.
Z drugiej strony mój mechanizm nie będzie "śmietnikogrzebcą" jak
popularna wyszukiwarka, będzie działał na informacji częściowo
sklasyfikowanej.
-
5. Data: 2011-11-10 18:19:15
Temat: Re: Proste jezyki kwerendowania
Od: Jacek Czerwinski <...@...z.pl>
W dniu 2011-11-10 17:47, f...@g...SKASUJ-TO.pl pisze:
>
> trudno powiedziec, mozna by sprobowac wyszukiwane ciagi
> oznaczac w cudzyslowie "sssdd" a wszystkie slowa poza cudzyslowami
> traktowac jako kontrolne
Default by musiał byc blondie-friendly, czyli wpisane słowo jest >jakoś<
wyszukiwane. Dopiero na tym można zakładać wzrost "komputerowego"
oblatania użytkownika.
-
6. Data: 2011-11-10 18:34:54
Temat: Re: Proste jezyki kwerendowania
Od: Jacek Czerwinski <...@...z.pl>
W dniu 2011-11-10 19:18, Jacek Czerwinski pisze:
Bardziej bym szukał czegoś, co ludzie "kupią" w tej okolicy:
http://msdn.microsoft.com/en-us/library/ff394471.asp
x?ppud=4
http://blogs.fluidinfo.com/fluidinfo/2009/09/10/the-
myriad-benefits-of-a-simple-query-language/
http://sourceforge.net/apps/trac/lemur/wiki/Basic%20
use%20of%20the%20Indri%20Query%20Language
(takie 'simple query search language' ma co trzeci silnik webowy CMS,
Wiki itp)
z elementami 'semantic web' czy 'semantic wiki' ...
na razie głośno myślę
-
7. Data: 2011-11-10 22:03:16
Temat: Re: Proste jezyki kwerendowania
Od: A.L. <l...@a...com>
On Thu, 10 Nov 2011 19:34:54 +0100, Jacek Czerwinski <...@...z.pl> wrote:
>W dniu 2011-11-10 19:18, Jacek Czerwinski pisze:
>
>Bardziej bym szukał czegoś, co ludzie "kupią" w tej okolicy:
>
>http://msdn.microsoft.com/en-us/library/ff394471.as
px?ppud=4
>http://blogs.fluidinfo.com/fluidinfo/2009/09/10/the
-myriad-benefits-of-a-simple-query-language/
>http://sourceforge.net/apps/trac/lemur/wiki/Basic%2
0use%20of%20the%20Indri%20Query%20Language
>(takie 'simple query search language' ma co trzeci silnik webowy CMS,
>Wiki itp)
>
>z elementami 'semantic web' czy 'semantic wiki' ...
>na razie głośno myślę
jak ma to czemu nie wezmiesz gotowego?...
neistety, nie uciekniesz od tego aby miec JAKAS framatyke i JAKAS
analize syntaktyczna. Wyrazenia regularne to tez gramatyka.
Sporo jest rozwiazan bazunacych na analizie slow kluczowych, niestety,
literatura jest w ksiazkach, i to w ksiazkach o Prologu.
Zobacz starozytny program Eliza. na tej bazie cos mozna zrobic. Eliza
jest w sieci w wielu egzemplarzach.
A.L.
-
8. Data: 2011-11-10 22:06:19
Temat: Re: Proste jezyki kwerendowania
Od: A.L. <l...@a...com>
On Thu, 10 Nov 2011 19:19:15 +0100, Jacek Czerwinski <...@...z.pl> wrote:
>W dniu 2011-11-10 17:47, f...@g...SKASUJ-TO.pl pisze:
>
>>
>> trudno powiedziec, mozna by sprobowac wyszukiwane ciagi
>> oznaczac w cudzyslowie "sssdd" a wszystkie slowa poza cudzyslowami
>> traktowac jako kontrolne
>
>Default by musiał byc blondie-friendly, czyli wpisane słowo jest >jakoś<
>wyszukiwane. Dopiero na tym można zakładać wzrost "komputerowego"
>oblatania użytkownika.
>
>
"slowo" ma byc wyszukiwane, czy tez tekst wpisany przez blondynke:
"Znajdz mi wszystkich facetow mlodszych niz 30 lat, wazacych mniej niz
mniej wiecej 80 kilo i z majatkiem wiekszym niz 100 tysiecy. Acha,
maja byc single"
Musisz to przetlumaczyc na SQL, a do tego JAKAS gramatyka jest
potzrebna.
A.L.
-
9. Data: 2011-11-11 08:20:52
Temat: Re: Proste jezyki kwerendowania
Od: " " <f...@g...SKASUJ-TO.pl>
Jacek Czerwinski <...@...z.pl> napisał(a):
> W dniu 2011-11-10 17:47, f...@g...SKASUJ-TO.pl pisze:
>
> >
> > trudno powiedziec, mozna by sprobowac wyszukiwane ciagi
> > oznaczac w cudzyslowie "sssdd" a wszystkie slowa poza cudzyslowami
> > traktowac jako kontrolne
>
> Default by musiał byc blondie-friendly, czyli wpisane słowo jest >jakoś<
> wyszukiwane. Dopiero na tym można zakładać wzrost "komputerowego"
> oblatania użytkownika.
>
mozna by sprawdzac czy cudzyslow jest w wyrazeniu i jak nie ma
to wstawiac jeden przed i jeden po, ale poniewaz zablokowalo
by to mozliwosc uzywania samych slow kontrolnych, np
programy
muzyka
teksty
to lepiej mz zwracac uzytkownikowi komunikat o tym zeby
wstawil poszukiwany ciag w cudzyslow vel by uzyl slow
kontrolnych - warto tez pokazac jakas stronke helpa
z przykladami
"CPU"
teksty z "CPU" w tytule
teksty z "CPU" w tresci
akapity z "CPU" i bez "GPU"
akapity z "CPU" lub bez "GPU"
zdania z "CPU" na koncu
pliki z "sonic youth" w tytule
pliki z "sonic youth" w tytule i "mp3" w tytule
empetrojki z "sonic youth" w tytule mniejsze niz 8MB
empetrojki z "sonic youth" w tagu artysta z "pattern recognition" w tytule
mniejsze niz 8MB
(dosyc proste do zakodowania mz)
itd
--
Wysłano z serwisu Usenet w portalu Gazeta.pl -> http://www.gazeta.pl/usenet/
-
10. Data: 2011-11-11 08:42:37
Temat: Re: Proste jezyki kwerendowania
Od: " " <f...@g...SKASUJ-TO.pl>
<f...@g...SKASUJ-TO.pl> napisał(a):
> Jacek Czerwinski <...@...z.pl> napisał(a):
>
> > W dniu 2011-11-10 17:47, f...@g...SKASUJ-TO.pl pisze:
> >
> > >
> > > trudno powiedziec, mozna by sprobowac wyszukiwane ciagi
> > > oznaczac w cudzyslowie "sssdd" a wszystkie slowa poza cudzyslowami
> > > traktowac jako kontrolne
> >
> > Default by musiał byc blondie-friendly, czyli wpisane słowo jest >jakoś<
> > wyszukiwane. Dopiero na tym można zakładać wzrost "komputerowego"
> > oblatania użytkownika.
> >
> mozna by sprawdzac czy cudzyslow jest w wyrazeniu i jak nie ma
> to wstawiac jeden przed i jeden po, ale poniewaz zablokowalo
> by to mozliwosc uzywania samych slow kontrolnych, np
>
> programy
> muzyka
> teksty
>
> to lepiej mz zwracac uzytkownikowi komunikat o tym zeby
> wstawil poszukiwany ciag w cudzyslow vel by uzyl slow
> kontrolnych - warto tez pokazac jakas stronke helpa
> z przykladami
>
> "CPU"
> teksty z "CPU" w tytule
> teksty z "CPU" w tresci
> akapity z "CPU" i bez "GPU"
> akapity z "CPU" lub bez "GPU"
> zdania z "CPU" na koncu
> pliki z "sonic youth" w tytule
> pliki z "sonic youth" w tytule i "mp3" w tytule
> empetrojki z "sonic youth" w tytule mniejsze niz 8MB
> empetrojki z "sonic youth" w tagu artysta z "pattern recognition" w tytule
> mniejsze niz 8MB
>
> (dosyc proste do zakodowania mz)
>
>
i tak nie wiadomo czy ktos chcialby z tego korzystac, bo to
jest wlasnie jakos za bardzo 'out', gdy moze wlasnie fajniejsze
bylo by cos bardziej 'in' wlasnie - ale ja sie na tym nie znam
--
Wysłano z serwisu Usenet w portalu Gazeta.pl -> http://www.gazeta.pl/usenet/