eGospodarka.pl
eGospodarka.pl poleca

eGospodarka.plGrupypl.comp.wwwroboty pająki spamerzyRe: roboty pająki spamerzy
  • Path: news-archive.icm.edu.pl!agh.edu.pl!news.agh.edu.pl!newsfeed2.atman.pl!newsfeed.
    atman.pl!news.task.gda.pl!not-for-mail
    From: Lukasz Kozicki <R...@v...cy.invalid>
    Newsgroups: pl.comp.www
    Subject: Re: roboty pająki spamerzy
    Date: Sat, 29 Jun 2013 13:21:50 +0200
    Organization: CI TASK http://www.task.gda.pl/
    Lines: 24
    Message-ID: <kqmg0d$vo9$1@news.task.gda.pl>
    References: <kqc4sf$k8l$1@node2.news.atman.pl>
    NNTP-Posting-Host: 89-65-5-6.dynamic.chello.pl
    Mime-Version: 1.0
    Content-Type: text/plain; charset=ISO-8859-2; format=flowed
    Content-Transfer-Encoding: 8bit
    X-Trace: news.task.gda.pl 1372504909 32521 89.65.5.6 (29 Jun 2013 11:21:49 GMT)
    X-Complaints-To: a...@n...task.gda.pl
    NNTP-Posting-Date: Sat, 29 Jun 2013 11:21:49 +0000 (UTC)
    User-Agent: Mozilla/5.0 (Windows NT 5.1; rv:17.0) Gecko/20130509 Thunderbird/17.0.6
    In-Reply-To: <kqc4sf$k8l$1@node2.news.atman.pl>
    Xref: news-archive.icm.edu.pl pl.comp.www:402285
    [ ukryj nagłówki ]

    W dniu 2013-06-25 15:10, identyfikator: 20040501 pisze:
    > no zadam kolejne pytanie bez odpowiedzi...
    >
    > jak filtrować roboty pająki i głównie spamerów w logach i statystykach?
    > macie jakieś sprawdzone metody? u mnie spamerzy włażą po 100 razy
    > dziennie, jak ich przefiltrować?

    Mam na jednej ze swoich stron "pułapkę" na spamboty: część strony
    do której wiedzie ukryty link; na pośredniej stronie są metatagi
    noindex,nofollow , którego uczciwe boty przestrzegają; dalej są strony
    generowane w locie przez skrypt php i jeśli wejdzie w nie jakiś
    robot, to po wygenerowaniu dla niego 10-tej strony - jego IP jest
    dopisywane do listy, którą sprawdza główna strona (index.php) przy
    każdym wyświetleniu. Jeśli znajdzie IP na taj liście - odprawia
    goście z headerem "403 Access Forbidden". Można też dopisywać
    IP bezpośrednio do .htaccess "Access deny xxx.xxx.xxx.xxx"
    Ta 10 strona jest po to, żeby - jeśli jednak zaplątal się tam
    jakiś ciekawski ludzik - nie zablokować go, bo po kilku podobnych
    stronach człowiek już się zorientuje że nic ciekawego tam nie ma.

    Pozdr,
    --
    ŁK

Podziel się

Poleć ten post znajomemu poleć

Wydrukuj ten post drukuj


Następne wpisy z tego wątku

Najnowsze wątki z tej grupy


Najnowsze wątki

Szukaj w grupach

Eksperci egospodarka.pl

1 1 1

Wpisz nazwę miasta, dla którego chcesz znaleźć jednostkę ZUS.

Wzory dokumentów

Bezpłatne wzory dokumentów i formularzy.
Wyszukaj i pobierz za darmo: