-
Path: news-archive.icm.edu.pl!agh.edu.pl!news.agh.edu.pl!newsfeed2.atman.pl!newsfeed.
atman.pl!news.task.gda.pl!not-for-mail
From: Lukasz Kozicki <R...@v...cy.invalid>
Newsgroups: pl.comp.www
Subject: Re: roboty pająki spamerzy
Date: Sat, 29 Jun 2013 13:21:50 +0200
Organization: CI TASK http://www.task.gda.pl/
Lines: 24
Message-ID: <kqmg0d$vo9$1@news.task.gda.pl>
References: <kqc4sf$k8l$1@node2.news.atman.pl>
NNTP-Posting-Host: 89-65-5-6.dynamic.chello.pl
Mime-Version: 1.0
Content-Type: text/plain; charset=ISO-8859-2; format=flowed
Content-Transfer-Encoding: 8bit
X-Trace: news.task.gda.pl 1372504909 32521 89.65.5.6 (29 Jun 2013 11:21:49 GMT)
X-Complaints-To: a...@n...task.gda.pl
NNTP-Posting-Date: Sat, 29 Jun 2013 11:21:49 +0000 (UTC)
User-Agent: Mozilla/5.0 (Windows NT 5.1; rv:17.0) Gecko/20130509 Thunderbird/17.0.6
In-Reply-To: <kqc4sf$k8l$1@node2.news.atman.pl>
Xref: news-archive.icm.edu.pl pl.comp.www:402285
[ ukryj nagłówki ]W dniu 2013-06-25 15:10, identyfikator: 20040501 pisze:
> no zadam kolejne pytanie bez odpowiedzi...
>
> jak filtrować roboty pająki i głównie spamerów w logach i statystykach?
> macie jakieś sprawdzone metody? u mnie spamerzy włażą po 100 razy
> dziennie, jak ich przefiltrować?
Mam na jednej ze swoich stron "pułapkę" na spamboty: część strony
do której wiedzie ukryty link; na pośredniej stronie są metatagi
noindex,nofollow , którego uczciwe boty przestrzegają; dalej są strony
generowane w locie przez skrypt php i jeśli wejdzie w nie jakiś
robot, to po wygenerowaniu dla niego 10-tej strony - jego IP jest
dopisywane do listy, którą sprawdza główna strona (index.php) przy
każdym wyświetleniu. Jeśli znajdzie IP na taj liście - odprawia
goście z headerem "403 Access Forbidden". Można też dopisywać
IP bezpośrednio do .htaccess "Access deny xxx.xxx.xxx.xxx"
Ta 10 strona jest po to, żeby - jeśli jednak zaplątal się tam
jakiś ciekawski ludzik - nie zablokować go, bo po kilku podobnych
stronach człowiek już się zorientuje że nic ciekawego tam nie ma.
Pozdr,
--
ŁK
Następne wpisy z tego wątku
- 05.07.13 22:55 Ministerstwo Propagandy
Najnowsze wątki z tej grupy
- Jakie znacie działające serwery grup dyskusyjnych?
- is it live this group at news.icm.edu.pl
- php, linki z nazwami a $_GET, SEO
- www polityka pl captcha
- dyktatura brudnego palucha
- www.znanylekarz.pl
- Czy pytanie o sczytywanie stron programami/skryptami to tu?
- Grupy webdevowe
- Jak wydrukować stronę?
- IIS, kilka witryn
- linki <a href="/strona.php"> (ze slashami)
- co rozszerza stronę??
- responsywny akapit <p>
- Czy istnieje jakiś emulator przeglądarek pod Mac'a?
- taka sama konfiguracja dla localhost i produkcji
Najnowsze wątki
- 2025-01-31 Wrocław => Senior SAP Support Consultant (SD) <=
- 2025-01-31 Warszawa => Full Stack web developer (obszar .Net Core, Angular6+) <=
- 2025-01-31 Gdańsk => iOS Developer (Swift experience) <=
- 2025-01-31 Kraków => UX Designer <=
- 2025-01-31 Warszawa => Data Engineer (Tech Leader) <=
- 2025-01-31 Gliwice => Business Development Manager - Dział Sieci i Bezpieczeńst
- 2025-01-31 Gliwice => Business Development Manager - Network and Network Security
- 2025-01-31 Warszawa => Architekt rozwiązań (doświadczenie w obszarze Java, AWS
- 2025-01-31 Warszawa => Full Stack .Net Engineer <=
- 2025-01-31 Warszawa => Programista Full Stack (.Net Core) <=
- 2025-01-31 Gdańsk => Programista Full Stack .Net <=
- 2025-01-31 Bieruń => Team Lead / Tribe Lead FrontEnd <=
- 2025-01-31 Błonie => Administrator systemów <=
- 2025-01-31 Duńskie precedensy w sprawie odsprzedawania terytoriów USA [Wyspy Dziewicze (1917)]
- 2025-01-31 Gdańsk => Specjalista ds. Sprzedaży <=