-
Path: news-archive.icm.edu.pl!news.icm.edu.pl!newsfeed.pionier.net.pl!2.eu.feeder.erj
e.net!feeder.erje.net!eternal-september.org!reader02.eternal-september.org!.POS
TED!not-for-mail
From: "Andrzej A. Filip" <a...@o...eu>
Newsgroups: pl.comp.www
Subject: Re: Sczytywanie skryptem Amazon Top100 [wget (User-Agent) rulez? Nie.]
Date: Tue, 15 Mar 2022 12:18:48 +0100 (CET)
Organization: It is for me to know and for you to find out.
Lines: 38
Message-ID: <a...@w...eu>
References: <a...@w...eu> <622875ce$0$500$65785112@news.neostrada.pl>
<a...@w...eu> <6229ab7a$0$488$65785112@news.neostrada.pl>
<a...@w...eu> <a...@w...eu>
<622e4561$0$464$65785112@news.neostrada.pl> <a...@w...eu>
<62305243$0$491$65785112@news.neostrada.pl>
Mime-Version: 1.0
Content-Type: text/plain; charset=utf-8
Content-Transfer-Encoding: 8bit
Injection-Info: reader02.eternal-september.org;
posting-host="a249e4af995a8f7334890cb4bfce76b4";
logging-data="17585";
mail-complaints-to="a...@e...org";
posting-account="U2FsdGVkX1/rV0FYY4+rinQLUastt8wP"
Cancel-Lock: sha1:Pre2678DOnB5T1ELnloueYds+Tk= sha1:hyh4vc6CegVp0iONJQCkLjn9HNw=
Xref: news-archive.icm.edu.pl pl.comp.www:403711
[ ukryj nagłówki ]Tomek <s...@w...xx.pl> pisze:
> W dniu 13.03.2022 o 20:56, Andrzej A. Filip pisze:
>> Roman Tyczka <r...@h...you.spammer> pisze:
>>> On 11.03.2022 07:31, Andrzej A. Filip wrote:
>>>> Sugestia przestała był użyteczna. Amazon blokuje User-Agent wget i
>>>> samego wget "zależnie od fazy księżyca". Kilka razy zadziałało a
>>>> teraz blokuje dostęp prawie zawsze.
>
>
> To może użyj wgeta z parametrem:
> --random-wait
Problem polega na tym że amazom.com *teraz już* odwala próbę
ściągnięcia pierwszej strony przez wget.
---request begin---
GET /Best-Sellers-Science-Fiction-Fantasy/zgbs/books/25/ HTTP/1.1
Host: www.amazon.com
User-Agent: Wget/1.21.2
Accept: */*
Accept-Encoding: identity
Connection: Keep-Alive
---response begin---
HTTP/1.1 503 Service Unavailable
Content-Type: text/html
Content-Length: 2671
Connection: keep-alive
...
Vary: Content-Type,Accept-Encoding,X-Amzn-CDN-Cache,X-Amzn
-AX-Treatment,User-Agent
...
X-Cache: Error from cloudfront
...
--
Andrzej A. Filip
Najnowsze wątki z tej grupy
- Jakie znacie działające serwery grup dyskusyjnych?
- is it live this group at news.icm.edu.pl
- php, linki z nazwami a $_GET, SEO
- www polityka pl captcha
- dyktatura brudnego palucha
- www.znanylekarz.pl
- Czy pytanie o sczytywanie stron programami/skryptami to tu?
- Grupy webdevowe
- Jak wydrukować stronę?
- IIS, kilka witryn
- linki <a href="/strona.php"> (ze slashami)
- co rozszerza stronę??
- responsywny akapit <p>
- Czy istnieje jakiś emulator przeglądarek pod Mac'a?
- taka sama konfiguracja dla localhost i produkcji
Najnowsze wątki
- 2025-04-12 kod dostępu stawka VAT
- 2025-04-12 pismaki klikbiatujo
- 2025-04-12 SZAP/USONA: Zarzuty karne przeciwko Fauciemu i spółce
- 2025-04-12 Katowice => Key Account Manager (ERP) <=
- 2025-04-12 Weryfikacja PESEL na listach poparcia kandydata
- 2025-04-12 mój pierwszy miernik grubości lakieru
- 2025-04-12 China-Kraków => Production Coordinator / Representant Product Dev <=
- 2025-04-12 Warszawa => Junior Rekruter <=
- 2025-04-12 Gliwice => Business Development Manager - Dział Sieci i Bezpieczeńst
- 2025-04-12 Warszawa => Account Manager - Sprzedaż Usług Rekrutacyjnych <=
- 2025-04-12 Kraków => Backend/Data Engineer (Java, Scala or Python) <=
- 2025-04-12 Kraków => Backend/Data Engineer (Java, Scala lub Python) <=
- 2025-04-12 Kraków => Engineering Manager (Clojure, Java) <=
- 2025-04-12 Re: [Media] Wysoki Sąd wskazał (Mentzenom) jak WŁAŚCIWIE dokopywać kandydatom koalicji tuskiej :-)
- 2025-04-12 Warszawa => Developer Microsoft Dynamics 365 Finance & Operations (D36