-
Path: news-archive.icm.edu.pl!news.icm.edu.pl!wsisiz.edu.pl!.POSTED.user-5-173-136-16
0.play-internet.pl!not-for-mail
From: RM <r...@w...pl>
Newsgroups: pl.comp.www
Subject: Re: gęstość słów kluczowych - pomiar na localhost
Date: Tue, 1 Oct 2019 06:23:00 +0200
Organization: http://www.wit.edu.pl
Message-ID: <qmukb4$14es8$1@portraits.wsisiz.edu.pl>
References: <b...@g...com>
<57154ae3$0$22831$65785112@news.neostrada.pl>
<qmi30f$1t07t$1@portraits.wsisiz.edu.pl>
<qmi52v$1t2ei$1@portraits.wsisiz.edu.pl>
Mime-Version: 1.0
Content-Type: text/plain; charset=iso-8859-2; format=flowed
Content-Transfer-Encoding: 8bit
Injection-Date: Tue, 1 Oct 2019 04:23:00 -0000 (UTC)
Injection-Info: portraits.wsisiz.edu.pl;
posting-host="user-5-173-136-160.play-internet.pl:5.173.136.160";
logging-data="1194888"; mail-complaints-to="a...@w...edu.pl"
User-Agent: Mozilla/5.0 (X11; Linux x86_64; rv:60.0) Gecko/20100101
Thunderbird/60.8.0
In-Reply-To: <qmi52v$1t2ei$1@portraits.wsisiz.edu.pl>
Content-Language: en-US
Xref: news-archive.icm.edu.pl pl.comp.www:403667
[ ukryj nagłówki ]W dniu 26.09.2019 o 12:49, RM pisze:
> W dniu 26.09.2019 o 12:13, Jivanmukta pisze:
>
>> A czy istnieją gotowe takie skrypty, bo nie udało mi się znaleźć w sieci?
>
> Czy ktoś napisałby odpłatnie dla mnie taki skrypt, który działałby offline?
Napisałem taki, może się komuś przyda:
<?php
if (!isset($argv[1]) || isset($argv[3])) {
die('Usage: php ' . $argv[0] . " file.html minpercent\nDefault
minpercent is 7, value must be in range 0...100.\n");
}
if (!file_exists($argv[1])) {
die(sprintf("File %s does not exist.\n", $argv[1]));
}
if (isset($argv[2])) {
$minpercent = (float)$argv[2];
if ($minpercent > 100 || $minpercent < 0) {
die("Argument minpercent must be in range 0...100.\n");
}
} else {
$minpercent = 7;
}
$text = strip_tags(file_get_contents($argv[1]));
$words = preg_split('/(\b|\s|\p{P})+/', $text);
$counters = array();
foreach ($words as $w) {
if ($w == '') continue;
$w = strtoupper($w);
if (!isset($counters[$w])) {
$counters[$w] = 1;
} else {
$counters[$w]++;
}
}
$maxlen = 0;
$factor = 100.0 / count($counters);
foreach ($counters as $w => $n) {
$counters[$w] *= $factor;
if (strlen($w) > $maxlen) {
$maxlen = strlen($w);
}
}
arsort($counters);
foreach ($counters as $w => $p) {
if ($p >= $minpercent) {
printf("%s%s%.2f%%\n", $w, str_repeat('.', $maxlen - strlen($w)
+ 3), $p);
}
}
Najnowsze wątki z tej grupy
- Jakie znacie działające serwery grup dyskusyjnych?
- is it live this group at news.icm.edu.pl
- php, linki z nazwami a $_GET, SEO
- www polityka pl captcha
- dyktatura brudnego palucha
- www.znanylekarz.pl
- Czy pytanie o sczytywanie stron programami/skryptami to tu?
- Grupy webdevowe
- Jak wydrukować stronę?
- IIS, kilka witryn
- linki <a href="/strona.php"> (ze slashami)
- co rozszerza stronę??
- responsywny akapit <p>
- Czy istnieje jakiś emulator przeglądarek pod Mac'a?
- taka sama konfiguracja dla localhost i produkcji
Najnowsze wątki
- 2025-01-15 Gdańsk => System Architect (Java background) <=
- 2025-01-15 Żerniki => Specjalista ds. Employer Brandingu <=
- 2025-01-15 Kraków => User Experience Designer <=
- 2025-01-15 CYA: Minister Finansów odbija piłeczkę do PKW :-) [obiektywny brak możliwości wykonania wewnętrznie sprzecznej uchwały]
- 2025-01-15 Gdańsk => Solution Architect (Java background) <=
- 2025-01-15 Zielona Góra => Senior Field Sales (system ERP) <=
- 2025-01-15 Wrocław => Application Security Engineer <=
- 2025-01-15 Warszawa => Architekt rozwiązań (doświadczenie w obszarze Java, AWS
- 2025-01-15 Kraków => Business Development Manager - Dział Sieci i Bezpieczeńst
- 2025-01-15 Białystok => Inżynier Serwisu Sprzętu Medycznego <=
- 2025-01-15 Warszawa => Programista .NET (C#/.NET) <=
- 2025-01-15 Warszawa => Developer Microsoft Dynamics 365 Finance & Operations (D36
- 2025-01-15 Warszawa => Account Manager - Usługi rekrutacyjne <=
- 2025-01-15 serce boli
- 2025-01-14 Seicento vs Szydło, comes back :)