ein paar Caching Stats

Ich habe ja vor einigen Tagen auf einen Apache Trafficserver als Cacheserver fürs Blog umgestellt. Eine Folge war u.a. daß WordPress selbst keine validen Stats mehr aufbauen kann, weil alle Anfragen über eine IP vom Cache kommen.

Origin Server                    Hits  Misses Errors
------------------------------------------------------------------------------
marius.bloggt-in-braunschweig.de 5,181 25,040 141

Während WP 25k Anfragen bekommen hat, gab es aber in Wirklichkeit 31k Anfragen in 23h.

Das bedeutet, daß je nach Zusammensetzung der Anfragen WP in den blogeigenen Stats deutlich zu wenig anzeigt. Das ist aber auch eine Erklärung, wieso diese Stats noch bei 140k in 30 Tagen liegen. Es sind halt nicht sooo viele, die die Startseite laden, sondern irgendwelche alten Artikel.

… immer noch in den Charts gern gesehen …

/2017/10/09/politische-kampagnen-aus-dem-tor-netz

ach ja.. schwelg.. der war toll 😀

Bots

Bei Bots sind auch die Alten Linux am Dienstag Programme interessant 😉

XXXXXXXXXXXXX – – [12/Sep/2022:22:47:10 +0200] „GET /2022/05/24/linux-am-dienstag-programm-fuer-den-24-5-2022/ HTTP/1.1“ 200 9140 „-“ „Mozilla/5.0 (compatible; AhrefsBot/7.0; +http://ahrefs.com/robot/)“
XXXXXXXXXXXXX – – [12/Sep/2022:22:47:12 +0200] „GET /2022/05/24/linux-am-dienstag-programm-fuer-den-24-5-2022/?relatedposts=1 HTTP/1.1“ 200 870 „https://marius.bloggt-in-braunschweig.de/2022/05/24/linux-am-dienstag-programm-fuer-den-24-5-2022/“ „Mozilla/5.0 (compatible; AhrefsBot/7.0; +http://ahrefs.com/robot/)“

DuckDuckGo dagegen ist clever:

XXXXXXXXXXX – – [12/Sep/2022:22:01:08 +0200] „GET /2020/12/ HTTP/1.1“ 200 14772 „-“ „‚DuckDuckBot-Https/1.1; (+https://duckduckgo.com/duckduckbot)'“
XXXXXXXXXXX – – [12/Sep/2022:22:03:23 +0200] „GET /2019/12/ HTTP/1.1“ 200 11851 „-“ „‚DuckDuckBot-Https/1.1; (+https://duckduckgo.com/duckduckbot)'“
XXXXXXXXXXX – – [12/Sep/2022:22:05:17 +0200] „GET /2021/12/ HTTP/1.1“ 200 11558 „-“ „‚DuckDuckBot-Https/1.1; (+https://duckduckgo.com/duckduckbot)'“
XXXXXXXXXXX – – [12/Sep/2022:22:08:21 +0200] „GET /2016/12/ HTTP/1.1“ 200 13652 „-“ „‚DuckDuckBot-Https/1.1; (+https://duckduckgo.com/duckduckbot)'“
XXXXXXXXXXX – – [12/Sep/2022:22:10:05 +0200] „GET /2018/12/ HTTP/1.1“ 200 12455 „-“ „‚DuckDuckBot-Https/1.1; (+https://duckduckgo.com/duckduckbot)'“
XXXXXXXXXXX – – [12/Sep/2022:22:11:40 +0200] „GET /2017/12/ HTTP/1.1“ 200 10715 „-“ „‚DuckDuckBot-Https/1.1; (+https://duckduckgo.com/duckduckbot)'“

die indizieren gleich Jahresweise, so ist das DEUTLICH performanter als Google 😀

Kleine Anmerkung zum Apache Trafficserver:

„Proven – Handling over 400TB a day at Yahoo! both as forward and reverse proxies, Apache Traffic Server is battle hardened.“

Jo, eine Hürde mehr zu nehmen, wenn man HTTP Headerfragmentationangriffe durchziehen will 🙂