Blog-Stats seit Einführung des Trafficcache

Ich hatte ja letztes Jahr einen Apache Trafficserver vor das Blog geschaltet, damit die Aufrufzeit des Blogs besser wird. Das hat auch funktioniert, führte aber in den Statstools der Webseite, dazu, daß weniger angezeigt wird, weil weniger im WordPress ankommt.

Blog-Stats seit Einführung des Trafficcache

Schauen wir doch mal rein, was im März 2023 wirklich gewesen ist… 😀

Die Liste mit den TOP 30 URLS habe ich um Seiten wie Javascript, CSS, FEEDS usw. bereinigt. Da die bei allen Seiten beteiligt sind, ist klar, daß die mehr Aufrüfe als die echten Seiten haben. Daher die komischen Positionen in der TOP-Liste 😉 An Platz ein war die XMLRPC, weil die Hacker die mit Forenspam bombardieren 😀

Der Anfang des Jahres ist seit Bestehen des Blogs eher schwach besetzt, was ein Blick in die letzten 6 Monate bestätigt:

Die Zahlen für April sind logischerweise noch nicht relevant.

Falls Ihr auch ein Cache haben wollt

Gibt es da mehrere Möglichkeiten: Ihr geht zu CloudFlare, zu meiner Firma, oder setzt Euch das Cache selbst auf. Letzteres ist eine tolle Kompetenzübung in Sachen Web, weil Ihr alle den Spaß erfahren werdet, den ich auch hatte 🙂 Da Ihr den ganzen Loggingkram dann selbst bauen müßt, könnte das den einen oder anderen überfordern. Ist echt nicht für jeden was. Zum Auswerten habe ich Webalizer nutzen müssen, weil alle anderen noch komplizierter Anzubinden waren oder gar nicht erst funktioniert hätten.

Den Apache Trafficserver könnt Ihr aus dem Fedora Repo bekommen, oder bei apache.org .

ein paar Caching Stats

Ich habe ja vor einigen Tagen auf einen Apache Trafficserver als Cacheserver fürs Blog umgestellt. Eine Folge war u.a. daß WordPress selbst keine validen Stats mehr aufbauen kann, weil alle Anfragen über eine IP vom Cache kommen.

Origin Server                    Hits  Misses Errors
------------------------------------------------------------------------------
marius.bloggt-in-braunschweig.de 5,181 25,040 141

Während WP 25k Anfragen bekommen hat, gab es aber in Wirklichkeit 31k Anfragen in 23h.

Das bedeutet, daß je nach Zusammensetzung der Anfragen WP in den blogeigenen Stats deutlich zu wenig anzeigt. Das ist aber auch eine Erklärung, wieso diese Stats noch bei 140k in 30 Tagen liegen. Es sind halt nicht sooo viele, die die Startseite laden, sondern irgendwelche alten Artikel.

… immer noch in den Charts gern gesehen …

/2017/10/09/politische-kampagnen-aus-dem-tor-netz

ach ja.. schwelg.. der war toll 😀

Bots

Bei Bots sind auch die Alten Linux am Dienstag Programme interessant 😉

XXXXXXXXXXXXX – – [12/Sep/2022:22:47:10 +0200] „GET /2022/05/24/linux-am-dienstag-programm-fuer-den-24-5-2022/ HTTP/1.1“ 200 9140 „-“ „Mozilla/5.0 (compatible; AhrefsBot/7.0; +http://ahrefs.com/robot/)“
XXXXXXXXXXXXX – – [12/Sep/2022:22:47:12 +0200] „GET /2022/05/24/linux-am-dienstag-programm-fuer-den-24-5-2022/?relatedposts=1 HTTP/1.1“ 200 870 „https://marius.bloggt-in-braunschweig.de/2022/05/24/linux-am-dienstag-programm-fuer-den-24-5-2022/“ „Mozilla/5.0 (compatible; AhrefsBot/7.0; +http://ahrefs.com/robot/)“

DuckDuckGo dagegen ist clever:

XXXXXXXXXXX – – [12/Sep/2022:22:01:08 +0200] „GET /2020/12/ HTTP/1.1“ 200 14772 „-“ „‚DuckDuckBot-Https/1.1; (+https://duckduckgo.com/duckduckbot)'“
XXXXXXXXXXX – – [12/Sep/2022:22:03:23 +0200] „GET /2019/12/ HTTP/1.1“ 200 11851 „-“ „‚DuckDuckBot-Https/1.1; (+https://duckduckgo.com/duckduckbot)'“
XXXXXXXXXXX – – [12/Sep/2022:22:05:17 +0200] „GET /2021/12/ HTTP/1.1“ 200 11558 „-“ „‚DuckDuckBot-Https/1.1; (+https://duckduckgo.com/duckduckbot)'“
XXXXXXXXXXX – – [12/Sep/2022:22:08:21 +0200] „GET /2016/12/ HTTP/1.1“ 200 13652 „-“ „‚DuckDuckBot-Https/1.1; (+https://duckduckgo.com/duckduckbot)'“
XXXXXXXXXXX – – [12/Sep/2022:22:10:05 +0200] „GET /2018/12/ HTTP/1.1“ 200 12455 „-“ „‚DuckDuckBot-Https/1.1; (+https://duckduckgo.com/duckduckbot)'“
XXXXXXXXXXX – – [12/Sep/2022:22:11:40 +0200] „GET /2017/12/ HTTP/1.1“ 200 10715 „-“ „‚DuckDuckBot-Https/1.1; (+https://duckduckgo.com/duckduckbot)'“

die indizieren gleich Jahresweise, so ist das DEUTLICH performanter als Google 😀

Kleine Anmerkung zum Apache Trafficserver:

„Proven – Handling over 400TB a day at Yahoo! both as forward and reverse proxies, Apache Traffic Server is battle hardened.“

Jo, eine Hürde mehr zu nehmen, wenn man HTTP Headerfragmentationangriffe durchziehen will 🙂