Ich habe da mal was für Euch mitgebracht. Für den einen oder anderen Blogger dürfte das interessant sein.
Cache Traffic fürs Blog: November 2022
Ihr wißt ja, daß ich vor einigen Wochen mein Blog hinter ein ATS Cache gestellt habe, weil der Seitenaufbau schon langsam wurde. „WordPress“ und die Begriffe „Klein. Schnell. Effektiv“ gehen echt schon lange nicht mehr zusammen 🙁
Da das Cache von sich aus keine vernünftigen Statistiken produzieren kann, die länger als 24h Stunden sind, habe ich im Oktober selbst was gebaut, daß uns diese Daten erzeugt hat. Immer gegen 23:59 wird die tägliche Cache Statistik ausgewertet.
Datum | Domain | Cached | Uncached |
2022-11-01 | marius.bloggt-in-braunschweig.de | 6.891 | 11.800 |
2022-11-02 | marius.bloggt-in-braunschweig.de | 6.497 | 12.632 |
2022-11-03 | marius.bloggt-in-braunschweig.de | 6.243 | 20.164 |
2022-11-04 | marius.bloggt-in-braunschweig.de | 5.101 | 21.138 |
2022-11-05 | marius.bloggt-in-braunschweig.de | 4.530 | 21.964 |
2022-11-06 | marius.bloggt-in-braunschweig.de | 6.229 | 3.870 |
2022-11-07 | marius.bloggt-in-braunschweig.de | 6.006 | 7.245 |
2022-11-08 | marius.bloggt-in-braunschweig.de | 6.783 | 15.956 |
2022-11-09 | marius.bloggt-in-braunschweig.de | 7.072 | 17.213 |
2022-11-10 | marius.bloggt-in-braunschweig.de | 8.555 | 18.834 |
2022-11-11 | marius.bloggt-in-braunschweig.de | 8.856 | 9.707 |
2022-11-12 | marius.bloggt-in-braunschweig.de | 6.722 | 12.182 |
2022-11-13 | marius.bloggt-in-braunschweig.de | 6.307 | 5.880 |
2022-11-14 | marius.bloggt-in-braunschweig.de | 6.213 | 9.338 |
2022-11-15 | marius.bloggt-in-braunschweig.de | 1.988 | 1.233 |
2022-11-16 | marius.bloggt-in-braunschweig.de | 3.814 | 4.008 |
2022-11-17 | marius.bloggt-in-braunschweig.de | 5.163 | 3.015 |
2022-11-18 | marius.bloggt-in-braunschweig.de | 5.613 | 6.415 |
2022-11-19 | marius.bloggt-in-braunschweig.de | 4.932 | 4.733 |
2022-11-20 | marius.bloggt-in-braunschweig.de | 5.037 | 5.112 |
2022-11-21 | marius.bloggt-in-braunschweig.de | 5.194 | 9.478 |
2022-11-22 | marius.bloggt-in-braunschweig.de | 5.941 | 8.449 |
2022-11-23 | marius.bloggt-in-braunschweig.de | 5.486 | 4.567 |
2022-11-24 | marius.bloggt-in-braunschweig.de | 5.154 | 8.515 |
2022-11-25 | marius.bloggt-in-braunschweig.de | 4.997 | 4.073 |
2022-11-26 | marius.bloggt-in-braunschweig.de | 4.660 | 4.586 |
2022-11-27 | marius.bloggt-in-braunschweig.de | 4.673 | 7.226 |
2022-11-28 | marius.bloggt-in-braunschweig.de | 5.061 | 6.082 |
2022-11-29 | marius.bloggt-in-braunschweig.de | 5.285 | 8.368 |
2022-11-30 | marius.bloggt-in-braunschweig.de | 5.757 | 8.426 |
Summe November | 452.969 | 170.760 | 282.209 |
Jetzt cached so ein Cache natürlich nicht nur PHP Seiten, sondern alles von CSS, JS über GIF bis TXT und HTML.
d.b. ich hatte keine 452.969 Seitenaufrüfe 🙂 Die genaue Zahl läßt sich nur Ahnen, bzw. dafür müßte man die Webserverlogs vom Blog analysieren.
Hauptproblem
es gibt über 1200 Seiten im Blog, die alle die gleichen CSS Dateien haben, und sich ggf. auch JS, PNGs etc. teilen. Diese 1200 Seiten werden auch regelmäßig aufgerufen, sei es durch Google oder weil Menschen da auf interessante Links geklickt haben, auf der Suche nach Lösungen.
Das liegt daran, daß statische Elemente für alle Seiten gleich sind und gecacht werden, was ja der Sinn der Übung war. Da die in allen Seiten drin sind, tauchen die natürlich auch bei ungecachten Webseitenaufrüfen als „gecacht“ auf. d.b. der Anteil der statischen Randelemente wie Css,JS,Png sind in der gecachten Zahl stark überrepräsentiert, in der Zahl der ungecachten aber praktisch nicht vorhanden.
Da nur stark frequentierte Seiten, wie z.B. die Startseite im Blog oder echt gut laufende Artikel, überhaupt gecacht werden, weil die Cachezeit z.Z. bei 30 Minuten liegt, tauchen die übermäßig in der gecachten Zahl auf und sind in der ungecachten Zahl und mit wenigen Aufrüfen enthalten. (Hinweis: die müssen da auftauchen, weil wenn es nicht im Cache ist, muß es ja einmal min. nachgeladen werden, was ein ungecachter Aufruf ist).
Das führt uns dazu, daß die ungecachte Zahl (in der Liste oben: rechts) hauptsächlich die alten Beiträge beinhaltet und die gecachte Zahl alle statischen Inhalte und hauptsächlich die Startseitenaufrufe beinhaltet.
Jetzt könnte man eine statistische Untersuchen machen und feststellen, daß 9/10 gecachten Aufrüfen auf Grafiken etc. gingen. Meint, ~ 17.000 Aufrufe auf die Startseite bleiben da übrig, der Rest steckt in der ungecachten Zahl.
Die setzt sich so zusammen
Für Euch stürze ich mich natürlich in alle Mühen und hab mal die Serverstatistiken bearbeitet. Da das Cache eine eindeutige IP benutzt um auf den Backendserver zuzugreifen, konnte ich alle Zugriffe für November ausfiltern.
Das waren OHNE CSS,javascript,Jpg,Gif,Png : 234.469
Wenn man sich das genauer ansieht, findet man da drin RSS Zugriffe, Suchen nach Tags und Kategorien. Filtern wir die mit aus, bleiben 114.919 reine Seitenaufrufe übrig OHNE die gecachten Startseitenaufrüfe, also fast alles außer „/“ . Wir dürfen annehmen, daß es ein insgesamt mauer November für das Blog war mit ca. 131.000 Abrufen. Da hat das Blog mit knapp 250.000 schon bessere Monate gesehen. Aber, Transparenz bedeutet ja, nicht nur die guten Monate zu zeigen, sondern auch mal weniger gute 😉
Ganz genau bekommt man die Zahlen wegen des Caches nicht mehr zusammen, außer man wertet dauerhaft die Zugrifflogs vom Cache aus, was für eine Statistik Anwendung recht anspruchsvoll sein wird. Vielleicht baue ich da mal was 😉 Ich gehe davon aus, daß der statische Anteil weniger als 9/10 ist, was mehr Seitenzugriffe auf „/“ zur Folge hätte.