Skip to content

Piwik logs manuell löschen

Letzte Woche schrieb ich anlässlich der gerade erschienenen Version 0.6.4 von Piwik über den doch recht hohen Speicherbedarf in der Datenbank.Piwik Logo

Ursache ist, dass Piwik alte Einträge nicht löscht nachdem sie verarbeitet und archiviert wurden. Das Feature ist für die Version 1.0 geplant.
Vorgestern nun ist Version 0.7 erschienen und das Piwik Team hat bei Facebook einen Artikel verlinkt in dem die Version 1.0 in den nächsten zwei Wochen angekündigt wird.
Auf meinen Kommentar dass ich hoffe dass dann auch wirklich das Löschen alter Einträge implementiert ist bekamen ich und ein weiterer Kommentator einen Link in die FAQ in der das manuelle löschen beschrieben ist. Den hatte ich bisher tatsächlich übersehen.

Folgender SQL Befehl löscht die Logeinträge die älter als 30 Tage sind:

DELETE piwik_log_visit, piwik_log_link_visit_action
FROM piwik_log_visit INNER JOIN piwik_log_link_visit_action
WHERE piwik_log_visit.idvisit = piwik_log_link_visit_action.idvisit
AND visit_server_date <= CURRENT_DATE() – 30;
Aber bitte auch den FAQ Eintrag lesen, dort ist beschrieben wie man sicherstellt, dass die Daten auch wirklich schon verarbeitet sind.

Das reduziert die Größe der Datenbank schon um einiges. Nicht so sehr wie ich gehofft hatte, aber auch die verarbeiteten Daten brauchen Platz, man löscht ja nur die redundanten Informationen.
Bei mir hat es heute die Datenbank von 952MB auf 673MB verkleinert. Piwik sammelt hier seit Ende Januar, also ziemlich genau ein halbes Jahr. Ich werde bis zum erscheinen der 1.0 bzw. einer Version die automatisch alte Einträge löscht regelmässig manuell löschen und mal beobachten wie schnell die Datenbank weiter wächst.


Nachtrag: kaum habe ich diese Zeilen geschrieben sehe ich dass Version 0.8 erschienen ist. Es geht wirklich schnel auf die 1.0 zu.

Piwik 0.6.4: hübsches Datenmonster

PiwikGestern ist Version 0.6.4 von Piwik erschienen, der Webseitenstatistik die ich seit Anfang des Jahres auch hier verwende.

Die erste und auffälligste Änderung ist ein neues Design. Das ist auch echt nett geworden.
Der von Christian angekündigte Fehler ist auch bei mir aufgetreten, der Bugfix hat aber auch hier funktioniert. Tipp: einfach die Revision 2620 der AssetManager.php komplett neu herunterladen, das erspart das manuelle patchen.

Auch die neue Version funktioniert gewohnt unauffällig und die neue Optik sieht wirklich gut aus. Die Statistiken des Blogs sind öffentlich unter stats.stdlw.de/piwik/ einsehbar — ist doch wirklich gelungen.Piwik Dashboard

Was ich aber dringend vermisse ist ein Feature das erst auf die Version 1 geschoben wurde: Das löschen alter Daten! Die Daten werden für die Statistiken eh aggregiert, es besteht auch keinen Grund jeden einzelnen Zugriff, das meint jedes Seitenelelment, auf ewig vorzuhalten. Das ist unnötiger Ballast der nur die Datenbank verklumpt.

In Zahlen:
· 1545 Blogbeiträge seit 2004 belegen 29MB in der Datenbank.
· Piwiki hat seit Ende Januar 932MB an Daten gesammelt. — Knapp 1 Gigabyte!

Und leider weiss ich nicht welche Daten ich gefahrlos löschen kann. Die Daten werden für die Statistik aggregiert, die alten Logs sind also theoretisch nicht mehr nötig. Ich weiss aber nicht, ob und wann doch noch auf die Rohdaten zugegriffen wird.

Piwik ist eine echt schönes Tool und ich finde es wesentlich sauberer die Auswertung lokal durchzuführen als dass eine zentrale Stelle wie Google die Daten von millionen Webseiten zusammenführen kann.
Aber die Datenbankgröße muss dringend behoben werden. normal