Ein Logfile ist ein automatisch erstelltes Protokoll, dass alle Aktionen von allen Nutzern auf dem Server beinhaltet. Die Fragestellung bei dieser Analyse ist: Wer macht wann was? Welche Keywords (Suchbegriffe) haben die User eingesetzt? Woher kamen sie, über Suchmaschinen oder andere Webseiten? Welche Browser (Anwenderprogramme) nutzen sie? Wie ist der Status des Servers, kam es z. B. zu Fehlermeldungen und wie viele Daten wurden von dem Server gesendet?
Webalizer ist der Klassiker unter den Analyseprogrammen und wird von nahezu jedem Provider angeboten. Die Grafiken sind anschaulich und zeigen auf den ersten Blick, was man über den Domain-Traffic wissen möchte.
Hier können Sie die Webalizer Informationen als PDF herunterladen
Weitere Möglichkeiten der Analyse sind AWstats und das von Google angebotene Google Analytics. Die wesentlichen Gemeinsamkeiten und Unterschiede dieser drei Möglichkeiten der Website-Analyse bestehen darin, dass
AWstats und Webalizer auf die Server-Protokolle (Logfiles) zugreifen und somit eigentlich nur für den Domaininhaber einsehbar sind. Analytics wird von Google direkt eingesetzt, um das Benutzerverhalten auszuwerten. Google wird somit Mitwisser bezüglich der Auswertung der Zugriff- und Auslastungs-Logdateien.
Webalizer ist im Vergleich zu AWstats im Hinblick auf die Besucher / Visits etwas ungenau. Die Besuche der Suchmaschinen-Bots (Robots, Webcrawler, Spambots, Linkchecker) werden als Besucher mitgezählt.
Die Statistik enthält unter anderem die folgenden Informationen: Anfragen, Dateien, Zahl der aufgerufenen Seiten, Besucher, URL über welche die Besucher auf Ihre Seite gelangt sind etc. Diese Angaben werden graphisch, numerisch und in Textform dargestellt und in verschiedenen Zeitskalen (Stunden, Tage, Monate, Jahre) angegeben.
Unter der URL statistik.domainname.de steht unseren Kunden eine Webalizer Statisitk zur Verfügung.
Nach dem Login gelangen Sie auf die Übersichtsseite.
Die Übersichtsseite zeigt die letzten 12 Monate in graphischer und numerischer Darstellung. Es wird zwischen dem Tagesdurchschnitt und der Monats-Summe unterschieden.
Statistiken älteren Datums werden nicht angezeigt, sind aber zum Beispiel über statistik.domainname.de/usage_200705.html zu erreichen. Jahreszahl und Monat sind beliebig wählbar – bitte einfach manuell anpassen.
Die obere Grafik zeigt die Jahresübersicht. Jeder Balken steht für einen Monat. Die grünen Balken stehen für die Anfragen (Hits), die dunkelblauen für die Dateien, die hellblauen für die Seiten (Pages). Links oben die gelben Balken stehen für die Besuche (Visits) und die orangen für die Rechner (Sites). Die roten Balken rechts unten zeigen die vom Server gesendete Datenmenge in kb (Kilobyte).
Die untere Grafik zeigt in Tabellenform die Zusammenfassung nach Monaten. In der linken Spalte sind die letzten 12 Monate aufgeführt. Rechts daneben die Tagesübersicht und in den rechten Spalten die Summe der Zugriffe und Transfer-Daten der jeweiligen Monate.
Die Anfrage auch Hit ist ein Eintrag in das Logfile. Wenn ein Nutzer Ihre Seite in einem Browser öffnet, sprich eine Anfrage an den Server stellt, erzeugt er einen Eintrag im Logfile. Damit die Seite vollständig angezeigt werden kann (Bilder, Grafiken, Tabellen etc.) stellt der Browser weitere Anfragen an den Server für jede einzelne Datei auf der Seite, die wiederum im Logfile eingetragen werden. Die Anzahl der Anfragen hat also wenig Aussagekraft.
Die meisten Anfragen erfordern, dass der Server etwas an den Client (User) zurückschickt, z. B. die HTML-Seite. Dann wird die Anfrage als Datei gewertet und die Gesamtzahl der Dateien wird aufgezählt. Das Verhältnis von Anfragen und Dateien ist also das Verhältnis von Anfragen an den Server und dessen Antworten. Nicht alle Anfragen erfordern eine Antwort, deshalb ist die Anzahl der Hits oft etwas höher.
HTML-Dokumente und alles was ein HTML-Dokument erzeugt wird als Seite, Page, bezeichnet. Bilder, Grafiken und sonstige Bestandteile einer Seite fallen nicht unter diese Bezeichnung. Derzeit werden die folgenden Endungen als Page gewertet: html, htm, php, cgi. Es ist allerdings von Server zu Server unterschiedlich , was genau als Page definiert wird. Andere Endungen sollten in der Webalizer Konfiguration festgelegt werden, damit die Werte “Seiten/Besucher” in der Statistik korrekt, nicht zu niedrig, ausgegeben werden. Denn nur Abrufe von Seiten kennzeichnen Besucher.
Das Verhältnis sollte Seiten > Besucher sein, je höher desto besser. Bei einem Verhältnis von 1:1 ist die Eingangsseite (Entry-Page) gleich der Ausgangsseite (Exit-Page). Der User sieht sich den Auftritt nicht weiter an.
Bei Seiten, die Frames beinhalten, werden sowohl die einzelnen Frames als auch das Frameset als Pages gezählt. Eine Seite mit 2 Frames erzeugt 3 Page-Impressions in der Statistik. Der angezeigte Wert ist also zu korregieren.
Ein Besuch / Visit ist per Definition die Anforderung einer Seite von einer IP-Adresse. Dabei wird die Zeit berechnet die seit der letzten Anfrage von dieser IP-Adresse vergangen ist. Wenn die Zeitspanne größer als die konfigurierte “visit timeout”-Zeit (30 Minuten) ist, dann wird die Anfrage von dieser IP-Adresse als Besuch vermerkt. Das gilt auch, wenn von dieser IP-Adresse noch nie eine Seite angefordert wurde.
Keine Logfile-Analyse kann genau sagen, wie viele Besuche es tatsächlich gab. Es handelt sich um geschätzte Werte. Das liegt beispielsweise daran, dass Webalizer im Gegensatz zu und AWstats, einem weiteren Programm zur Webserver-Analyse, die Besuche der Suchmaschinen-Bots mitzählt.
Diese Zahlen sollten nicht absolut gesehen werden, interessant ist vor allem der zeitliche Verlauf.
Rechner / Sites sind die unterschiedlichen IP-Adressen, die pro Tag/Monat etwas anfordern. Diese Kennzahl ist nicht zu verwechseln mit den Besuchen. Bsp: Ein User mit einer bestimmten IP-Adresse fordert erstmals am Tag ein HTML-Dokument an und erzeugt so einen Besuch und eine Site. Sieht er sich weitere Seiten an verändern sich diese Kennzahlen nicht. Verlässt er den Auftritt und fordert nach der visit timeout-Zeit erneut ein eine Seite an, dann erzeugt wieder einen Besuch aber keine Site, weil er an diesem Tag mit seiner IP-Adresse bereits registriert wurde.
Die Kennzahl Rechner sollte also kleiner der Besuche sein, muss sie aber nicht, weil für sie die Art der Anforderung ohne Bedeutung ist.
Beispiel: Sie sehen sich eine Seite auf der Domain xyz.de an. Das Bild auf der Seite liegt auf einer anderen Domain, abc.de. Lesen Sie diese Seite erzeugen Sie für xyz.de einen Eintrag unter Besuche und Sites. Für abc.de lediglich unter Sites, weil Sie dort kein HTML-Dokument anfordern. Hat abc.de generell weniger Visits, dann ist der Unterschied in der Statistik deutlich zu sehen.
Das obige Beispiel ist der häufigste Grund für höhere Werte bei Sites als unter Visits. Es werden nur Bilder von einer Webseite geladen, aber keine Seite. Das kann extreme Ausmaße annehmen, wenn diese Bilder in Foren als Avatare verwendet oder in Blogs eingebunden werden. Jedes Mal wenn sich jemand die Seite mit dem Bild ansieht erzeugt er einen Eintrag unter Rechner nicht aber unter Besucher.
Auch Sie selbst können, wenn Sie sich Ihre Webseite sehr oft ansehen, die Statistik verfälschen. In diesem Fall wären die Sites deutlich niedriger als die Visits, weil Ihr Rechner nur ein einziges Mal pro Tag registriert wird.
Dieser Wert zeigt die Datenmenge in Kilobyte an, die im Analysezeitraum vom Server gesendet wurden. Es handelt sich also um das Transfer- oder Übertragungsvolumen. Diese Zahlen werden direkt aus dem Logfile generiert, sind aber zu ungenau, um Aussagen über den tatsächlich ausgehenden Traffic treffen zu können. Auch hier ist der zeitliche Verlauf interessant, z. B. in Bezug auf die aufgerufenen Seiten.
Die Auswertungstabellen erreicht man durch Anklicken des gewünschten Monats. Die Auswertungstabellen zeigen im Detail, die aus dem Logfile gewonnenen Informationen für den gewählten Monat. Um die jeweiligen Tabellen schnell und einfach zu erreichen, benutzen Sie bitte die Menüleiste im oberen Teil der Seite.
Unterhalb dieser Menüleiste sieht man eine Übersicht über die Summen, Durchschnitts- und Maximalwerte der verschiedenen Kenndaten. Die Angaben in dieser Tabelle unterscheiden sich zu denen der Übersichtsseite durch die Angabe der folgenden Kenndaten:
Die Tages-Statistik gibt in grafischer Darstellung und in Form einer Tabelle eine Monats-Übersicht über:
Die Angaben sind nach Kalendertagen geordnet. Sie werden in absoluten Zahlen und in Prozent ausgegeben.
Die Stundenstatistik gibt in grafischer Darstellung und in Form einer Tabelle Monats-Übersicht über:
Die Daten sind nach Tageszeit geordnet und auf den Monat hochgerechnet. Sie werden in absoluten Zahlen und in Prozent ausgegeben.
Die URLs [Verlinkung auf Erklärung unter Monats-Statistik] geben Auskunft welche Dateien auf Ihrem Webhost wie oft aufgerufen wurden. Neben der Anzahl der Anfragen (grün), können Sie hier auch sehen, welches Transfervolumen die Anfragen zur Folge hatten (rot). Wie viele URLs Sie angezeigt bekommen, wird zuvor in der Webalizer Konfiguration festgelegt.
Die Angaben werden in absoluten Zahlen und in Prozent ausgegeben und sind einmal nach der Menge der Anfragen (s. oben) und einmal nach der Datenmenge in kb, die vom Server ausgegeben wurde, s. unten. aufgelistet.
In dieser Zusammenfassung sind die Seiten aufgelistet, die beim jeweiligen Aufruf Ihrer Webseiten zuerst angezeigt werden. Für den User sind sie quasi der Eingang zu Ihren Webseiten. Dabei muss es nicht zwingend die Startseite sein, die er angezeigt bekommt, sobald er Ihren Auftritt “betritt”. Die User können auch über Suchmaschineneinträge auf eine andere Ihrer Seiten gelangen.
Die Angaben sind in Tabellenform dargestellt und werden in absoluten Zahlen und in Prozent ausgegeben. Sie sind absteigend nach Anfragen sortiert.
In dieser Zusammenfassung sind die unterschiedlichen Rechner / Sites aufgelistet, die eine Anfrage an Ihren Webhost gerichtet haben. Der Webhost identifiziert die Rechner über die unterschiedlichen IP-Adressen, in der Tabelle als Rechnernamen (hellblau) aufgeführt.
Die Angaben sind in absoluten Zahlen und in Prozent angegeben und einmal nach der Menge der Anfragen sortiert, die der jeweilige Rechner an den Server gerichtet hat (s. oben) und einmal nach der Datenmenge in kb, die der Server an den jeweiligen Rechner gesendet hat, s. unten.
Hinter den Verweisen verbergen sich die Seiten, von denen aus eine Anfrage an Ihren Server gerichtet wurde. Die Verweise sind wichtig, weil man hier ersehen kann, ob ein Nutzer direkt nach Ihrer Seite gesucht hat (Direct Request), ob er eine Suchmaschine gekommen ist oder von welcher Seite er auf Ihren Auftritt verwiesen wurde. Aus den Verweisen lässt sich auch ein Überblick darüber verschaffen, wie erfolgreich eine Werbekampagne (Bannerwerbung) ist oder wie sich Verlinkungen mit anderen Seiten auswirken. Ein Klick von einer Seite Ihrer Domain zur nächsten gilt ebenfalls als Direct Request.
Kommt ein User über eine Suchmaschine, wie z. B. Google, dann gibt er ein Keyword (Suchbegriff) oder Keyword-Phrasen (hier: Suche) in das Suchfeld der Suchmaschine ein. Webalizer ermittelt diese Keywords aus dem Logfile. Leider ist das nicht bei allen Suchmaschinen möglich, deshalb sind die Angaben und Zahlen in dieser Auswertungstabelle meist unvollständig. Sie geben aber dennoch einen Überblick darüber mit welchen Keywords Ihre Seite erfolgreich in Suchmaschinen gefunden wurde. Dies können Sie z. B. für die Optimierung ihrer Seiten nutzen. Mehr dazu unter Suchmaschinenoptimierung.
Hinweis: Die Anzahl der Einträge ist beim Webalizer systembedingt auf 20 beschränkt. Wenn Sie alle Keywords sehen möchten, benötigen Sie eine andere Analyse-Software, z.B. Awstats.
Diese Tabelle gibt eine Übersicht darüber mit welchen Benutzernamen (hellblau) mit bestimmten Zugriffsrechten wie oft auf zugriffsgeschützte Seiten zugegriffen wurde (grün), wie viele Dateien der Server an den Rechner des Nutzers gesendet hat (blau) sowie die Menge dieser Daten in kb (rot).
Diese Tabelle zeigt mithilfe welcher Browser, nach Häufigkeit sortiert, die Nutzer Ihre Seiten aufgerufen haben. Diese Auswertung ist in sofern von Bedeutung, da verschiedene Browser unterschiedliche HTML- oder Formatierungsanweisungen benötigen, um eine Webseite korrekt anzeigen zu können.
Taucht ein Browser besonders häufig auf, dann können Sie Ihre Homepage besser an die Anforderungen Ihrer Besucher anpassen.