| www.Taggesell.de -> Buecher -> Autohaus_im_Internet -> Analysewerkzeuge |
|
|||
Analysewerkzeugevon Dirk TaggesellWer eine Website betreibt, möchte natürlich auch gern wissen, wieviele Surfer die Site besuchen, welche Seiten für die Besucher am interessantesten sind und anderes mehr. Tatsächlich kann man eine Menge interessanter statistischer Daten herausfinden, man muß allerdings auch wissen, wie man die Informationen bewerten muß und welche Informationen man nicht bekommen kann. Oft z.B. möchte die Marketingabteilung wissen, wer sich die firmeneigenen Webseiten ansieht. Sprich: man möchte die User mit Namen und Mailadresse greifbar machen, was gottseidank nicht möglich ist. In meiner Eigenschaft als Webmaster habe ich das jedoch schon oft erklären müssen. Welche Infos können wir auswerten?Die einzige Quelle für statistische Erhebungen ist das Logfile (die Protokolldatei) des Webservers. (Mit einigem Aufwand sind auch andere Tricks zur (Wieder-)Erkennung von Anwendern möglich, was diese allerdings in nicht wenigen Fällen verärgert und somit kontraproduktiv ist) Wenn Sie sich eine Zeile des Logfiles ansehen, erkennen Sie als ersten Parameter den Namen des Internet-Zuganges, an dem sich der Besucher eingeloggt hatte: r-52.munchen.ipdial.viaginterkom.de - - [08/Aug/1999:16:35:34 +0200] "GET http://www.cys.de/index.html HTTP/1.0" 200 401 "http://www.cys.de/deutsch/produkte/botnav.html" "Mozilla/4.61 [en] (WinNT; U)"Nach den zwei Strichen folgen Datum und Uhrzeit des Abrufs der Seite, gefolgt vom Dateinamen der betreffenden Seite ("http://www.cys.de/index.html"). Nach den zwei Zahlen, die Status- bzw. Fehlermeldungen darstellen, folgt der sog. Referer. Damit wird die Webseite bezeichnet, die zuvor angesehen wurde. Als letztes folgt noch die Bezeichnung des Browsers, mit dem der Besucher arbeitet ("Mozilla/4.61..."). Hier handelt es sich um den Netscape Communicator, der sich als Mozilla vorstellt. Sie wissen also die Zeit des Abrufes, die zuvor besuchte Seite, das Browsermodell und den Internetzugang, über den der Besucher kam. Mehr erfahren wir allerdings nicht. Vor allem ist es nicht möglich, einen Besucher zweifelsfrei wiederzuerkennen, da sich bei den großen und kleinen Providern viele Kunden einen Zugang teilen. So wissen wir nur, daß der Besucher zum damaligen Zeitpunkt mit dem Modem Nummer 52 des Münchener Zugangsknotens der VIAG Interkom verbunden war. Interessanter ist bereits die Information über die abgerufene Seite und deren Zeitpunkt. Im Verein mit dem Referer, der die zuvor besuchte Seite beinhaltet, kann man daraus sogenannte Durchklickpfade berechnen. Gewissermaßen die Reihenfolge der Seiten nachvollziehen, welche die Besucher ansehen. Auch erfahren Sie damit, wo die Besucher herkommen (z.B. Suchmaschinen!) und z.B. mit welchen Suchworten sie auf Ihre Website kamen (Die Suchworte sind im URL des Referers enthalten). Genauso einfach läßt sich mit entsprechender Software das Verhältnis einzelner Browsermodelle zur Gesamtzahl der Besucher ermitteln, so daß Sie feststellen werden, daß etwa 40% der Anwender ältere Browser benutzen, die kein DHTML können. Das bedeutet für Sie, daß Ihre Website auch für ältere Browser benutzbar sein sollte. Generell müssen Sie jedoch bei allen diesen Informationen davon ausgehen, daß die Statistiken durch die bei allen Providern installierten Proxies (siehe unten) verfälscht werden. Betrachten Sie also die Auswertungen als Tendenzen und nicht als exakte Werte. Für die Auswertung der Serverlogfiles sind verschiedene Programme auf dem Markt, teilweise sind sie kostenlos (z.B. "analog"), teilweise auch jämmerlich dokumentiert ("analog"). Die schönsten Grafiken erzeugt zweifellos das Windows-Programm "Webtrends", das die Statistiken auf Wunsch gleich als Word-Datei erzeugt. Damit kann man so manche Marketingabteilung beeindrucken. Nicht weniger aussagekräftig sind die Statistiken der anderen Programmpakete. Vielfach werden die statistischen Auswertungen auch vom Provider selbst angeboten und z.B. täglich neu in Form einer HTML-Seite bereitgestellt. Damit hat man am wenigsten Arbeit und ist immer auf dem Laufenden. Wenn Sie Ihre Auswertungen doch lieber selbst erzeugen wollen, wäre als alternative zu Webtrends z.B. das schon erwähnte analog zu nennen, Links zu weiteren Statistikprogrammen finden Sie auf www.mela.de/Unix/log.html. Der ProxyEin Proxy ist ein Zwischenspeicher für Webseiten und funktioniert folgendermaßen: Ein Anwender gibt einen URL ein und bekommt die zugehörige Webseite zu sehen. Dabei beauftragt der Browser des Anwenders (falls in der Browser-Konfiguration ein Proxy eingetragen wurde) den Proxy, ihm die Webseite und die dazugehörigen Bilder zu übermitteln. Der Proxy wird seinerseits die Seite vom Originalserver holen, an den Browser weiterreichen und auf seiner Platte zwischenspeichern. Wenn der nächste Anwender die gleiche Seite anfordert, wird der Proxy nur prüfen, ob auf dem Originalserver inzwischen neuere Versionen der Webseite liegen und falls nicht, einfach die Daten aus seinem Zwischenspeicher an den Browser des Anwenders schicken. Das verfälscht natürlich die Logfiles des Originalservers, da nur der Abruf des ersten Anwenders gezählt wird.
|