Logfile-Analyse als Instrument der Online-Nutzungsmessung

logfile

Foto: xmodulo | Flickr.com

Anfang November findet in Wien die Tagung ›Digital Methods – Innovative Ansätze zur Analyse öffentlicher Kommunikation im Internet‹ der DGPuK-Fachgruppe ›Computervermittelte Kommunikation‹ (CvK) statt. Gemeinsam mit Martin Emmer werde ich dort einen Vortrag über die Möglichkeiten und Herausforderungen der automatisierten Messung individueller Internetnutzung mit Hilfe von Protokolltextdateien halten. Hier das Abstract zum Vortrag.

Im Zuge der Digitalisierung haben sich in den vergangenen zwei Jahrzehnten zahlreiche neue Kommunikationsformen im Internet herausgebildet, deren Vielfalt mit klassischen Befragungsmethoden nur noch unbefriedigend abbildbar ist. Neben dem generellen Problem der Reaktivität von Befragungen stoßen sie vor allem wegen der Schwierigkeit, die zahlreichen Modi der Online-Nutzung im Rahmen vielfältiger hybrider Anwendungen detailliert zu erfragen, schnell an Grenzen. Klassische Beobachtungsverfahren wie zum Beispiel von den Probanden geführte Tagebücher oder die Protokollierung der Nutzung durch anwesende Wissenschaftler können ergänzend hinzugezogen werden, sind jedoch mit ähnlichen Problemen behaftet.

Mit der Logfile-Analyse steht hingegen ein automatisiertes Beobachtungsverfahren zur Verfügung, mit dem sich die Internetnutzung präzise und nur bedingt reaktiv messen lässt. Ausgewertet werden dabei automatisch angelegte Protokolltextdateien, die Anfragen, Posts und Abrufe von Inhalten im Internet in Kennwerten wie IP-Adresse, Datum und Uhrzeit, angefragte URL etc. festhalten. Unterschieden werden können sie anhand des Ortes, an dem sie gespeichert werden: So legen Web- und Application-Server Listen über alle Anfragen an, die sie erreichen; beim Nutzer wird das Surfverhalten lokal auf dem Rechner gespeichert (bspw. über die Verlaufs-Funktion des Webbrowsers); und auch ein ggf. zwischengeschalteter Proxy-Server legt Logfiles für den über ihn geleiteten Datenverkehr an.

Grundsätzlich eignen sich alle diese Dateitypen für sozialwissenschaftliche Untersuchungen, weshalb die Logfile-Analyse seit den 1990er Jahren auch einen festen Platz in den Hand- und Methodenbüchern der Online-Forschung hat (z.B. Fraas et al. 2012, S. 184-187; Welker und Wünsch 2010, S. 500-502). Gleichwohl kommt sie empirisch eher selten zur Anwendung (Welker und Matzat 2008, S. 37-42). Im Vortrag wird aufgezeigt, wie solche Logfiles sinnvoll in der empirischen Kommunikations- bzw. Mediennutzungsforschung eingesetzt werden können. Hierzu wird ein Überblick über die zur Verfügung stehenden Zugänge gegeben und anschließend die Anforderungen an die Aufzeichnung und Analyse der Daten diskutiert.

Die prominenteste Variante ist dabei die serverseitige Logfile-Analyse, die in der angewandten Forschung zur Reichweitenmessung und Media Planung eingesetzt wird, für die es aber auch Beispiele in der wissenschaftlichen Forschung gibt (z.B. Hastall und Knobloch-Westerwick 2012; Höchstötter 2007). Die Erhebung individueller Online-Nutzungsdaten ist damit allerdings nicht möglich, denn die dort anfallenden Nutzungsdaten können nicht konkreten Personen zugeordnet werden (Fisch 2004, S. 20-36). Zur Erfassung individueller Online-Nutzung ist deshalb nur die clientseitige Logfile-Analyse geeignet. Sie wird in der Regel mit Hilfe einer auf den Rechnern der Probanden installierten Software umgesetzt (Welker et al. 2005, S. 197-203). Der Nachteil dieses Vorgehens ist, dass die Programmierung und die Installation einer geeigneten Software auf den Rechnern der Probanden umständlich und zeitaufwändig ist, was die Teilnahmebereitschaft beeinträchtigen und die Reaktivität der Messung wieder erhöhen könnte.

Im Vortrag wird deshalb ein Untersuchungsmodell vorgeschlagen, das mit Hilfe eines Proxy-Servers arbeitet: Hier wird der Internetverkehr umgeleitet und dann zentral und für den Nutzer unauffällig mitprotokolliert (Janetzko 1999, S. 170-171). Dazu muss nur die Software des Servers entsprechend programmiert werden, bei den Nutzern selbst reicht eine einmalige Änderung der Netzwerkumgebung. Ein Beispiel für die Auswertung von Proxy-Logfiles liefert bisher nur Berker (1999), allerdings wurden dort lediglich aggregierte Daten ausgewertet, einzelne Nutzer wurden nicht identifiziert. Die zu diskutierenden Herausforderungen der Analyse von Proxy-Logfiles sind unter anderem die Akquise von Probanden, die Kontrolle der Reaktivität, die Operationalisierung der Internetnutzung durch technische Indikatoren sowie die Einhaltung von datenschutzrechtlichen Vorgaben.

Literatur

Berker, T. (1999). WWW-Nutzung an einer deutschen Hochschule: Computer, Sex und eingeführte Namen. Ergebnisse einer Protokolldateianalyse. In: B. Batinic, A. Werner, L. Gräf, & W. Bandilla (Hrsg.), Online Research. Methoden, Anwendungen und Ergebnisse, (S. 227–243). Göttingen: Hogrefe.

Fisch, M. (2004). Nutzungsmessung im Internet. Erhebung von Akzeptanzdaten deutscher Online-Angebote in der Marktforschung. München: Reinhard Fischer.

Fraas, C., Meier, S., & Pentzold, C. (2012). Online-Kommunikation. Grundlagen, Praxisfelder und Methoden. München: Oldenbourg.

Hastall, M. R., & Knobloch-Westerwick, S. (2012). Verknüpfung von Verhaltensdaten und Befragungsdaten in experimentellen Selektionsstudien. In: W. Loosen, & A. Scholl (Hrsg.), Methodenkombinationen in der Kommunikationswissenschaft. Methodologische Herausforderungen und empirische Praxis (S. 229–245). Köln: Herbert von Halem.

Höchstötter, N. (2007). Suchverhalten im Web – Erhebung, Analyse und Möglichkeiten. Information Wissenschaft und Praxis, 58(3), 135–140.

Janetzko, D. (1999). Statistische Anwendungen im Internet. Daten in Netzumgebungen erheben, auswerten und präsentieren. München: Addison Wesley Longman.

Welker, M., & Matzat, U. (2008). Online-Forschung: Gegenstände, Entwicklung, Institutionalisierung und Ausdifferenzierung eines neuen Forschungszweiges. In: N. Jackob, H. Schoen, & T. Zerback (Hrsg.), Sozialforschung im Internet. Methodologie und Praxis der Online-Befragung (S. 33–48). Wiesbaden: VS Verlag.

Welker, M., & Wünsch, C. (2010). Methoden der Online-Forschung. In: W. Schweiger, & K. Beck (Hrsg.), Handbuch Online-Kommunikation (S. 487–517). Wiesbaden: VS Verlag.

Welker, M., Werner, A., & Scholz, J. (2005). Online-Research. Markt- und Sozialforschung mit dem Internet. Heidelberg: Dpunkt.

Advertisements

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s