Direkt zum Inhalt
Open-Media-Studies-Blog

Forschungsdaten in der Medienwissenschaft

Ein Workshopbericht

16.12.2022

Im Auftaktbeitrag zur Sonderreihe Forschungsdaten in der Medienwissenschaft haben Dietmar Kammerer und Kai Matuszkiewicz angeregt, über die fachlichen Spezifika und Bedarfe der Medienwissenschaft im Hinblick auf Forschungsdaten und Forschungsdatenmanagement aus dem Fach heraus nachzudenken, diese zu diskutieren und sie zu reflektieren. Die Frage, was Forschungsdaten für die Medienwissenschaft sein können und wie mit diesen umzugehen ist, ist ebenso essentiell, wie Forschungsdatenmanagement als Ausdruck der digitalen Transformation der geisteswissenschaftlichen Praxis unter soziotechnischen Vorzeichen zu verstehen, die die Geisteswissenschaften gegenwärtig in voller Breite erfasst hat. Ziel der Reihe ist es, einen offenen, intrinsisch motivierten Diskurs über medienwissenschaftliche Forschungsdaten zu führen sowie diverse Aspekte dieser umfassenden Thematik zu behandeln. Dabei versteht sich die Reihe als Diskussionsplattform und lädt Interessierte ein, sich an der selbigen zu beteiligen. Die Sonderreihe setzt sich mit einem Bericht von Kai Matuszkiewicz über einen Workshop des medienwissenschaftlichen Fachrepositoriums media/rep/ in Marburg zum Thema Forschungsdaten und Forschungsdatenmanagement in der Medienwissenschaft fort.

Das medienwissenschaftliche Open-Access-Fachrepositorium media/rep/ besteht seit 2018 als Publikationsrepositorium, das textuelle, auditive und audiovisuelle Veröffentlichungen aus der kulturwissenschaftlichen Medienwissenschaft sowie angrenzenden Disziplinen kostenlos und frei zugänglich macht. Es wird als Kooperation des Instituts für Medienwissenschaft sowie der Universitätsbibliothek der Philipps-Universität Marburg betrieben und seit 2017 von der DFG gefördert. Aktuell wird in enger Abstimmung mit NFDI4Culture ein Forschungsdatenrepositorium für die Medienwissenschaft entwickelt. Vor diesem Hintergrund fand am 21. Oktober 2022 in Marburg ein Workshop zum Thema «Forschungsdaten in der Medienwissenschaft» statt, der von Malte Hagener, Hayriye Kapusuz und Kai Matuszkiewicz organisiert wurde. Es war das Anliegen des Workshops, verschiedene Projekte, Perspektiven und Datenbestände zum Themengebiet zu versammeln und miteinander ins Gespräch zu bringen. Dabei wurden verschiedene medienwissenschaftliche Forschungsgebiete und -gegenstände berücksichtigt, um der Vielfalt medienwissenschaftlicher Forschungsdaten und den sich hieraus ergebenden Bedarfen an das Forschungsdatenmanagement Rechnung zu tragen. Im Anschluss an die Grußworte durch den Projektleiter Malte Hagener sowie die Direktorin der Universitätsbibliothek, Andrea Wolff-Wölk, bot Kai Matuszkiewicz eine kurze thematische Einführung mit seinem Vortrag Medienwissenschaftliche Forschungsdaten und Forschungsdatenrepositorien. Er betonte die Bedeutung von Pilotprojekten für die Entwicklung eines fachlichen Forschungsdatenrepositoriums, da es unerlässlich sei, die Datenbestände des Faches konkret kennenzulernen. Nur so ließe sich ermitteln, welche Daten die Medienwissenschaft erhebe, mit welchen Dateiformaten und Tools sie arbeite und wie diese zu archivieren seien. Ebenso ließe sich nur im Rückgriff auf Einzelfälle klären, wie offen medienwissenschaftliche Forschungsdaten aus rechtlichen oder ethischen Gründen sein dürfen. Neben diesen Pilotprojekten spielen empirische Erhebungen zur Forschungsdatenpraxis in der Medienwissenschaft ebenso eine Rolle wie die fachliche Diskussion über diese. Beide Ansätze könnten aber nicht darüber hinwegtäuschen, dass der direkte Austausch über die Forschungsdatenpraxis ein nicht zu ersetzendes Diskursformat sei. In diesem Sinne wandte sich der Workshop drei Leitfragen zu, die sich vor dem Hintergrund der Pilotprojekte, der Erhebung sowie in fortlaufenden Diskussionen als besonders virulent erwiesen haben. Es geht hierbei, erstens, um die Frage, welche Daten Medienwissenschaftler_innen erheben bzw. mit welchen sie arbeiten und wie. Zweitens stand die Frage im Fokus, welche Rollen Recht, Ethik und digitale Methodik in der medienwissenschaftlichen Forschungsdatenpraxis spielen und drittens galt es zu klären, wie Dateninfrastrukturen beschaffen sein müssen, um den notwendigen Bedarfen zu entsprechen. Hieraus ergaben sich die drei Panels des Workshops – Arbeit an und mit Daten, Soziale Medien und digitale Methoden, sowie Dateninfrastrukturen.

Arbeit an und mit Daten

Im ersten Panel, das von Feng-Mei Heberer (New York) moderiert wurde, stellten zwei filmhistoriographische Projekte ihre Ansätze vor und formulierten, welche Bedarfe sich hieraus für Forschungsdatenrepositorien ergeben. Sarah-Mai Dang und Pauline Junginger (beide Marburg) gaben mit ihrem Vortrag Filmpionierinnen im Zeichen der Digitalisierung – Personenbezogene Forschungsdaten im Kontext feministischer Filmgeschichtsschreibung einen Einblick in die Arbeit der BMBF-Nachwuchsforschungsgruppe DAVIF, die sich mit der digitalen Re/Präsentation von Frauenarbeit im frühen Kino einem Desiderat der Filmwissenschaft zuwendet. Es ist ein Anliegen des Projekts, die bereits existierende Forschung in Form von Forschungsdaten sichtbarer zu machen, wobei ein anwendungsbezogener und praxeologischer Ansatz verfolgt wird, der insbesondere auf Datenvisualisierungen zurückgreift. Hierzu verwendet das Projekt sowohl film- und personenbezogene Daten als auch Texte, Videos und Interviews (als Primär- und als Sekundärdaten). Es wird deutlich, wie essentiell fach- und institutionenübergreifende Kooperationen für derartige Projekte sind; und zwar einerseits mit informatischen Kooperationspartner_innen wie auch andererseits mit Daten zur Verfügung stellenden Initiativen wie dem Women Film Pioneers Project. Dies trage der Rolle interdisziplinärer Expertise Rechnung, die neben der Datenprovenienz und der Tool Literacy für solche Projekte entscheidend sei. Der Umgang mit ambivalenten und vagen Daten in so einem Projekt mache nicht zuletzt die Dokumentation des Forschungsprozesses wichtig und werfe Fragen nach der Langzeitarchivierung der Daten auf. Für das Gelingen von Projekten, so die Referentinnen, sei es wichtig, dass Repositorien und andere Infrastrukturen Angebote für die spezifischen Datenbestände schaffen, fachspezifische Beratung ermöglichen, ein unterstützendes Interface zur Verfügung stellen, die Sichtbarkeit der Daten gewährleisten und mit anderen Infrastrukturprojekten zusammenarbeiten. Yvonne Zimmermann und Friederike Grimm (beide Marburg) machten in ihrem Vortrag Importing Asta Nielsen Database: Forschungsdaten zur Einführung des Starsystems am Fall Asta Nielsen 1910-1914 deutlich, dass Datenbanken sowohl Chance als auch Herausforderung für die datengestützte Forschung sein können. Sie illustrierten Genese, Inhalt sowie Ansatz der Asta Nielsen Datenbank, die seit 2011 kontinuierlich weiterentwickelt wird und gegenwärtig einen Bestand von 16.000 Verleih- und Kinoanzeigen enthält. Eine Herausforderung der Erweiterung und Weiterentwicklung der Datenbank bestehe einerseits darin, diese von einer Anzeigensammlung zu einem Forschungstool auszubauen und sie andererseits dauerhaft zu sichern, um die immensen Arbeitsaufwände die hinter Erstellung und Pflege der Datenbank stecken, zu berücksichtigen. Perspektivisch wäre es wünschenswert, die Daten FAIRer zu machen, sie dazu mit Meta- wie Normdaten anzureichern, eine Georeferenzierung einzuführen und als Linked Open Data zur Verfügung zu stellen. Herausforderungen sind ferner die OCR-Texterkennung von bisher nur als Bilddateien vorliegenden Anzeigen, die Visualisierung von Ergebnisstatistiken, die Zusammenführung und Weiterverarbeitung von Daten und die dauerhafte Zitierbarkeit von Datenbeständen. Gerade durch den letzten Punkt komme Repositorien, durch die Zuweisung von DOIs ebenso eine wichtige Rolle zu wie bei der Langzeitarchivierung der Datenbestände sowie der Förderung der Interoperabilität.

Soziale Medien und digitale Methoden

Das von Christoph Eggersglüß (Marburg) geleitete Panel begann mit dem Vortrag «Historische Technografie des Online-Kommentars». Daten, Werkzeuge und ihre Herausforderungen von Johannes Paßmann (Bochum), Luca Hammer (Siegen) und Martina Schories (Siegen). Als Teil des Siegener SFB 1187 Medien der Kooperation untersucht das Projekt den Wandel von Medienpraktiken am Beispiel des Online-Kommentars. Dabei stehen Updates, Veränderungen und das Wegbrechen von Kommentarfunktionen im Fokus, die mittels eines großen Datenbestandes aus dem Internet Archive durch semiautomatisierte und manuelle Suche, sowie Interviews untersucht wurden. Handlungsleitend ist dabei die Frage, wie sich etablierte journalistische Praktiken durch den Online-Kommentar wandeln. Als «Informationszentrum» des Projekts fungiere eine App, die alle Ansätze zusammenführe. Durch die Arbeit mit hunderttausenden HTML-Seiten entstehen diverse Daten wie Listen und Kontextinformationen zur Forschung und den Interviews, deren Menge es zu reduzieren gelte, um sie visualisieren zu können. Wichtig sei es, sich nicht nur auf Datensätze, sondern auf Prozesse zu konzentrieren. Für Forschungsdatenrepositorien ergeben sich hieraus einige Anforderungen, die es zu berücksichtigen gelte und die neben unterschiedlichen Datentypen (wie Interview-Transkripten oder Seedlisten) auch das Hosten von Code umfassen. Steffen Krämer (Konstanz) stellte in seinem Vortrag Sammlung, Sampling und Analyse von Twitter-Konversationen den Forschungsdatenansatz des Projekts Digitale Öffentlichkeiten und ambivalente Teilhabe vor, das die Reichweitenbeschränkung und Öffentlichkeitsreduktion durch Akteur_innen in sozialen Netzwerken untersucht und dabei z. B. Aufrufe zum Blocken, Stummschalten oder Aufmerksamkeitsentzug näher betrachtet. Neben den technischen Erwägungen der Sammlung von Tweets stehen diverse forschungsethische Überlegungen im Umgang mit sensiblen Datenbeständen wie limitierte Redistribution, Reduktion von Daten oder Zugangsregulation hierbei im Vordergrund. Dies führe letztlich auch dazu, der Dokumentation der Datenerhebung via Flow Charts eine besondere Aufmerksamkeit zu schenken. Ein Repositorium, das derartige Datenbestände aufnehme, müsse nicht nur verschiedene Datentypen wie annotierte Subsamples, Statistiken, Diagramme, Netzwerkgraphen oder Kontextualisierungsmaterialien (wie z. B. Ethik-Voten) archivieren, sondern auch den forschungsethischen Überlegungen durch bestreffende Zugangsregelungen Rechnung tragen. Verena Straub (Dresden) gewährte mit ihrem Vortrag Memes als politische Bildpraxis. Herausforderungen für die bildwissenschaftliche Forschung Einblicke in ihr aktuelles Projekt Bildproteste in den Sozialen Medien, das sich aus qualitativer Sicht mit Ästhetiken und Algorithmen von Bildprotesten befasst. Im Mittelpunkt des Projektes stehen die Darstellung von Protest im Bild, Protest gegen Bilder, Bilder als Instrumente des Protests sowie Eigendynamiken von Bildprotesten. Im Teilprojekt von Verena Straub geht es primär um Memes als Bildprotest sowie Memes als Form der Umdeutung, was sich an Beispielen wie dem Pepper Spraying Cop oder an Z-Memes illustrieren lasse. Aufgrund des ephemeren Charakters mancher Memes spiele das schnelle Auffinden via Scraping oder manueller Suche ebenso eine große Rolle wie deren Sicherung. Für die Arbeit mit diesen Forschungsdaten sind virtuelle Forschungsumgebungen wie HyperImage von zunehmender Bedeutung. Von diesen Forschungsdaten ausgehend sei es technisch gesehen wichtig, dass ein Forschungsdatenrepositorium, das diese Daten aufnimmt, die komplexe Struktur dieser Datensätze adäquat abbilden könne. Ebenso seien urheber- und nutzungsrechtliche Aspekte von Social-Media-Daten zu bedenken wie ethische Erwägungen bei moralisch schwierigem Material (z. B. Gewaltdarstellungen).

Dateninfrastrukturen

Das abschließende Panel wurde von Dietmar Kammerer (Berlin) moderiert und begann mit dem Vortrag Videothek goes virtual. Das Digital-Film-Library-Projekt von Simon Spiegel und Martin Weiss (beide Zürich). In diesem legten die Referenten den Ablauf der Virtualisierung der Videothek der Universität Zürich, die ca. 55.000 Filme umfasst, dar. Sie erläuterten, welche Ermöglichungsbedingungen (u. a. Digitalisierungsschub durch die Corona-Pandemie) derartige Pilotprojekt begünstigen. Anschließend skizzierten sie die Durchführung dieses Pilotprojekts, das sich auf einen etwa 10.000 DVDs umfassenden Teilbestand der Videothek konzentriert und führten aus, welche Bedeutung standardisierte Metadatenformate, Identifier, Linked Open Data und umfassende Suchoptionen bei der Entwicklung von und der Einspeisung in digitale Dateninfrastrukturen einnehmen. Die sich hieraus ergebenden Anforderungen, die dabei entstehenden Datenmengen sowie deren Finanzierung sind Aspekte, die es zu berücksichtigen gelte. Durch den Vortrag wurde aber auch deutlich, dass Dateninfrastrukturen nicht statisch, sondern dynamisch sind, was bedeutet, dass die nächsten bzw. potenziellen Weiterentwicklungen in gewisser Weise mitgedacht werden müssen, auch wenn sie in der aktuellen Entwicklungsphase noch keine Rolle spielen mögen. Dies werde daran ersichtlich, dass man bei der Einspeisung von Daten nicht nur an deren Archivierung denken dürfe, sondern auch weiterführende Möglichkeiten wie computergestützte Analysen bereits andenken solle. Gaia Mosconi (Siegen) stellte in ihrem Vortrag Research-hub. A research infrastructure in the making. From Social Network towards living archive die im Rahmen des INF-Projekts des Siegener SFB 1187 Medien der Kooperation entwickelten Ansätze und Infrastrukturen für Forschungsdaten vor. Hierbei sei eine praktische wie methodische Reflexivität handlungsleitend. Diese zeige, dass Forscher_innen Praktiken nutzen, die von bestehenden Tools nicht ausreichend unterstützt würden, was sich z. B. in bestimmten Metadatenpraktiken aufzeigen lasse. Bei der Entwicklung von Infrastrukturen wie dem Research Hub sei es deshalb bspw. wichtig, eine fortlaufende Metadatenkuration zu berücksichtigen sowie die Unterschiede zwischen verschiedenen Forschungsdatentypen. Eine Herausforderung bestehe darin, dass bisher eher weniger Daten geteilt und Metadaten eher spärlich angelegt würden. Deshalb könne es hilfreich sein, Ansätze zu verfolgen, die Publikationsplattform und Data Stories zur Bewusstmachung zusammenführen. Ein Problem von Dateninfrastrukturen, die in Projektkontexten entwickelt würden, könne schnell darin bestehen, nur auf die lokale Umsetzung abzuzielen und hierdurch eine allgemeinere Übertragbarkeit zu beeinflussen.

Lessons Learned

Resümierend betrachtet, sind Veranstaltungen wie diese geeignete Formate für den diskursiven Austausch, auch wenn sie immer nur ein weiterer Schritt in einem fortlaufenden Diskurs sind. Sie bieten jedoch wichtige Impulse für die folgenden Diskussionen. In diesem Sinne werden im Folgenden einige zentrale Erkenntnisse des Workshops zusammengefasst:

Arbeit an und mit Daten: Die Vorträge wie die hieran anschließenden Diskussionen unterstrichen, welche Bedeutung der FAIRness von Forschungsdaten zukommt, wobei vermehrt auf die Interoperabilität und die Auffindbarkeit abgehoben wurde. Die Diversität der ferner artikulierten Bedarfe wie die Schaffung datenspezifischer Angebote, fachspezifischer Beratungsmöglichkeiten, angemessener Retrodigitalisierungs- und Langzeitarchivierungsstrategien oder der dauerhaften Zitierbarkeit mögen zwar alle erwartbar gewesen sein, unterstreichen aber, dass die Arbeit an und mit medienwissenschaftlichen Forschungsdaten alle Bereiche des Datenlebenszyklus berührt, was dazu führt, dass zu entwickelnde Angebote in diesem Kontext stets in ihrer systemischen Einbindung in diesen gedacht werden müssen und nicht isoliert voneinander betrachtet werden können.

Soziale Medien und digitale Methoden: Der Austausch zu diesem Themenkomplex führte vor Augen, dass der Methodik in der Medienwissenschaft, auch wenn dies bereits immer wieder ausgerufen worden ist, eine veränderte Rolle zukommt. Methodik wird nicht nur wichtiger, sondern speist sich vermehrt auch aus methodischen Importen anderer Disziplinen wie Informatik, Data Science oder den Sozialwissenschaften. Dies manifestiert sich auch darin, dass die Fokussierung auf eine Produktorientierung immer häufiger zugunsten einer Prozessorientierung aufzugeben sei. Daneben spielten aber auch konkrete Fragen eine bedeutsame Rolle: Wie werden unterschiedliche Datentypen, Dateiformate und insbesondere komplex strukturierte Datenbestände gehostet? Welche Anforderungen ergeben sich durch digitale Methoden an die Dokumentation des Forschungsprozesses und welche an die Erhebung und Sicherung von Daten? Welche rechtlichen Aspekte sind in Hinblick auf das Urheber- und Nutzungsrecht oder das Datenschutzrecht zu berücksichtigen? Damit hängen auch forschungsethische Fragen zusammen, die unterschiedliche Zugangsregelungen bedingen und für die eher historisch arbeitenden Forschungsgebiete der Medienwissenschaft etwas abstrakt anmuten mögen.

Dateninfrastrukturen: Die vorgestellten Infrastrukturen demonstrierten, dass die Offenheit von Dateninfrastrukturen im Sinne der Open Science nicht nur deren Prinzipien wie Open Data umfasst, sondern auch das Offensein für die eigene Weiterentwicklung sowie für die Bedarfe, welche sich aus Forschungspraktiken ergeben. Dergestalt wird die Offenheit von Dateninfrastrukturen nicht nur zu einer technischen Frage der Interoperabilität oder zu einer organisatorischen der Kooperation mit anderen Infrastrukturen und Institutionen, sondern zu einer praxeologischen und fachkulturellen Frage. Dies zeigt sich nicht zuletzt daran, dass kooperativ-kollaborative Infrastrukturen auf eine Kultur des Teilens angewiesen seien, welche innerhalb der Fachcommunities aber oftmals noch nicht flächendeckend gegeben ist. Eine Erkenntnis, die in allen Vorträgen und Diskussionen mitschwang, und sowohl implizit als auch explizit verhandelt wurde, ist die, dass ein adäquates Forschungsdatenmanagement für die Medienwissenschaft nur wissenschaftsgetrieben zu erreichen sei. Dadurch wurde ein Pfad angedeutet, den es in den folgenden Diskursen zu verfolgen gilt.

Bevorzugte Zitationsweise

Matuszkiewicz, Kai: Forschungsdaten in der Medienwissenschaft. Ein Workshopbericht. In: Zeitschrift für Medienwissenschaft, ZfM Online, Open-Media-Studies-Blog, , https://zfmedienwissenschaft.de/online/open-media-studies-blog/forschungsdaten-der-medienwissenschaft.

Die Open-Access-Veröffentlichung erfolgt unter der Creative Commons-Lizenz CC BY-SA 4.0 DE.