Was hindert uns daran, Forschungsdaten zu publizieren?
Sophie G. Einwächter zur wissenschaftskulturellen Rolle von Anerkennung, Zeit und Kompetenz
Im Auftaktbeitrag zur Sonderreihe Forschungsdaten in der Medienwissenschaft haben Dietmar Kammerer und Kai Matuszkiewicz angeregt, über die fachlichen Spezifika und Bedarfe der Medienwissenschaft im Hinblick auf Forschungsdaten und Forschungsdatenmanagement aus dem Fach heraus nachzudenken, diese zu diskutieren und sie zu reflektieren. Die Frage, was Forschungsdaten für die Medienwissenschaft sein können und wie mit diesen umzugehen ist, ist ebenso essentiell, wie Forschungsdatenmanagement als Ausdruck der digitalen Transformation der geisteswissenschaftlichen Praxis unter soziotechnischen Vorzeichen zu verstehen, die die Geisteswissenschaften gegenwärtig in voller Breite erfasst hat. Ziel der Reihe ist es, einen offenen, intrinsisch motivierten Diskurs über medienwissenschaftliche Forschungsdaten zu führen sowie diverse Aspekte dieser umfassenden Thematik zu behandeln. Dabei versteht sich die Reihe als Diskussionsplattform und lädt Interessierte ein, sich im Laufe des kommenden Jahres an der selbigen zu beteiligen.
Die Sonderreihe setzt sich mit einem Beitrag der Medienwissenschaftlerin Sophie G. Einwächter fort, die sich mit der Anerkennung von Forschungsdatenmanagement und den hieraus hervorgehenden Datenpublikationen als eigenständiger wissenschaftlicher Leistung auseinandersetzt. Sie reflektiert und analysiert dies vor dem Hintergrund des etablierten wissenschaftlichen Reputationssystems und geht auf Herausforderungen wie Möglichkeiten ein.
An vielen Universitäten gibt es mittlerweile Referent_innen für Forschungsdaten,1 Stabstellen oder andere Beratungsmöglichkeiten, die uns bei Fragen des Umgangs mit Daten behilflich sind. Auch im Bereich des Ausbaus von Infrastrukturen ist in den vergangenen Jahren Vieles geleistet worden, wovon wir in der Medienwissenschaft nicht zuletzt in Zeiten des pandemischen Forschens und Arbeitens profitiert haben: Repositorien wie media/rep/ oder GenderOpen (hier stellvertretend genannt) sowie Fachinformationsdienste wie adlr.link erleichtern das Auffinden und die Nutzung von fachwissenschaftlicher Literatur wesentlich. Auch Plattformen zum Teilen von Datensätzen wie etwa Zenodo oder das von Lukas Weimer hier jüngst besprochene TextGrid Repository werden – nicht zuletzt aufgrund der verdienstvollen Arbeit des Open-Media-Studies-Blogs – zunehmend bekannter im Fach.
Verbindlich ist die Auseinandersetzung mit Fragen des Forschungsdatenmanagements oder ihrer Publikation in der Medienwissenschaft jedoch keinesfalls.2 Und die Frage, ob man zur Verfügung gestellte Daten anderer nutzen möchte oder willens ist, eigene Datensätze offen bereitzustellen, scheint sehr unterschiedlich beantwortet zu werden. Vieles deutet darauf hin, dass die Geisteswissenschaft – anders als etwa die Naturwissenschaften – ein Verständnis von den eigenen Daten überhaupt erst entwickeln muss und auch deshalb bei der allgemeinen Nutzung und Bereitstellung von Forschungsdaten noch Aufholbedarf hat.3 Wie die erste Online-Diskussion des Forum Medienwissenschaft von NFDI4Culture4 zeigte, gibt es im Fach bislang nur wenig Erfahrung mit Datenpublikation.
Mein Beitrag argumentiert in Anschluss an meine früheren Beobachtungen und Schlussfolgerungen aus dem BMBF-geförderten Pilotprojekt FOKUS, dass es nicht nur materieller, technischer und personeller Ressourcen bedarf, um eine Akzeptanz von Datenpublikationen voranzutreiben, sondern darüber hinaus auch kulturelle und soziale Faktoren wichtige Rollen spielen. Diese betreffen insbesondere a) den (durchaus korrekten) Eindruck von Akteur_innen, dass Kompetenzerwerb und mit diesem verbunden eine Investition an Zeit vonnöten ist, um Daten adäquat aufzubereiten und b) die Schwierigkeit, Datenpublikationen in das etablierte geisteswissenschaftliche Reputationssystem aufzunehmen.
Alte Werte und neue Währungen
Interessieren wir uns für Wissenschaftskultur, so nehmen wir Bräuche und Traditionen in den Blick, übliche Praktiken und weitergegebenes Wissen von Wissenschaftler_innen, geteilte Werte sowie explizite und implizite Regeln, an die sich die Mitglieder einer Disziplin halten.5 Innerhalb dieser besitzen Publikationen einen besonderen Stellenwert, da sie im Zentrum des wissenschaftlichen Alltags in Forschung, Lehre und Vernetzung stehen; zahlreiche Praktiken und Institutionen der Wissenschaft sind mit ihrer Produktion, Distribution und Evaluation befasst.
Publikationen verkörpern wissenschaftliche Werte: Bei ihrer Erstellung und Veröffentlichung gelten Regeln guter wissenschaftlicher Praxis, die Nachvollziehbarkeit des Forschungsprozesses ist zentral. Unlauteres Verhalten kann den Ausschluss aus der Wissenschaftsgemeinschaft bedeuten. Publikationen machen greif- und sichtbar, was eine Person für sich und andere erarbeitet hat, unter Aufbringung großer Mengen von Zeit. Als Manifestationen kulturellen Kapitals im Sinne Bourdieus, ermöglichen sie (bei entsprechender Zirkulation und Rezeption) auch Reputation und Karriere in der Wissenschaft.
«Publikationen sind [...] keinesfalls gleichwertig, vielmehr ist mit verschiedenen Veröffentlichungen je nach Art und Umfang ein unterschiedliches Prestige verbunden».6 Im Zeitalter digitaler Veröffentlichung wird zunehmend relevanter, wie leicht eine Publikation es ihrem Publikum macht, sie aufzufinden und zu zitieren. Teils (wie hier etwa in der Rechtswissenschaft) wird offen dafür geworben, sich Praktiken anzueignen, die der digitalen Aufmerksamkeitsökonomie angepasst sind, etwa «search engine optimization best practices»,7 die sowohl eine Optimierung von Titeln und Abstracts vorsehen, als auch den bewussten Einsatz von Metadaten und durchsuchbaren Dateiformaten.
Neben der Auffindbarkeit stellt die Weiternutzung generierter Daten ein weiteres wissenschaftliches Kapital dar, aus dem Forschende potenziell Gewinn ziehen können. Da Datenpublikationen die Transparenz des Forschungsprozesses und den Nutzen für andere erhöhen sowie über digitale Repositorien meist niedrigschwellig auffindbar sind, ist umso wichtiger, zu überlegen, weshalb beim Teilen von Daten in unserer Disziplin bislang Zurückhaltung geübt wird.
Abwägen und Investitionslogik
Deutungsansätze, weshalb Forschungsdatenpublikationen in der Geisteswissenschaft bislang noch seltene Praxis sind und welche Hürden es zu ihrer Etablierung wissenschaftskulturell zu überwinden gilt, liefern – neben Sarah-Mai Dangs filmwissenschaftlichem Beitrag – zwei Publikationen, auf deren Ergebnisse ich im Folgenden eingehe: Die Studie von Christine Barats u. a. von 2020, Fading Away... The Challenge of Sustainability in Digital Studies, und Open Research Data and Innovative Scholarly Writing: OPERAS highlights von Elisa Nury u. a. aus dem vergangenen Jahr.
Barats u. a. befragten «senior colleagues in the field [of digital studies] who have carried out larger research projects and as such responsible for maintaining and preserving data».8 Von diesen erhielten sie Hinweise darauf, dass der dem Forschungsdatenmanagement und Datenpublikationen zugrundeliegende Nachhaltigkeitsgedanke oft angesichts für wichtiger befundener Aktivitäten in der Forschung zurückgestellt oder auf ein pragmatisches Minimum reduziert wurde. Die resultierende Gegenwartsfixierung («a focus on the ‹here and now› rather than on future uses of research data»),9 wurde von den Akteur_innen mit dem hohen Zeitdruck und der Ergebnisorientierung von Forschung gerechtfertigt.
Die generierten Daten gelten vielen offenbar eher als exklusive Ressource für eigene Projekte, denn als Verpflichtung zur Kooperation mit einer Konkurrenz, welche die eigene Arbeit übertrumpfen könnte: «‹[...]if I put that stuff out there, scholar X is going to take that data and write that next book that I’m not going to right now. Because the incentives of scholarship are what they are, you still have to be careful about what full publication would look like.›»10
Umso wichtiger scheint also der von außen geschaffene Anreiz, dass die Beschäftigung mit Forschungsdaten nun auch von Förderinstitutionen vorausgesetzt wird, und bereits zu Beginn eines Projekts mitgedacht werden soll. Der nachhaltigere Umgang mit erhobenen Daten benötigt frühe Planung und institutionelle Unterstützung der Wissenschaftler_innen durch ihre Heimatinstitutionen und Datenarchiv-Personal – Ressourcen, die auch bei der Beantragung mit berücksichtigt und von den Fördernden entsprechend finanziert werden sollten.11
Tony Becher beschrieb 1989 das Paradox, dass es in der Wissenschaft zwar zentral sei, Neuheiten zu schaffen, aber Neuheiten (insbesondere solchen, die Veränderungen von Gewohnheiten erfordern) eher mit konservativer Haltung begegnet werde. Dies führt Becher darauf zurück, dass Wissenschaftler_innen das Erlernen bestimmter Fähigkeiten als Investition betrachteten, von der sie erwarteten, dass diese sich auszahle:
People who have spent some years [...] building the vocabulary and conceptual structure demanded of a specialism in [certain fields] [...], understandably see themselves as being committed to a sizeable intellectual investment. And as with investments of a more familiar kind, there is a consequent wish to capitalize on them, recouping in collegial credit the efforts spent in laborious endeavour. A new development which threatens seriously to undermine the value of one's existing intellectual shareholding is unlikely to be welcomed with much enthusiasm.12
Dieser Perspektive folgend, kann von etablierten Wissenschaftler_innen, welche in aller Regel die mächtigeren Positionen bekleiden, eine Innovationsblockade ausgehen. Diese gilt es also zu adressieren, wenn eine erwünschte Veränderung nicht allein dem Generationenwechsel überlassen werden soll.
In ihren Interviews mit geisteswissenschaftlichen Akteur_innen (aus Wissenschaft, Bibliotheken, Redaktionen und Verlagswesen), fördern Nury u. a. zutage, dass eine Datenpublikation von vielen als eine zweite, separate Publikation aufgefasst wird, die einer traditionellen Publikationsform unterlegen ist, und somit auch den zusätzlichen Einsatz von Zeit und Anstrengung weniger lohnt.13 Datensets werde dabei vor allem eine geringere Reichweite zugeschrieben als konventionellen, stärker textbasierten, einordnenden und argumentierenden Publikationen. Die Daten selbst interessierten nur diejenigen, die zum gleichen Thema forschten – also die Konkurrenz.14
Fällt die Bereitschaft, Daten zu publizieren, schon gering aus, so gilt dies übrigens auch für das Interesse, Daten zu lesen – zumindest in der befragten Gruppe: Es gebe ohnehin bereits ein Zuviel an Lektüre, das sie und Kolleg_innen bewältigen müssten, und das Eintauchen in einen Zusammenhang auf tieferer Datenebene habe schlichtweg keine Priorität.15
Auch mit Blick auf Begutachtungsprozesse, die zur Anerkennung von Datenpublikationen beitragen könnten, gibt es die Sorge entstehender Zusatzarbeit und zudem einer drohenden Krise des Peer Reviews, wie eine der von Nury u. a. interviewten Personen festhält: «the labour involved in evaluating these things just goes through the roof. And I just don’t think people are going to have time to do that kind of evaluation for every piece of digital scholarship that emerges in the next few years».16 Hier nur als Zeitfrage angesprochen, scheint mir die Situation der Begutachtung von Datenpublikationen in geisteswissenschaftlichen Settings dringlicher noch eine Frage der Kompetenz und Etablierung von Verfahren zu sein. Man stelle sich vor, mit den Schriften für die Prüfung einer Berufbarkeit werde ein veröffentlichter Datensatz als eigenständige Publikation vorgelegt. Für welche Art von Publikation könnte dieser als äquivalent gelten? Einen Aufsatz, eine Monografie? Und welche Kriterien würden hierüber entscheiden? Wer in den jeweiligen Kommissionen wäre aktuell überhaupt in der Lage, den Datensatz vollumfänglich zu begutachten? Diese Probleme lassen sich lösen, durch entsprechende Richtlinien, Weiterbildung und interdisziplinäre Kooperationen, aber sie erfordern unliebsame Umstellung, stellen Etabliertes in Frage, und verlangen vor allem von der zeitlich sehr beanspruchten Professor_innenriege Beschäftigung mit einem Thema, bei dem kein unmittelbarer Reputationsgewinn zu erwarten ist.
Versagensängste und Notwendigkeit von Kooperation
In den Publikationen eher am Rand erwähnt, vielleicht, da bei den Interviewten mit Scham besetzt, ist der Faktor der Angst. In kollegialen Gesprächen und Beobachtungen (auch meiner eigenen Praxis) hat dieser Aspekt häufig eine Rolle gespielt: Sichtbarkeiten schaffen Verletzlichkeit, das gilt auch und insbesondere für Daten, die tiefere Einblicke in Forschungsprozesse bieten und so auch deren Mängel offenbaren und Gesichtsverlust bedeuten könnten. Bei vielen resultiert ein Festhalten an den Daten, das sogenannte data hugging: «Scholars […] must cope with a culture of perfection, and they dare only present data of utmost perfection».17
Der bereits erwähnte Mangel an datenspezifischer Kompetenz unter Geisteswissenschaftler_innen macht Unterstützung durch Externe oder Fachfremde nötig, was sowohl Mehrarbeit im Anbahnen von Kooperationen bedeuten kann, als auch als Kontrollverlust bezüglich der eigenen Forschung aufgefasst werden kann. Weiterbildungen in Forschungsdatenmanagement werden überhaupt erst seit wenigen Jahren an den Universitäten angeboten und von geisteswissenschaftlichen Studiengängen noch keinesfalls flächendeckend wahrgenommen oder gar selbst vermittelt.18 Entsprechend sind Kooperationen gefragt, die teils fest gezogene Gräben zwischen Disziplinen überbrücken müssen:
For those starting a DH-project [Digital Humanities] with rather limited technical or data management skills, the need for support by computer scientists and engineers might be a necessity right from the start of a project. As underlined by a researcher [..]: «Accessing (and processing) data seems increasingly dependent either on researchers learning IT methods that are not part of their initial background and that may be costly to acquire, or on working in conjunction with computer scientists (technicians, engineers or researchers) whose methods and research interests may be significantly different. […]».19
Fazit: Kompetenzen, Zeit und Rituale der Anerkennung
Der Tenor der von Nury u. a. und Barats u. a. geführten Interviews lautet, dass die Befragten sich auf theoretischer Ebene durchaus für Datenarchivierung, -zugang und Publikation aussprachen, sich aber nicht vorstellen konnten, diese mit ihrer wissenschaftlichen Alltagsrealität, die von Zeit- und Mittelknappheit sowie Ergebnisdruck geprägt ist, vereinbaren zu können. Datenpublikation ist für viele allenfalls die Kür, ein ‹nice-to-have›, aber keine primär angestrebte Publikationsform – schon gar keine, die zu erstellen, man im Studium gelernt hat.
Wie in anderen Nachhaltigkeitsdiskursen auch, stellen prekäre Arbeitsverhältnisse, die daraus resultierende Knappheit von Zeit, und zu viele unbekannte Variablen in der Umsetzung ein Problem für die Überzeugungsarbeit dar. Die Investitionslogik ist dabei aus Sicht der Akteur_innen durchaus nachvollziehbar: Wenn die eigentliche Zielgruppe fehlt, eine Datenpublikation die doppelte Arbeit bedeutet, aber nicht entsprechend rezipiert und mit Anerkennung bedacht wird – weshalb sich die Mühe machen?
Die verpflichtenden Vorgaben von Förderinstitutionen sowie Kompetenztrainings und Beratungsangebote sind durchaus geeignet, Datenpublikationen anzuregen. Wissenschaftskulturell können diese Maßnahmen zudem fachspezifisch mit einem positiven Anreizsystem begleitet werden, entlang der hier üblichen Werkzeuge wissenschaftlicher Anerkennung: Rezensionen, Zitationen und Auszeichnungen.
Rezensionen könnten wichtige Vermittlungsarbeit für ein in der Medienwissenschaft noch wenig bekanntes mediales Format leisten: Was ist in dem jeweiligen Datensatz zu finden, für wen ist das Material von Interesse? Anders als bei Buchpublikationen fehlen Verlage als vermittelnde und werbende Instanzen. Weshalb also nicht eine regelmäßige Rezensionssparte für Datenpublikationen beispielsweise in der MEDIENwissenschaft: Rezensionen/Reviews einrichten oder einen Preis für die beste Datenpublikation in der Medienwissenschaft?
Zudem braucht es dringend Aufklärung und Anleitung, wie die Zitation von Datenpublikationen aussehen kann, damit letztere die Anerkennung erfahren, die ihnen zusteht:20 «Promoting a data citation culture would bring research data into the spotlight».21 Solche Kenntnisse könnten bereits im medienwissenschaftlichen Grundstudium als Datenkompetenz (und Teil einer übergeordneten Medienkompetenz, wie etwa Marcus Burkhardt, Katja Grashöfer, Shintaro Miyazaki und Andreas Weich vorschlagen) vermittelt werden, und hier schlicht mit Credit Points incentiviert werden.
Während ich zuletzt vor allem auf extrinsische Motivatoren fokussiert habe, besitzt wissenschaftskulturell natürlich auch ein intrinsischer Faktor große Bedeutung, nämlich der Bezug auf ein geteiltes Wertesystem, das die Nachhaltigkeit von Ressourcen ins Zentrum stellt. Zudem weist Sarah-Mai Dang darauf hin, dass ein (frühes) Teilen von Daten «eine Experimentierkultur [im Fach] und die Akzeptanz von Fehlern und von Unfertigem befördern» kann, sowie «im Idealfall das Bewusstsein, dass Wissen als Prozess zu verstehen ist».22
Wie existenziell sich jedoch die mögliche Öffnung des Forschungsprozesses in Form von geteilten Daten für manche anfühlen mag, hat Simon David Hirsbrunner anschaulich beschrieben, als er von einem «safety space for imprecision» sprach, der hier verloren gehen könnte: «For media scholars, […] switching from closed to open data may be perceived as a heart operation, rattling at the essence of things».
Und so braucht es im Fach nicht zuletzt auch Vorbilder und Erfolgsgeschichten, Botschafter_innen, die zeigen, wie eine Datenpublikation konkret aussehen kann, dass die Publikation von Daten individuell und gemeinschaftlich sinnvoll und ihr Aufwand vertretbar, also zusammengefasst, dass sie machbar ist, und dass sie Wertschätzung erfährt, die in etablierte wissenschaftliche Kapitalformen überführbar ist.
- 1Der Frage, was konkret Forschungsdaten der Medienwissenschaft sein können, widmen sich u.a. mein Blogbeitrag von 2019 sowie Sarah-Mai Dangs Artikel von 2020.
- 2Eine Ausnahme bilden angrenzende Studienangebote in Data Literacy oder Data Studies (wie etwa der Studiengang Cultural Data Studies des Marburg Center for Digital Culture and Infrastructure), bei denen es meist eine Schnittstelle zur Informatik gibt.
- 3«Digital technologies are an indispensable tool for the physical sciences and scientific research but, despite some early pioneering work, take-up in the arts and humanities has been much slower», resümierte Marco Raciti, Projektkoordinator des DARIAH-Anschlussprojekts Humanities at Scale (HaS), welches die digitalen Forschungsinfrastruktur für Kunst- und Geisteswissenschaften in den Jahren 2015-2017 noch stärker für die Nutzbarkeit durch Geisteswissenschaftler_innen optimieren und die geisteswissenschaftliche Community über die Infrastruktur und ihre Möglichkeiten informieren sollte.
- 4Das Forum traf am 30.4.2021 zum ersten Mal in einer digitalen Gesprächsrunde unter Leitung von Malte Hagener (Co-Sprecher von NFDI4Culture) zusammen. Es versteht sich als offene und fortlaufende Initiative, welche die Diskussion über Forschungsdaten im Fach anregen möchte und Wissenschaftler_innen mit konkreten Angeboten seitens NFDI4Culture und media/rep/ zu unterstützen sucht.
- 5Tony Becher: Academic Tribes and Territories. Intellectual Enquiry and the Cultures of Disciplines, Milton Keynes [England], Bristol, PA., USA 1989, 24.
- 6Anja Franz: Symbolischer Tod im wissenschaftlichen Feld, Wiesbaden 2018, 132.
- 7Taryn Marks, Avery Le: Increasing Article Findability Online: The Four Cs of Search Engine Optimization, in: Law Libr. J., Bd. 109 2017, 83–100, hier 83.
- 8Barats u. a.: Fading Away, Abs. 6.
- 9 Ebd., Abs. 6
- 10Informant_in SIBDARIAH07 in Nury u.a.: Open Research Data, 4. Dang erwähnt ebenfalls diesen Aspekt sowie Konkurrenz und das generelle Fehlen von Anreizen, Daten zu teilen (Forschungsdatenmanagement, 134-135).
- 11Myron P Gutmann, Mark Abrahamson, Margaret O Adams, Micah Altman, Caroline Arms, Kenneth Bollen, Michael Carlson, Jonathan Crabtree, Darrell Donakowski, Gary King: From Preserving the Past to Preserving the Future: The Data-PASS Project and the Challenges of Preserving Digital Social Science Data, in: Library Trends, Bd. 57, Nr. 3 2009, 315–337, hier 327.
- 12Becher: Academic tribes, 72.
- 13Nury u.a.: Open Research Data, 5.
- 14Ebd., 4.
- 15Ebd., 3.
- 16Ebd., 4.
- 17Ebd., 5.
- 18Lessons learned: Thesen zur FDM-Kompetenzausbildung: Erkenntnisse aus dem Vernetzungstreffen der vom BMBF geförderten Projekte eeFDM Jena, FDMentor, FOKUS, PODMAN und UniLLAB am 30. und 31. Januar 2019 in Marburg, in: Bausteine Forschungsdatenmanagement, Nr. 1, 4.2020, 8–15, 14f.>
- 19Barats u. a.: Fading Away, Abs. 32.
- 20Die inzwischen über 200 veröffentlichten Arbeitsbiblio- und Filmografien der Medienwissenschaft: Berichte und Papiere werden etwa, wie mir die Herausgeber der Reihe, Ludger Kaczmarek und Hans J. Wulff, anhand von Zugriffszahlen bestätigen, durchaus häufig, teilweise kontinuierlich über zwei Jahrzehnte, aufgerufen, abgefragt und sogar in internationalen Repositorien reproduziert (also augenscheinlich genutzt!). Sie erfahren jedoch selten Erwähnung oder direkte Zitierung in der Primärliteratur. Ein wichtiger Grund ist sicherlich die Unkenntnis des korrekten Umgangs, denn die Verwendung einer Literaturrecherche anderer wird meist nicht im eigentlichen Sinne zitiert. Rubriken wie ‹benutzte Hilfsmittel› als Teil von Literaturverzeichnissen sind (u.a. aus Gründen der Zeichenbegrenzung vieler Publikationen) selten geworden. Die Verwendung müsste also explizit im Text oder mit einer Fußnote transparent gemacht werden. Es ist deshalb leider davon auszugehen, dass sich hier der Unkenntnis (oder der Bequemlichkeit) halber oft einfach ‹bedient› wird.
- 21Nury u.a., 5.
- 22Forschungsdaten, 133.
Bevorzugte Zitationsweise
Die Open-Access-Veröffentlichung erfolgt unter der Creative Commons-Lizenz CC BY-SA 4.0 DE.