Bildverarbeitung und maschinelles Lernen in den digitalen Geisteswissenschaften

Obschon Text noch immer das primäre Forschungsobjekt der Digital Humanities ist, spielen Bilder seit mindestens zehn Jahren eine immer wichtigere Rolle in der Forschungspraxis. Besonders Ergebnisse aus der digitalen Kunstgeschichte haben dabei gezeigt, dass die Bedeutung der Bilder für die digitalen Geisteswissenschaften über die Digitalisierung und Zugänglichmachung von Kunstwerken in digitalen Datenbanken hinausgeht: Im digitalen Bild treffen sich digitale Geisteswissenschaften und künstliche Intelligenz. Die Möglichkeit der automatisierten Klassifizierung und sogar Produktion von Bildern verweist dabei auf grundsätzliche Fragen beider Disziplinen: Wie repräsentieren selbstlernenden Systeme Realität? Und wie schreiben sich menschliche Vorurteile, Fehleinschätzungen, und Wahrnehmungsweisen in diese Systeme ein?

Diese Fragen versuchen wir im Workshop aus zwei unterschiedlichen Perspektiven heraus zu beleuchten.

In der ersten Woche beschäftigen wir uns mit praktischen Aspekten der Bildverarbeitung. Grundsätzliche Fragen (was ist ein digitales Bild) geben dabei den Ausschlag für die Betrachtung einer ganzen Reihe von Bildverarbeitungssstrategien, die sich in den digitalen Geisteswissenschaften, insbesondere in der digitalen Kunstgeschichte, als zielführend erwiesen haben. Dazu gehören unter anderem: scraping (Herstellung von Bilddatensätzen aus Internetquellen), batch processing (“Säubern” und Ordnen von Bilddatensätzen um ihre maschinelle Verarbeitung zu ermöglichen), feature extraction (automatische Gewinnung von bedeutungstragenden Bildelementen), clustering (visuelle Sortierung und Anordnung von Bildern nach semantischen Kriterien) und classification (automatische Klassifizierung von unbekannten Bildern durch selbstlernende Systeme). Teilnehmerinnen und Teilnehmer werden ermutigt, diese Strategien nicht nur anhand von bereitgestellten Testdatensätzen, sondern auch anhand ihrer persönlichen Forschungsinteressen und dazugehörigen Datensätzen auszuprobieren, die aus allen Bildbereichen stammen können (kulturelles Erbe, Kunstwerke, Fotografien, Archivdokumente, etc.).

Die zweite Woche wird die Möglichkeit zur tiefergehenden historischen und systematischen Kritik von automatisierten Bildverarbeitungsverfahren und selbstlernenden Systemen bieten, insbesondere wo diese als Werkzeugen in den digitalen Geisteswissenschaften zum Einsatz kommen. Anhand von Texten aus unterschiedlichen Disziplinen und Kontexten (FAT-ML – fairness, accountability, and transparency of machine learning, Digitale Kunstgeschichte, Medienwissenschaft, und Wissenschaftsgeschichte) beschäftigen wir uns mit neuesten sozial und politisch relevanten Entwicklungen in diesem Bereich, wie der automatischen Gesichtserkennung.

Eine Teilnahme am Workshop erfordert die Bereitschaft, sich Kenntnisse in der Programmiersprache Python im Laufe des Workshops anzueignen. Bestehende Programmierkenntnisse sind von Vorteil.