Digitale Methodik

Im Zentrum der digitalen Methodik des Projektes steht eine Systematisierung und Modellierung der zahlreichen unterschiedlichen Quellentypen des ‚Sturm‘ in einem übergreifenden Datenmodell. Weiterhin werden verschiedene digitale Verfahren aus dem Bereich der Texttechnologien (bspw. die Verarbeitung von OCR-Daten der STURM-Quellen mittels TUSTEP und Methoden des Natural Language Processing) angewendet und weiterentwickelt. Auch Analyseverfahren wie die historische Netzwerkanalyse zu Künstlerinnen und Künstlern und ihren Werken kommen in der Edition zur Anwendung. Einen weiteren Arbeitsschwerpunkt bildet der Einsatz aktueller Webtechnologien für die Erschließung der historischen Quellenbestände sowie die Entwicklung einer webbasierten Forschungsanwendung für den ‚Sturm‘ einschließlich entsprechender technischer Schnittstellen für die freie Nachnutzung der Forschungsdaten in den verschiedenen Forschungscommunities.

Editionsrichtlinien

Informationen zur Implementierung des hier beschriebenen Datenmodells innerhalb von TEI/XML finden sich in den Editionsrichtlinien.

Forschungsdaten

Alle Quellen und Begleittexte der digitalen Edition werden standardkonform entlang der Richtlinien der Text Encoding Initiative erschlossen und mit Meta- und Normdaten versehen. Grundlage für die Transkription der Quellen im Volltext und die semantische Annotation in XML sind die frei verfügbaren Digitalisate des ‚Sturm‘, die in den digitalen Sammlungen der Staatsbibliothek zu Berlin, der Universitätsbibliothek Heidelberg, des Zentralinstituts für Kunstgeschichte und anderer Institutionen vorliegen. Die Edition der Quellen in XML erfolgt dezentral und webbasiert mittels einer für die native XML-Datenbank eXist entwickelten Webanwendung.

Das Projekt verfolgt einen „work in progress“ Ansatz. Dies bedeutet, dass einzelne Quellenkorpora (bspw. ein Briefkorpus oder ein Jahrgang des ‚Sturm‘) vom Projektteam digital bearbeitet und zeitnah veröffentlicht werden. Dies kommt den interessierten Forschungscommunities zugute, da somit ein schneller Zugriff auf eine beständig wachsende Gesamtedition gewährleistet ist. Ein weiterer Vorteil dieses iterativen Vorgehens ist, dass sich somit auch das Forschungsdatenmodell und die benötigten Softwarekomponenten kontinuierlich und in Einklang mit den hinzukommenden Quellen und ihren jeweiligen Spezifika weiterentwickeln können.

Gesamtsystematik

Die Gesamtsystematik der Quellenedition gliedert sich in fünf Abteilungen, in denen die grundlegenden Quellentypen des ‚Sturm‘ ediert werden: die Künstlerbriefe, die Zeitschrift, die Ausstellungskataloge, die Theaterjahrbücher sowie die Schriften und Bücher des ‚Sturm‘. Innerhalb der fünf Abteilungen gelten zwei übergreifende Systematisierungskriterien: eine Gesamtchronologie sowie die Zuordnung von Beiträgen bzw. „Werken“ zu Künstlerinnen und Künstlern des STURM. Durch den Nachweis jeder Person, jedes Ortes und jedes Werkes über einen persistenten Identifikator kann auf die STURM-Quellen über vier Zugänge zentral zugegriffen werden: Zeit, Person, Ort und Kunstwerk. Weiterhin werden mittelfristig drei zusätzliche Quellenzugänge angestrebt: Ereignisse, Körperschaften und Sachbegriffe.

Daneben werden auch die strukturellen Einheiten der Quellen wie beispielsweise ein Brief mit Adresse und Postscriptum, eine Seite, ein Beitrag, eine Abbildung oder die Spalten und Absätze in der Zeitschrift, den Katalogen und Schriften als Ordnungseinheiten aufgefasst und mit persistenten Identifikatoren versehen. Hierdurch ergibt sich eine Gesamtsystematik, innerhalb derer sich alle Text- und Bildeinheiten des ‚Sturm‘ zu den semantischen Ordnungs- und Zugriffsdimensionen von Zeit, Ort, Raum, Kunstwerken, Personen, Körperschaften, Schlagworten und Ereignissen in Beziehung setzen und dauerhaft adressieren lassen. Die Gesamtsystematik lässt sich über die zugewiesenen Identifikatoren schlüssig nachvollziehen. Nachfolgende Tabellen geben hierzu eine Aufschlüsselung.

Persistente Identifikatoren und Permalinks

Alle semantischen und strukturellen Entitäten der STURM-Quellen werden mittels persistenter Identifikatoren dauerhaft referenziert. Die Identifikatoren sind gemäß einer „sprechenden“ Systematik angelegt, die Rückschlüsse auf das jeweilige Stück bzw. die jeweilige referenzierte Entität zulässt. Die Identifikatoren sind Bestandteile der kanonischen URLs (URIs) der Quellenedition. Dies bedeutet, dass der Aufruf einer URI immer zur aktuellen Version einer referenzierten Entität führt.

Beispiel: https://sturm-edition.de/id/Q.01.19140115.FMA.01

Zur Gewährleistung der exakten Zitierfähigkeit der Edition gibt es für jede bezeichnete Entität versionierte Permalinks, über die sich stabil und dauerhaft eine bestimmte Version einer edierten Quelle abrufen lässt:

Version 1: https://sturm-edition.de/id/Q.01.19140115.FMA.01/1
Version 2: https://sturm-edition.de/id/Q.01.19140115.FMA.01/2

Die Identifikatoren der Edition gliedern sich momentan in sieben unterschiedliche Typen, die über den ersten Buchstaben eines Identifikators unterscheidbar sind:

Typen von Identifikatoren

Sigle Typ Beispiel
E Ereignis E.0000001
K Körperschaft K.0000001
L Lemma L.0000001
P Person P.0000001
O Ort O.0000001
Q Quelle Q.0000001
W Werk W.0000001

Quellenidentifikatoren

Die Quellenidentifikatoren orientieren sich an folgendem grundlegenden Schema (optionale Elemente in Winkelklammern):

                            
                                TYP.ABTEILUNG.DATIERUNG.SIGLE.LAUFNUMMER[#][ABSATZ/BILD].[KOLUMNE].[SEITE/FOLIO]
                            
                        

Gemäß dieser Systematik verwendet jede Quellengattung folgende Identifikatoren, um Stücke oder Teile von Stücken zu bezeichnen:

Abteilung I, STURM-Briefe
Typ Beispiel Aufschlüsselung
Brief Q.01.19140115.FMA.01 Abteilung I, 15. Januar 1914, Franz Marc, Laufnummer 1
Briefseite Q.01.19140115.FMA.01#S.177r Abteilung I, 15. Januar 1914, Franz Marc, Laufnummer 1, Blatt 177 recto
Abteilung II, STURM-Zeitschrift
Typ Beispiel Aufschlüsselung
Zeitschrift Q.02.19100310.STZ.01 Abteilung II, 03. März 1910, STURM-Zeitschrift, Laufnummer 1
Beitrag in Zeitschrift Q.02.19100303.KKR.01 Abteilung II, 03. März 1910, Karl Kraus, Laufnummer 1 (Beitrag „Operette“)
Seite in Zeitschrift Q.02.19100303.STZ.01#S.3 Abteilung II, 03. März 1910, STURM-Zeitschrift, Laufnummer 1, Seite 3
Kolumne in Zeitschrift Q.02.19100303.STZ.01#K.2.S.3 Abteilung II, 03. März 1910, STURM-Zeitschrift, Laufnummer 1, Kolumne 2, Seite 3
Absatz auf Seite in Zeitschrift Q.02.19100303.STZ.01#A.3.K.2.S.3 Abteilung II, 03. März 1910, STURM-Zeitschrift, Laufnummer 1, Absatz 3, Kolumne 2, Seite 3
Abbildung in Zeitschrift Q.02.19100421.STZ.01#B.1.K.2-3.S.61 Abteilung II, 21. April 1910, STURM-Zeitschrift, Laufnummer 1, Bild 1, Kolumnen 2-3, Seite 61
Abteilung III, STURM-Kataloge
Typ Beispiel Aufschlüsselung
Katalog Q.03.19130920.STK.01 Abteilung III, 20. September 1913, STURM-Katalog, Laufnummer 1
Textbeitrag in Katalog Q.03.19130920.HWA.01 Abteilung III, 20. September 1913, Beitrag von Herwarth Walden, Laufnummer 1 („Vorrede“)
Werk (Abbildung) in Katalog Q.03.19130920.UBO.01 Abteilung III, 20. September 1913, Umberto Boccini, Laufnummer 1 („Spiralförmige Ausdehnung von Muskeln in Bewegung“)
Seite in Katalog Q.03.19130920.STK.01#S.5 Abteilung III, 20. September 1913, STURM-Katalog, Laufnummer 1, Seite 5
Absatz in Katalog Q.03.19130920.STK.01#A.2.S.7 Abteilung III, 20. September 1913, STURM-Katalog, Laufnummer 1, Absatz 2, Seite 7
Abteilung IV, STURM-Bühne
Typ Beispiel Aufschlüsselung
Theaterjahrbuch Q.04.19180100.STB.01 Abteilung IV, Januar 1918, STURM-Bühne, Laufnummer 1
Beitrag in Theaterjahrbuch Q.04.19180100.LSC.01 Abteilung IV, Januar 1918, Lothar Schreyer, Laufnummer 1 („Die Theaterleiche“)
Seite in Theaterjahrbuch Q.04.19180100.STB.01#S.1 Abteilung IV, Januar 1918, STURM-Bühne, Laufnummer 1, Seite 1
Kolumne in Theaterjahrbuch Q.04.19180100.STB.01#K.2.S.1 Abteilung IV, Januar 1918, STURM-Bühne, Laufnummer 1, Kolumne 2, Seite 1
Absatz in Theaterjahrbuch Q.04.19180100.STB.01#A.16.K.2.S.1 Abteilung IV, Januar 1918, STURM-Bühne, Laufnummer 1, Absatz 16, Kolumne 2, Seite 1
Abteilung V, STURM-Schriften
Typ Beispiel Aufschlüsselung
Schrift Q.05.19140000.AST.01 Abteilung V, 1914, August Stramm, Laufnummer 1 („Die Haidebraut“)
Seite in Schrift Q.05.19140000.STS.01#S.5 Abteilung V, 1914, STURM-Schrift, Laufnummer 1, Seite 5
Absatz in Schrift Q.05.19140000.STS.01#A.3.S.5 Abteilung V, 1914, STURM-Schrift, Laufnummer 1, Absatz 3, Seite 5

Siglen der STURM-Künstlerinnen und -Künstler

Neben dem Zeitstempel beinhalten Identifikatoren, die ein spezifisches Objekt einer Künstlerin oder eines Künstlers (bspw. ein „Werk“, ein Brief, eine Schrift etc.) innerhalb des STURM bezeichnen, eine eindeutige, aus drei Großbuchstaben bestehende Sigle. Dadurch lassen sich alle Objekte des STURM jenseits struktureller (Text-)einheiten chronologisch nach Personen selektieren und filtern. Bei den digitalen Ressourcen des Projektes findet sich eine Übersicht der Siglen der STURM-Künstlerinnen und -Künstler.

Forschungssoftware

Innerhalb des Projektes kommen verschiedene Softwarekomponenten zum Einsatz. Im Bereich der Verarbeitung von Textdaten ist dies vor allem TUSTEP, das Tübinger System von Textverarbeitungs-Programmen. Mit seiner inzwischen 40-jährigen Softwaregeschichte gehört TUSTEP zu den einschlägigen und besonders nachhaltigen Anwendungen im Bereich der Digital Humanities. Die STURM-Edition setzt gemäß Single Source Prinzip vollständig auf XML und die zugehörigen X-Technologien (XQuery, XPath, XSLT). Dazu wurde eine Webapplikation für die native XML-Datenbank eXist entwickelt. Weitere Details sowie Download-Links finden sich in der Software-Dokumentation.

Technische Schnittstellen (APIs) und Nachnutzung

Alle in der STURM-Edition bereitgestellten Forschungsdaten und Texte werden in Einklang mit dem Appell zur Nutzung offener Lizenzen in der Wissenschaft der DFG unter einer Creative Commons Attribution 4.0 International Lizenz (CC-BY 4.0) zur Nachnutzung zur Verfügung gestellt. Die Forschungsdaten können hierbei entweder zusammen mit der Applikation heruntergeladen oder on-the-fly über eine Schnittstelle bezogen werden. Das Personenregister wird weiterhin in Form einer BEACON-Datei zur Verfügung gestellt, die Korrespondenz-Metadaten der STURM-Künstlerbriefe stehen als CMIF zur Verfügung.