|
Quelle - email <H-Soz-u-Kult>
From: Peter Horvath <100120.2072@compuserve.com> |
Im Rahmen meiner Dissertation, die sich mit der Bedeutung von OnlineDatenbanken fuer die Geschichtswissenschaft beschaeftigt, habe ich das Konzept eines historischen Online-Dienstes, History-Online (HO), entwickelt, das ich im folgenden zur Diskussion stellen moechte. Wer sich fuer meine Dissertation interessiert, der sei zunaechst noch auf das Jahrbuch der historischen Forschung verwiesen, wo die Arbeit kurz vorgestellt wurde. (1) Die Arbeit ist am Fachbereich Geschichte der Universitaet Hamburg zur Begutachtung eingereicht. Ein Ueberblick ueber die historisch relevanten Datenbanken wird demnaechst per WWW veroeffentlicht, so dass ich hier auf eine Auflistung der Datenbanken verzichtet habe.
Seit den sechziger Jahren, als man begann ueber computergestuetzte Dokumentations- und Informationssysteme fuer Historiker nachzudenken, hat sich die Situation grundlegend veraendert. Der PC gehoert mittlerweile zum Alltagswerkzeug, es haben sich weltumspannende Datennetze etabliert und es gibt bereits zahlreiche Datenbanken, die historisch relevante Bereiche abdecken. Rd. 6.000 Datenbanken liegen heute online vor. Als fuer Historiker potentiell nuetzliche Datenbanken lassen sich Datenbanken mit allgemeinen (12%) und interdisziplinaeren (3%) Themen, Datenbanken aus den Bereichen der Sozial- (6%) und Geisteswissenschaften (5%) und aus dem Bereich Nachrichten (5%) identifizieren. In der Summe ergaebe sich ein Potential von 31%. Letztlich haengt es vom Forschungsinteresse und der Herangehensweise ab, welche Datenbanken fuer die Arbeit eines Historikers relevant sind.
Gegenwaertig ist es noch sehr umstaendlich und kostspielig die Datenbanken bei den unterschiedlichen Anbietern abzufragen. Zunaechst einmal muss mit jedem Anbieter ein Vertrag abgeschlossen werden. Es sind je nach Dienst Anmelde-, Monats-, und/oder Jahresgebuehren zusaetzlich zu den Nutzungsgebuehren zu entrichten. Schliesslich hat jeder Anbieter seine eigene Oberflaeche, seine eigene Struktur und seine eigene Abfragesprache.
Die "Historical Abstracts" sind bei DIALOG, der "Verbundkatalog" bei DBI-LINK und "Bibliodata" ist bei STN verfuegbar. Eine wesentliche Vereinfachung und finanzielle Erleichterung waere es bereits, wenn die relevanten Datenbanken ueber einen einzigen Anbieter erreichbar waeren. Verbreitet sind heute bereits Uebergaenge zwischen den verschiedenen Hosts sog. Gateways.
Von ESA-IRS aus lassen sich die Datenbanken von FT Profile abfragen, Genios bietet Uebergaenge zu Juris und CompuServe ermoeglicht die Recherche in Datenbanken von Data-Star. Diese Gateways haben den Vorteil, dass man nur bei einem Host Kunde werden und nicht mit allen anderen Nutzungsvereinbarungen abschliessen muss.
Ein anderes Problem sind die unterschiedlichen Abfragesprachen und Ordnungsprinzipien, in denen man sich zunaechst einmal zurechtfinden muss. Sehr viel leichter waere es, wenn die Datenbanken unter einer einheitlichen Oberflaeche zur Verfuegung gestellt wuerden, so dass man sich nur auf eine einzige Retrievalumgebung einstellen muesste.
Die gegenwaertige Situation ist ausserdem durch ihre Unuebersichtlichkeit gekennzeichnet. Es gibt zahlreiche Online-Datenbanken bei unterschiedlichen Anbietern, darueber hinaus gibt es zahlreiche Datenbanken auf CD-ROM und anderen Datentraegern, die aber nur zum Teil in den Datenbankverzeichnissen erfasst sind. Gales Directory verzeichnete unter dem Stichwort "History" im September 1996 281 Datenbanken, davon waren 67 (24%) online und 172 (61%) auf CD-ROM. IM GUIDE verzeichnete im Mai 1996 unter dem Stichwort "History" 278 Datenbanken, darunter 90 Online-Datenbanken und 164 auf CD-ROM. Allein fuer England dokumentierten Schuerer und Anderson rd. 300 Datensammlungen, die nicht in Datenarchiven erfasst sind, meist nur oertlich vorhanden sind und von denen auch Verzeichnisse wie Gales Directory und IM GUIDE nichts wissen. (2) Dann gibt es eine ausufernde Datenmenge im Internet, alleine 1.700 historisch mehr oder weniger relevante Adressen listet der Index der Universitaet von Kansas auf, und die Tendenz ist steigend. Die Aufgabe besteht darin, einerseits das Informationsproblem zu loesen und gleichzeitig die wachsende chaotische elektronische Bibliothek zu sortieren. Fuer die Geschichtswissenschaft bedeutet das, dass sie dringend ein aktuelles elektronisches Verzeichnis aller relevanter Datenbanken (online und offline), Datenarchive, Datensammlungen und Internet-Adressen braucht.
Die Schaffung einer organisatorisch-juristischen Einheit, die ich im folgenden als "History Online" (HO) bezeichnen werde, koennte dazu beitragen, die oben geschilderten Probleme zu loesen, indem die vorhandenen historisch relevanten Datenbanken unter einer einheitlichen Oberflaeche angeboten werden und dabei das Internet-Angebot integriert wird. Es gibt bereits unterschiedliche Ansaetze, gemeinsame Oberflaechen zu schaffen und ueber die Datenbanken unterschiedlicher Anbieter hinweg zu recherchieren. Telebase Systems Inc. bietet ueber CompuServe den Dienst Iquest an, der die Recherche in rd. 450 Datenbanken unterschiedlicher Online-Dienste, wie z.B. DIALOG, Data-Star, NewsNet, Ovid Online oder Wilsonline, ermoeglicht. Es ist sogar moeglich in mehreren Datenbanken gleichzeitig zu recherchieren. Die Oberflaeche selbst besteht aus einem menuegefuehrten System ohne grafische Elemente, das leicht zu bedienen ist. Realisiert wird das ganze durch ein Rechnersystem, das die Recherche entgegennimmt, danach die Verbindung mit dem jeweiligen Online-Dienst herstellt, die Suchanfrage uebermittelt, das Ergebnis uebernimmt und dann anzeigt. Der Vorteil: man hat Zugriff auf ueber zehn unterschiedliche Online-Dienste, aber muss nicht zehn unterschiedliche Retrievalsprachen erlernen.
Eine Basis fuer die Schaffung einheitlicher Oberflaechen bietet das ANSI/NISO-Protokoll Z39.50. Das Protokoll stellt eine gemeinsame Abfragesprache fuer bibliographische Datenbanken und OPACs zur Verfuegung. Es ermoeglicht das Informationsretrieval in heterogenen Datenbanksystemen und die Uebertragung von Datensaetzen. Dadurch ist es moeglich unter derselben Oberflaeche, unter der man in der oertlichen Bibliothek die Katalogrecherche durchfuehrt, auch andere Online-Datenbanken abzufragen. Dieses Protokoll wird beispielsweise von OCLC unterstuetzt, so dass es sehr leicht moeglich ist, die OCLC Datenbanken in das oertliche OPAC-Retrievalsystem zu integrieren. Das Bibliotheksverbundsystem, das gegenwaertig national als DBV-OSI (Deutscher Bibliotheksverbund - Open Systems Interconnection) und international als ONE (OPAC Network in Europe) aufgebaut wird, bedient sich dieses Protokolls.
Die Hypertext-Benutzeroberflaeche des Internet, das World Wide Web, stellt eine grafische Oberflaeche zur Verfuegung, in die sich Datenbankabfragen ebenfalls leicht integrieren lassen, zum Teil kann man sich hierbei auch die Eigenschaften des Z39.50 Protokolls zunutze machen. Von einem WWW-Server wird dabei die Suchanfrage an den jeweiligen Datenbankserver weiter-"gereicht", dort wird das eigentliche Retrieval durchgefuehrt, die Ergebnisse werden zurueckgegeben und in der gewohnten WWW-Umgebung als HTML-Dokument ausgegeben.
In der letzten Zeit wurden so eine Reihe von thematisch orientierten Angeboten entwickelt, die per Internet zur Verfuegung stehen. Dabei werden eine Reihe von Datenbanken mit speziellen Internet-Angeboten verknuepft. "Ei Village" z.B. ist ein Dienst, der technische Informationen anbietet und den Zugriff auf Datenbanken wie "Compendex*Plus" mit dem strukturierten Angebot von 8.000 Internetadressen verbindet. "KR ScienceBase", ebenfalls im Internet, bietet seit einigen Monaten unter der WWW-Oberflaeche die Datenbanken von DIALOG an, die fuer Naturwissenschaftler relevant sind und verbindet dieses Angebot ebenfalls mit Verweisen auf ausgewaehlte Internetadressen. Chadwyck-Healey, einer der fuehrenden CD-ROM Produzenten aus dem Bereich der Geisteswissenschaften, hat im Dezember 1996 den Online-Dienst "Literature Online" gestartet. Neben dem Zugriff auf Datenbanken wie "Perdiodicals Contents Index" oder "Bibliography of American Literature" ist hier der Zugriff auf komplette Werke der englischen und amerikanischen Literatur moeglich und sind Verknuepfungen zu relevanten Internet-Adressen enthalten. Die Beispiele zeigen, dass es im Zeitalter weltweiter Datennetze und verteilter Systeme nicht noetig ist, Datenbanken physikalisch auf einem Rechnersystem zu installieren; sie koennen sich, vorausgesetzt die Uebertragungsgeschwindigkeiten und die Bandbreiten sind gross genug, irgendwo auf der Welt befinden. Der Host STN besteht heute als ein dezentrales System, Rechenzentren in Japan, den USA und der Bundesrepublik sind so miteinander verbunden, dass es fuer die Recherche voellig unerheblich ist, wo sich die Daten physikalisch befinden. Auch ist STN ein gutes Besipiel dafuer, wie zu einer inhaltlichen Schwerpunktsetzung - Naturwissenschaft, Chemie - , ein internationaler Host aufgebaut werden kann.
Die Schaffung eines historischen Online-Dienstes muss also nicht bedeuten, dass ein neuer Host mit den entsprechend teuren Rechnerkapazitaeten aufgebaut werden muss. Ueber ein System von verteilten Servern kann unter einer einheitlichen Oberflaeche der Zugriff auf die Datenbanken erfolgen, egal wo sie sich physikalisch befinden.
HO ist also in erster Linie Vermittler mit eigener Oberflaeche zwischen dem Endnutzer und den verfuegbaren Ressourcen. HO stellt einerseits den Benutzern die Daten zur Verfuegung, Nutzungsvereinbarungen werden mit HO abgeschlossen und HO uebernimmt das Inkasso. HO schliesst andererseits mit den unterschiedlichen Datenbankanbietern und Hosts die entsprechenden Vertraege ueber die Nutzung der Datenbanken und die Einrichtung von Gateways und sorgt fuer den Betrieb eines per Internet erreichbaren Online-Dienstes. Neben dem Betrieb des Online-Dienstes sollte die Produktion von Datenbanken angeregt oder selbst beauftragt werden, um die Luecken in der Informationsversorgung, die heute existieren, moeglichst schnell zu schliessen. Vordringlich waere der Aufbau eines umfassenden Datenbankverzeichnisses.
Die Entwicklung von HO sollte unter pragmatischen Gesichtspunkten erfolgen, es sollte moeglichst viele der vorhandenen Moeglichkeiten nutzen und in erster Linie durch die Schaffung einer organisatorischen Einheit eine neue Qualitaet der Informationsversorgung gewaehrleisten. Diese Vorgehensweise scheint m.E. die kostenguenstigste und Ressourcen schonenste Vorgehensweise zu sein.
Es hat wenig Sinn ueber die Architektur eines optimalen Systems zu philosophieren und den Anspruch aufzustellen, ein solches System solle umfassend und vollkommen sein. Ein optimales System wird eine gewisse Zeit brauchen, um heranzuwachsen. Es wird nicht dadurch entstehen, dass einige wenige es konzipieren und fertigstellen, sondern dass es in einem Nutzungs- und Diskussionsprozess immer weiter optimiert wird. Letztlich entsteht ein solches System erst durch den Gebrauch, durch die Beduerfnisse derer, die darauf zugreifen und durch die Moeglichkeiten, die zukuenftige Software, Netztechnik usw. bieten werden.Der wichtigste Schritt ist der erste, die Schaffung des Dienstes HO und die Bereitstellung der wesentlichen Datenbanken unter einem "Dach". Damit waere eine organisatorische Struktur geschaffen, auf der dann weiter aufgebaut werden kann. Sie kann dann auch als Katalysator dienen, unterschiedliche Projekte, Ansaetze etc., die heute existieren, zusammenzufuehren, zu vereinheitlichen und damit fuer eine Nutzung leichter zugaenglich zu machen.
Ein solches System wuerde auf der ersten Ebene elektronische Lexika enthalten, die ja bereits heute in umfangreicher Zahl vorliegen; anzustreben ist, dass weitere, vor allem spezielle Hand- und Woerterbuecher hinzukommen. Es wuerden sich dann in einem solchen System nicht nur Enzyklopaedien zu allen Fachgebieten finden, sondern genauso spezielle Hilfsmittel, wie ein Herkunftswoerter"buch" oder ein Woerter"buch" des Mittelhochdeutschen, spezielle Muenzverzeichnisse, das elektronische Gegenstueck zu Meyers Taschenlexikon Geschichte oder die "Medieval and Early Modern Databank".
In HO wuerden auf der zweiten Ebene bibliographische Datenbanken enthalten sein, angefangen bei den Fachbibliographien zur Geschichte, ueber Nationalbibliographien, Bibliotheks- und Verbundkataloge bis hin zu Bibliographien laufender Nachrichten. Die Suche in den Datenbanken sollte miteinander verknuepft werden koennen, so dass man nach Buechern suchen kann und gleichzeitig als Ergebnis der Recherche erfaehrt, welche Rezensionen dazu vorhanden sind und welche davon im Volltext und welche als Referenzen vorliegen. Als Quellen fuer Rezensionen kommen sowohl Fachzeitschriften als auch ausgewaehlte Tages- und Wochenzeitungen, wie in Deutschland z.B. die Frankfurter Allgemeine Zeitung, die Sueddeutsche Zeitung, die Zeit und der Spiegel in Frage, die im Volltext auf Ebene drei vorliegen. Buecher, die bereits digitalisiert worden und im Internet verfuegbar sind, werden ebenfalls in die Recherche integriert. Das System ist mit oertlichen Bibliothekskatalogen, regionalen und ueberregionalen Verbundkatalogen, wie sie z.B. mit den Katalogen von OCLC, RLIN oder DBI-LINK existieren, verbunden, so dass der Standort von Zeitschriften und Buechern, einschliesslich ihrer Signaturen, nachgewiesen wird und eine sofortige Bestellung moeglich ist. Die verzeichneten Aufsaetze sind mit Volltexdatenbanken (Ebene drei ) verknuepft, so dass man den vollstaendigen Artikel sofort erhalten kann. Existiert der Artikel nirgendwo im Volltext, so gibt es ein Verzeichnis mit Lieferanten, bei denen die Aufsaetze direkt online bestellt werden koennen (Ebene sechs).
Die vierte und fuenfte Ebene bilden die Quellen. Die unterschiedlichen Archivverzeichnisse werden in ein solches System integriert werden, die maschinenlesbaren Quellen, die existieren, koennen ueber dieses System direkt abgerufen werden. Hierunter fallen die Bestaende der Text- und Datenarchive genauso wie die Daten zahlreicher Forschungsprojekte, die ihren Weg zur Veroeffentlichung noch nicht gefunden haben, und die Ergebnisse der laufenden Digitaliserungsprojekte. Eine Recherche zu einer Person oder einem Ereignis wuerde einerseits die entsprechenden Archive mit einer detaillierten Beschreibung der Bestaende auflisten und wuerde andererseits die Quellen, die elektronisch vorhanden sind, sofort zur Verfuegung stellen.
Der Aufbau eines solchen Systems wuerde modular erfolgen, d.h. die einzelnen Module, die aus unterschiedlichen Datenbanken bestehen, lassen sich auf allen Ebenen miteinander verknuepfen. Man kann nur in einer Datenbank suchen, in mehreren oder in allen. Man kann nur nach Quellen suchen oder nur nach Artikeln, die im Volltext vorhanden sind. Die schematische Darstellung soll nicht bedeuten, dass Ebene fuer Ebene durchgearbeitet werden muss, um ans Ziel zu kommen. Ausserdem sollen die einzelnen Datenbanken, wie oben bereits in verschiedenen Beispielen erwaehnt, durch Hypertextfunktionen miteinander verknuepft sein. Neben der Schaffung einer einheitlichen Oberflaeche waere durch solch eine Verknuepfungsmoeglichkeit eine weitere Verbesserung der Recherchemoeglichkeiten erreicht. Es soll moeglich sein, aus einem Lexikoneintrag heraus andere Begriffe, Kurzbiographie o.ae. aufzurufen, eine Quelle oder eine Buchrezension. Eine Referenz auf einen zitierten Aufsatz, wie sie in einem Datensatz des Arts & Humanities Index enthalten ist, soll direkt zu der vollstaendigen bibliographischen Information und, sofern vorhanden, dem vollstaendigen Artikel fuehren. Die Suche in den Nachschlagewerken wuerde sich andererseits mit der Suche nach Sekundaerliteratur und mit der Suche nach Quellen verknuepfen lassen, indem naemlich den jeweiligen Artikeln ueber Hypertextfunktionen weiterfuehrende Literatur und Quellen zugeordnet werden, die sich direkt aufrufen lassen.
Ein wesentlicher Mangel traditioneller, gedruckter Publikationen ist ihre fehlende Aktualitaet. Eine Bibliographie z.B. ist kaum erschienen und schon ueberholt. Zwischen der Fertigstellung des Manuskripts und der Herstellung des gedruckten und gebundenen Produkts sind bereits wieder zahlreiche Titel erschienen. Diesem Problem kann man letztlich nur durch eine elektronische Publikation begegnen, die schneller zu aktualisieren, benutzerfreundlicher und preiswerter ist.
Heute bestehen jedoch kaum geeignete Moeglichkeiten, beispielsweise thematische Bibliographien, die nicht so umfassend sind, wie z. B. die Historical Abstracts, als Datenbanken zu publizieren. Hier gibt es gegenwaertig nur die Form des Selbstverlags, bei dem man alle Aufgaben eines Verlags von Produktion, Marketing bis Vertrieb und Inkasso selbst erledigen muss; oder aber man verschenkt seine Arbeit uebers Internet. Die Moeglichkeit, solche Arten von Daten innerhalb von HO zu publizieren, eroeffnen neue Moeglichkeiten. Damit wuerde ein Forum geschaffen, in dem elektronische Produkte publiziert werden koennen. Der Host uebernimmt Marketing, Vertrieb und Inkasso, der Datenproduzent selber brauchte sich keine Sorgen ueber das Copyright zu machen und er wuerde entsprechend der Nutzung seiner Daten finanziell honoriert. Auf diesem Wege faende endlich auch eine Anerkennung der Datenproduktion statt, denn der Gebrauchwert fuer die Nutzer waere gross und sie haetten dadurch wesentlich schneller Zugriff auf eine aktuelle Bibliographie zu einem spezifischen Thema.
Ein historisches Informationssystem koennte ausserdem elektronische Publikationen, wie solche auf CD-ROM, ergaenzen. Durch Kontaktaufnahme mit dem Online-Dienst koennte man aktuelle und ergaenzende Informationen erhalten. Es gibt heute bereits zahlreiche elektronische historische Darstellungen, so z.B. die CD-ROM "Who Built America? From the Centennial Celebration of 1876 to the Great War of 1914". (3) In Verbindung mit einem Online-Dienst koennte Literatur hinzugefuegt werden, die erschienen ist, nachdem die CD-ROM fertiggestellt war. Der Nutzer wuerde die Verbindung mit HO herstellen, die Recherche wuerde durchgefuehrt und die aktuelle Literatur hinzugefuegt. Oder der Nutzer moechte einen der Aufsaetze lesen, auf den verwiesen wird. Er stellt die Verbindung her, die Datenbank mit den Zeitschriften im Volltext wird durchsucht und wenn der Artikel vorhanden ist, auf den PC heruntergeladen. Ist der Artikel elektronisch nicht verfuegbar, kann er ihn bestellen. Moeglich waere ausserdem zu Begriffen, Personen oder Ereignissen, die auf der CD-ROM nicht so ausfuehrlich behandelt werden, weitere Informationen abzurufen. Wenn die Datenuebertragung schnell genug ablaeuft, ist fuer den Nutzer selbst kaum ein Unterschied zwischen den Daten, die er aus dem Netz und denen die er von der CD-ROM holt, auszumachen. Ein Mausklick koennte genuegen, um das digitalisierte Photo einer Person oder eines Ereignisses auf dem Bildschirm zu haben, eine Buchrezension zu lesen oder der Auseinandersetzung zu einem der Themen in einer Wochenzeitschrift, wie dem Spiegel, zu verfolgen.
Die Frage, die sich abschliessend stellt: wie kann ein solches Informationssystem realisiert werden? Zunaechst einmal sollte HO nicht national beschraenkt, sondern international ausgerichtet sein. Initiatoren und organisatorische Traeger koennten internationale historische Fachverbaende, nationale historische Verbaende, Medienunternehmen, Online-Dienste oder Datenproduzenten sein. Das zentrale Problem, das es zu loesen gilt, ist das der Finanzierung; genauer gesagt: der Anschubfinanzierung. Die Benutzung eines solchen Online-Dienstes wuerde ja nicht kostenlos erfolgen, sondern es waeren Gebuehren zu entrichten und HO wuerde nach betriebswirtschaftlichen Kriterien gefuehrt; das Problem der Finanzierung betrifft damit im wesentlichen das Startkapital. Angesichts der Erfahrungen, die die Geschichtswissenschaft in Deutschland mit der Bildungs- und Fachinformationspolitik gesammelt hat, waere ein solches Projekt von vornherein zum Scheitern verurteilt, wenn man es von staatlichen Zuwendungen abhaengig machen wuerde. HO muss sich fuer den Start um eine unabhaengige Mischfinanzierung kuemmern, die aus unterschiedlichen Quellen besteht. Neben staatlichen Geldern (in Form von ein- oder mehrmaligen Zuwendungen und bei vollstaendiger staatlicher Unabhaengigkeit) muss man sich um Gelder von Sponsoren und Stiftungen, historischen Vereinen, Historikern und historisch Interessierten kuemmern. Sinnvoll waere es, Online-Dienste, Datenbankproduzenten und Verlage als Partner fuer dieses Projekt zu gewinnen. Gerade fuer die bestehenden Online-Dienste und die Datenproduzenten wuerde sich dadurch auch ein neuer Markt auftun. Die Produktion von Datenbanken selber koennte ausserdem an den Universitaeten als Bestandteil von Forschung und Lehre erfolgen. HO koennte international eine Sonderstellung als gemeinnuetzige Organisation erhalten, die es auch erlauben wuerde, dass eine enge Anbindung an die Universitaeten erfolgte. Arbeiten, die im Rahmen von Forschung und Lehre erstellt werden, koennten in den Online-Dienst uebernommen werden, ohne dass dadurch besondere Kosten entstehen. Durch die Existenz von HO koennten auf preiswerte Art Daten veroeffentlicht und damit erhebliche Gelder eingespart werden, die heute fuer kostspielige, hoch subventionierter Publikationen aufgebracht werden. Im Gegenzug erhalten Produzenten neben den Nutzungsgebuehren fuer ihre Daten, deutlich verbilligte Zugangsmoeglichkeiten eingeraeumt. Gerade finanziell schlecht ausgestattete Institute haetten damit genauso eine Chance an HO zu partizipieren, wie besser ausgestattete. Die Attraktivitaet eines solchen Systems waere aber keinesfalls auf Historiker beschraenkt; neben einer interessierten Oeffentlichkeit waere es auch fuer Journalisten, Politiker oder Verbandsfunktionaere von Nutzen und haette damit durchaus einen Markt.
Peter Horvath (Peter_Horvath@Compuserve.com)
http://ourworld.compuserve.com/homepages/Peter_Horvath
oder
http://home.t-online.de/home/Peter_Horvath
Copyright ©1996-2002, H-Soz-u-Kult Humanities Sozial- und Kulturgeschichte