Bibliotheksservice-Zentrum (BSZ) Baden-Württemberg // Südwestdeutscher Bibliotheksverbund
Rezension aus:
Informationsmittel für Bibliotheken (IFB) 3(1995) 1

Medline, Knowledge finder


95-1-156
Medline, Knowledge finder - ein benutzerfreundliches Retrieval-System mit elektronischem Bestelldienst von Zeitschriftenaufsätzen
von
Hans-Gerd Happel

Die von der National Library of Medicine vertriebene Datenbank Medline braucht aufgrund ihres großen Verbreitungsgrades im Bibliothekswesen an dieser Stelle nicht näher vorgestellt zu werden. Es sei lediglich daran erinnert, daß von der National Library of Medicine ca. 3.400 medizinische Fachzeitschriften aus über 70 Ländern regelmäßig für die Datenbank ausgewertet werden und daß der MeSH-Thesaurus (Medical Subject Headings) als Erschließungsinstrumentarium den Benutzern neben einer möglichen Freitextsuche bisher von verschiedenen Anbietern auf CD-ROM offeriert wird.[1]

Die Datenbank Medline mit der Suchsoftware Knowledge finder[2] unterscheidet sich von den traditionellen Medline-Angeboten in einem entscheidenden Bereich. Die Retrieval-Software arbeitet neben der Anwendung der Booleschen Suchlogik nach dem Prinzip der Fuzzy set theory, der Theorie der unscharfen Mengen. Die hier zur Anwendung kommende Software baut auf der Erkenntnis der von Zadek in den sechziger Jahren entwickelten Theorie auf, die die Berechnung des Grades der Zugehörigkeit zu einer unscharfen Menge leistet und dem Benutzer ein nach Relevanz geordnetes Retrievalergebnis anzeigt.[3] Für den Benutzer bedeutet der Umgang mit dem Knowledge finder eine optimale Abkehr von dem starren System der Booleschen Operatoren, auf die bei einer Literaturrecherche gänzlich verzichtet werden kann.

Dem Benutzer wird auf einer farbigen, graphisch ansprechenden und übersichtlichen Windows-Oberfläche ein sofort in das Auge springendes großes Freitextfeld offeriert. In dieses Feld können natürlich-sprachige Wörter oder auch ganze Sätze und Fragen eingegeben werden. Mit einem Mausklick auf ein kleines grünes Männchen, dem Search runner, wird die Suche gestartet. Während des Suchprozesses werden die Stoppwörter automatisch aus der Anfrage eliminiert. In der Bildmitte kann der Benutzer in blauer Schrift verfolgen, wie die Software alle eingegebenen Wörter trunkiert und damit eine Suche nach Wortvarianten ermöglicht. Bei unterschiedlichen Schreibweisen (z. B. tumor, tumour) werden alle Schreibweisen bei der Suche mit berücksichtigt. Da der Knowledge finder ein umfangreiches eingebautes Regelwerk anwendet, ist er auch dazu in der Lage, nicht nur Begriffe aus einer Wortfamilie, sondern auch verschiedene linguistische Varianten einer Suchanfrage zu finden (foetus und fetal) und gegenseitig zu substituieren. Der Search progress kann anhand einer Skala auf der Oberfläche oben rechts mitverfolgt werden. Liegt ein Schreibfehler in der Suchanfrage vor, wird der Suchprozeß unterbrochen. Ein Wort-Index erscheint auf der Oberfläche und weist den Benutzer auf die richtige Schreibweise hin. Mit einem Mausklick auf das richtig geschriebene Wort wird die Suche fortgesetzt. Nach dem Ende des Suchvorgangs werden Kurztitel angezeigt, die sich durch einen Mausklick in eine Vollaufnahme mit Abstract verwandeln. Sowohl dreidimensional dargestellte Pfeile als auch die Pfeiltasten der Tastatur ermöglichen das Vor- und Rückwärtsblättern, ein Print- und Save-Icon speichern nach einem Mausklick die gefundenen Dokumente ab und ermöglichen auch einen späteren Ausdruck. Eine Graphik informiert den Benutzer über das Ergebnis seiner Recherche. Auf einen Blick kann anhand einer Relevanzkurve das Ergebnis jeder Recherche abgelesen werden. Hier wird jedes Dokument nach dem Grad der Übereinstimmung mit der Fragestellung gewichtet und in ein Ranking-System nach absteigender Relevanz eingeordnet. Da nun die wichtigsten Dokumente entsprechend der Fragestellung am Anfang stehen, wird es dem Benutzer erspart, lange Listen mit gefundenen Dokumenten durchzusuchen. Bei der Relevanzüberprüfung jedes Dokumentes erhalten gesuchte Wörter, die im Titel stehen, eine Vorrangstellung gegenüber den Wörtern aus den Abstracts. Begriffe aus dem Thesaurus werden gegenüber den Abstractwörtern bevorzugt. Die Major subject headings werden mit den Wörtern aus den Titeln gleichwertig gewichtet. Die Subheadings werden vor den Wörtern im Kontext der Datenbank aus den Abstracts berücksichtigt. Neben den Wortpositionen innerhalb eines Dokumentes wird auch die Häufigkeit des Auftretens innerhalb der gesamten Datenbank berücksichtigt, und zwar invers zu Wiederholungen eines Begriffes im gleichen Dokument. Grundsätzlich wird also davon ausgegangen, daß ein Dokument, in welchem ein gesuchtes Wort wiederholt auftritt, einen höheren Stellenwert erhält als ein solches mit einmaliger Erwähnung. Sehr häufig in der Datenbasis vorkommende Wörter wie diseases oder pain erhalten in Verbindung mit einem seltener vorkommenden Wort geringeres Gewicht, da das seltenere Wort - einem allgemeinen informationstheoretischem Grundsatz gehorchend - eine spezifischere Aussagekraft hat.

Nach jeder Literaturrecherche erhält der Benutzer aufgrund einer Voreinstellung bis zu 100 Dokumente höchstens angezeigt. Wird eine Erhöhung der anzuzeigenden Dokumente gewünscht, kann die Voreinstellung entsprechend variiert werden. Durch die Verschiebung eines Relevanz-Filters ist die Manipulation des Verhältnisses zwischen Recall und Precision möglich. Der Relevanz-Filter ist standardmäßig auf eine Relevanzschwelle von 50 Prozent eingestellt, d. h., daß mindestens die Hälfte der in der Suchanfrage gestellten Begriffe im Titel oder als Major subject heading vorkommen muß, um berücksichtigt zu werden. Eine Verschiebung nach rechts bedeutet mehr Precision und bewirkt entsprechend eine Verringerung des Recalls. Eine Verschiebung nach links bedeutet weniger Precision und einen höheren Recall.

Die Suchergebnisse können vielfältig durch weitere Wahlmöglichkeiten optimiert werden. Unter dem Freitextfeld können der komplette MeSH-Thesaurus und weitere Verzeichnisse, geordnet nach Autorennamen, Indexing dates, Zeitschriftentiteln, Sprachen und formalen Gesichtspunkten (Subject check tags), aufgerufen werden. In diesem Index greift der Knowledge finder wieder teilweise auf Boolesche Prinzipien zurück. Mit Hilfe der Operatoren use only, try to use und don't use können Freitextsuchen weiter gezielt mit einem entsprechenden Mausklick eingeschränkt werden. Der Operator use only entspricht dem Booleschen AND, der Operator don't use dem Booleschen NOT. Der neue Operator try to use ist ein Produkt der probalistischen Logik und bedeutet so viel wie: "Das hätte ich, falls möglich, am liebsten mit berücksichtigt, muß aber nicht zwingend sein, falls es keine Volltreffer gibt." Im Gegensatz zum Booleschen minimal or handelt es sich hier um ein maximal or oder auch hyper or, welches bei der Suche zum Beispiel nach Früchten wie Bananen, Birnen, Ananas und Äpfeln automatisch und vorrangig nach einer möglichst vollen Fruchtschale sucht und möglichst nicht nur eine Frucht als Suchergebnis ausweist.

Unterhalb der Indizes befinden sich noch zwei alternative Möglichkeiten der Spezifizierung (Reviews only, English only), die mit der Maus angekreuzt werden können. Aus der Praxis ist bekannt, daß der Benutzer während der Bearbeitung einer Recherche, insbesondere während der Lektüre der Abstracts, zu weiteren für die Fragestellung wichtigen Suchbegriffen angeregt wird. Der Knowledge finder bietet dem Benutzer an, ein Wort, einen Satz oder auch eine ganze Textpassage aus einem gefundenen Dokument in eine bestehenden Suchanfrage ohne Rechtschreibfehler durch Kennzeichnung mit der Maus zu übernehmen.

In der neuen Version 3.20d7 des Knowledge finders (Beta-Version, welche dem Rezensenten vorlag,) kommen auch die mit dem Umgang der Booleschen Logik vertrauten Experten auf ihre Kosten. Die Fuzzy-Logic kann auf Wunsch ausgeschaltet werden, um nur mit Hilfe der Booleschen Operatoren suchen zu können (Feld im Freitextfeld mit der Möglichkeit der Trunkierung und Klammerung und beliebig komplexer Schachtelung). Neu an dieser Version ist auch, daß die Sortierung der gefundenen Dokumente nach Relevanz durch eine Sortierung nach Aktualität (Recency) ersetzt werden kann.

Der Produzent des Knowledge finder bietet weitere Zusatzsoftware zur Erleichterung der Weiterverarbeitung der gefundenen Dokumente an (Easy order, Library holdings, Aufbau eigener Datenbanken und Bibliographien). Für den bibliothekarischen Bereich sind die Easy-order-Funktion sowie das Library-holdings-Programm von Interesse.[4] Aufgrund von Verträgen des Produzenten mit dem DIMDI und verschiedenen Bibliotheken (bisher: Zentralbibliothek der Medizin, Köln; Bayerische Staatsbibliothek, München; Technische Informationsbibliothek, Hannover) sind die Standorte und Signaturen von zahlreichen der in der Medline-Datenbank ausgewerteten Zeitschriften nachgewiesen. Jedesmal, wenn bei einem Dokument ein Bücherregal auf der Oberfläche links neben der Relevanzgraphik erscheint, kann mit einem Mausklick auf das Bücherregal der Standort der Zeitschrift einer Bibliothek ermittelt werden. Über das Programm Easy order lassen sich dann die vorher abgespeicherten Dokumente direkt in ein elektronisches Bestellformular übertragen, welches über ein Modem an eine der besitzenden Bibliotheken übertragen werden kann. Der Benutzer kann mit seiner Maus ankreuzen, ob er die Bestellung eines Aufsatzes durch eine Postsendung (Eilauftrag, Brief) oder durch eine unverzüglich zu erledigende Faxsendung wünscht. Das Library-holdings-Programm bietet den Bibliotheken auch die Möglichkeit, ihre eigenen Bestände an Zeitschriften dem Benutzer der Medline-Datenbank durch Verzeichnung der lokalen Signaturen in diesem Programm direkt bekanntzumachen.

Kürzlich durchgeführte Untersuchungen haben gezeigt, daß der Umgang der Benutzer mit dem MeSH-Thesaurus problematisch ist. Die Differenzierungen zwischen MeSH, Entry term, Non-MeSH-heading, Major subject heading, Minor subject heading, Subheading, Floating subheading, Tree down und MeSH explosion sind einer Großzahl der Benutzer nicht bekannt. Die Folge ist ein fehlerhafter Umgang mit dem MeSH-Thesaurus.[5] Der Knowledge finder bietet hier dem Benutzer durch die Einbeziehung des MeSH-Thesaurus in einer natürlich-sprachlich formulierten Suche eine Hilfestellung an. Die Boolesche Logik unterscheidet ein Retrieval-Ergebnis lediglich in "wahrscheinlich relevante Dokumente (= Treffermenge) und wahrscheinlich irrelevante Dokumente (= Rest)",[6] der Knowledge finder berücksichtigt mit Hilfe der probalistischen Suchlogik, durch die Gewichtung der einzelnen Dokumente und Suchbegriffe (probalistisches Ranking), durch seine automatisierte Wortvariantensuche und durch die Anzeige auch von wahrscheinlich weniger relevanten Dokumenten das Umfeld einer Fragestellung. In zahlreichen Fällen zeigt er zusätzlich noch weitere relevante Dokumente an, die nach den strengen Booleschen Regeln nicht gefunden worden wären.

Trotz des Lobes auf die hier angewandte probalistische Logik sollte man auf die Boolesche Logik nicht verzichten. Bei manchen Fragestellungen mit sehr konkreten Sachverhalten ziehen vor allem geübte Benutzer und Experten die Anwendung der Booleschen Logik vor. Der Knowledge finder ermöglicht dem Benutzer die Anwendung beider Alternativen einschließlich ihrer Kombination.

Es sei an dieser Stelle noch erwähnt, daß die Datenbank Medline, Knowledge finder in einer komprimierten Form auf CD-ROM gepreßt wurde. So sind die letzten fünf Jahrgänge auf lediglich zwei CD-ROMs erhältlich, wobei die Daten mit einem Einzel-CD-ROM-Laufwerk gelesen werden können. Die vollständige Datenbank Medline seit 1966 ist auf insgesamt sieben CD-ROMs reduziert worden. Der Knowledge finder kann unter DOS, Windows und Macintosh mit gleichartiger Programm-Funktionalität betrieben werden.

Seit der Knowledge finder im Sommer 1994 in der Benutzungsabteilung der Universität Witten/Herdecke eingesetzt wurde, läßt sich ein deutlicher Rückgang an Fragen der Benutzer gegenüber der Auskunft verzeichnen. Diese Feststellung gilt sowohl für die Studenten als auch für die Mitarbeiter und Dozenten der Universität. Die Umstellung auf das Knowledge finder-System ist eindeutig von allen Benutzergruppen begrüßt worden.

Der bestechend einfache Umgang mit der Retrieval-Software, die übersichtliche, graphisch ansprechende Gestaltung der Oberfläche des Knowledge finder, das Angebot des Online-Orderings der recherchierten Dokumente sowie die hier gebotene Kombination von probalistischer und Boolescher Logik charakterisieren den Knowledge finder als ein durchdachtes, offenes und modulares System auf dem Gebiet des medizinischen Information-Retrievals, welches auch für andere Bereiche wie etwa für die OPACs in unseren Bibliotheken wichtige Anregungen vermitteln könnte.


[1]
Medline in acht CD-ROM-Varianten / Gerhard Schmitz-Veltin. // In: CD-ROM : Technische Grundlagen und Anwendungen in Katalogisierung, Erwerbung und Benutzung. Referate einer Fortbildungsveranstaltung vom 19. bis 22. 04. 1988 der Bibliothek der Universität Konstanz in Zusammenarbeit mit dem Deutschen Bibliotheksinstitut / hrsg. von Wilfried Lehmler und Heiner Schnelling. - Berlin : Deutsches Bibliotheksinstitut, 1988. - (DBI-Materialien ; 79), S. 175 - 206. (zurück)
[2]
MEDLINE, Knowledge finder : unabridged MEDLINE ; citations with abstracts, ... MeSH thesaurus / database comp. by ... National Library of Medicine. Database prep. and publ. by Aries Systems Corporation. - North Andover, MA : Aries Systems Corporation. - (Nova-Idea, Bergisch-Gladbacher Str. 978, 51069 Köln; Fax: 0221/9685099) [2553]
1992/94 (1994). - 1 CD-ROM + User manual (version 3.0). - DM 1995.00 (Abonnement 1994, viertelj. update, 3 Jg.) (zurück)
[3]
Fuzzy Logic : Einführung und Leitfaden zur praktischen Anwendung ; mit Fuzzy-Shell in C++. - Bonn [u.a.], 1993, S. 2 - 3. - Einführung in Fuzzy-Logik : Fortschritt durch Unschärfe / Ulrich Schulte. - München, 1993, S. 5; 15; 16; 188. (zurück)
[4]
Leistung von CD-ROM-Systemen für Bibliotheken gestern, heute und morgen / Lyndon Holmes ; Yvo van Wezemael ; Peter Ahrens. // In: CD-ROM-Netze in Bibliotheken : Internationales Kolloquium, Bielefeld 18./19. Februar 1992. - Frankfurt a.M., 1992, S. 113. - Hülsbusch, Werner: Fachinformation auf optischen Speichern : Kontexte, Technologie und Anwendungspotentiale einer innovativen Publikationsform ; eine informationswissenschaftliche Studie / Werner Hülsbusch. - Konstanz, 1992, S. 287.
Endnutzerrecherchen in der CD-ROM-Datenbank Medline / Karl-Franz Kaltenborn. // In: Nachrichten für Dokumentation. - 42 (1991), S. 107 - 114; 177 - 190, insbes. S. 107; 178; 181 - 182. - Fuzzy logic : is it a better bibliographic retrieval method for end-users? / Peter Ahrens. // In: Resource sharing : new technologies as a must for universal availability of information ; 16th International Essen Symposium, 18. October - 21. October 1993 ; Festschrift in honor of Hans-Peter Geh / ed.: Ahmed H. Helal ; Joachim W. Wiess. - Essen, 1994. - (Publications of Essen University Library ; 17), S. 221 - 236, bes. S. 221 - 222. - An examination of the effects of non-Boolean enhancements to an information retrieval system / Prudence W. Dalrymple ; René Cox. // In: Proceedings of the 13. National Online Meeting. - New York, 1992, S. 75 - 81, hier S. 75. - A comparison of retrieval effectiveness for three methods of indexing medical literature / William R. Hersh ; David H. Hickam. // In: American journal of the medical sciences.- 303 (1992), S. 292 - 300, hier S. 292. (zurück)
[5]
Ranking-Algorithmen im Information Retrieval : Diplomarbeit zur Prüfung für den Studiengang Öffentliches Bibliothekswesen / Peter Stets. - Köln, 1994. - Diplom-Arbeit an der Fachhochschule für Bibliotheks- und Dokumentationswesen, Köln. - S. 6. (zurück)

Zurück an den Bildanfang