Inhaltsverzeichnis / Charakteristika von Volltextdatenbanken

Einleitung

Ständig wächst das Volumen von sogenannten unstrukturierten Daten, und man benötigt daher effektive und effiziente Mittel zur Verwaltung und zur Suche in diesen Datenmengen. Dies betrifft neben Bildern, Videos, Audiodaten vor allem Texte (Dokumente). Hier sollen nun einige Werkzeuge vorgestellt werden, die vor allem dem Anspruch der effektiven und effizienten Suche in großen Textmengen gerecht werden wollen: Ein großes Problem bei dieser Aufgabe war das Sammeln von Informationen über die jeweiligen Produkte sowie das Einordnen dieser Informationen in eine geeignete Systematik.

Es standen vor allem Werbematerialien der Produktanbieter zur Verfügung. Diese verbergen zumeist Schwächen und Probleme, die das Produkt hat, bzw. es werden andere Features hervorgehoben. Dies birgt auch die Gefahr in sich, daß die Vorstellung und der Versuch eines Vergleichs eher zu einer Werbeveranstaltung für den einzelnen Anbieter wird. Aus diesem Grunde wäre es notwendig gewesen, jedes einzelne Produkt in der Praxis zu testen, was jedoch den Rahmen eines Vortrages gesprengt hätte. Teilweise konnten (Online-)Handbücher und Mitteilungen aus der Korrespondenz mit dem Hersteller verwendet werden, die soweit relevant zu Rate gezogen wurden.

Weiterhin lagen die Ergebnisse der ersten und der zweiten Evaluierungsphase zum MeDoc-Projekt vor. In der ersten Phase [MTP1], der sog. "Papierevaluation", wurden Informationen (Werbebroschüren und WWW-Pages der Hersteller) zu vielen bekannten Systemen zusammengetragen, um aus diesen eine Vorauswahl treffen zu können. In der zweiten Phase ([MTP2], [MTP2a]) wurden einige Volltextdatenbanken (darunter Fulcrum SearchServer 2 und OpenText 5) anhand von Testinstallationen auf die Eignung für den Einsatz bei diesem Projekt bewertet. Die Ergebnisse wurden in Form von Kurzberichten herausgegeben, so daß man einen Überblick über die Leistungsfähigkeit und den Funktionsumfang der Produkte erhalten konnte. Die Evaluation sollte ursprünglich dazu dienen, ein oder zwei Empfehlungen für den Einsatz im Projekt auszusprechen. Es mußte jedoch festgestellt werden, daß die Systeme für einen Vergleich zu unterschiedlich sind. Weiterhin hatte man mit der Tatsache zu kämpfen (ähnlich der unsrigen Situation), daß nicht alle Informationen, die man sich gewünscht hätte, zur Verfügung standen. Aus diesen Gründen wurde der Test dahingehend abgeschwächt, daß nur die prinzipielle Eignung für MeDoc untersucht wurde.

Leider stellte sich im Verlauf der Vorbereitungen zum Vortrag heraus, daß die Ergebnisse der Evaluierung von Volltextdatenbanken für MeDoc nur eingeschränkt nutzbar sind, da die uns interessierenden Produkte nicht oder in inzwischen veralteten Versionen betrachtet wurden.

Wenn man die gesamte Menge der Informationen betrachtet, hat man es mit einer "heterogenen" und unvollständigen Menge zu tun. Aus diesen Gründen wird auch hier letztendlich keine Bewertung der Systeme erfolgen, sondern es kann nur ein Überblick über sie gegeben werden, so daß die markantesten Unterschiede heraustreten.
 


Inhaltsverzeichnis / Charakteristika von Volltextdatenbanken