Hybride Integration von molekularbiologischen Annotationsdaten
|
Weitere Informationen: http://lips.informatik.uni-leipzig.de/pub/2005-16
Beschreibung
Wir präsentieren einen Ansatz, um Annotationsdaten von molekularbiologischen
Objekten wie Genen, Proteinen und Pathways aus öffentlichen Datenquellen
für datenintensive Expressionsanalysen verwendbar zu machen. Die Expressionsdaten
sind mit Experimentbeschreibungen physisch in einem Data Warehouse
integriert, um schnelle Auswertungen zu unterstützen. Die öffentlichen Annotationsdaten
werden virtuell über einen Mediatoransatz integriert und bedarfsgesteuert
für Analysen abgerufen. Für die einheitliche Anbindung der Datenquellen
wird das verbreitete Tool SRS (Sequence Retrieval System) der Fa. LION bioscience
genutzt. Die Kopplung zwischen dem Warehouse und SRS erfolgt über einen
Query-Mediator unter Nutzung explizit gespeicherter Beziehungen (Mappings)
zwischen den Instanzen der öffentlichen Datenquellen. Dieser hybride Integrationsansatz
wurde als Erweiterung des Leipziger Data Warehouse für Genexpressionsdaten
(http://www.izbi.de/GEWARE) implementiert und wird für die
Einbindung von GeneOntology, LocusLink und Ensemble in Analysen eingesetzt.
Neben der Darstellung des Integrationskonzepts und seiner Realisierung werden
auch Ergebnisse erster Performanzmessungen präsentiert.