CeBIT 2009: Blitzschnell Bilder im Internet finden mit einer neuen Multimedia-Suchmaschine

CeBIT 2009: Blitzschnell Bilder im Internet finden mit einer neuen Multimedia-Suchmaschine

Im Laufe der Jahre hat sich der Heim-Computer vom reinen Schreibmaschinen­ersatz zur umfangreichen Multimedia-Plattform entwickelt. Man archiviert Digitalfotos am Heim-PC, ersetzt CDs durch MP3-Dateien und legt nur noch beiläufig Textdateien auf der Festplatte ab. Was für den Endanwender viele Vorteile mit sich bringt, stellt Suchmaschinen vor ganz neue Aufgaben. Mussten diese früher einfache Textdateien durchsuchen, stehen sie heute vor der Aufgabe, bestimmte Inhalte in komplexen Audio- und Videodateien zu finden - und das möglichst schnell. Auf der CeBIT 2009 in Hannover zeigen Forscher des Max-Planck-Instituts Informatik nun, wie dieses Problem effizient gelöst werden kann. Als Ergebnis eines europäischen Gemeinschaftsprojekts haben sie eine beliebig erweiterbare Peer-To-Peer-Suchmaschine (SAPIR) entwickelt, die blitzschnell Multimedia-Dateien anhand von Beispieldaten findet. Der Anwender kann zum Beispiel eine Melodie summen, um das zugehörige Lied im Netzwerk zu finden (Forschungsstand des Saarlandes, Halle 9, Stand B43).

Wer heute im Internet nach Bildern oder Videos sucht, der greift in der Regel auf bekannte Suchdienste wie Google, Yahoo oder MSN zurück. Derartige Suchmaschinen finden die gewünschten Dateien mit Hilfe sogenannter Meta-Tags. Das sind Begriffssammlungen, die zum Beispiel den Inhalt eines Bildes in Worten beschreiben. Diese Meta-Tags werden von den Suchmaschinen in regelmäßigen Abständen erfasst, aktualisiert und in einem zentralen Index, ähnlich einem Nachschlagewerk, abgespeichert.

Die SAPIR-Suchmaschine verfolgt einen neuartigen Ansatz, um multimediale Inhalte im Netz zu finden. Anstelle von Textinformationen durchforstet sie tatsächliche Merkmale der Daten. Das kann bei einem Lied etwa die Melodie sein. Sucht man also nach einem bestimmten Lied, reicht es, dessen Melodie zu summen. Die Suchmaschine analysiert die gesummte Melodie und findet Dateien mit vergleichbaren Merkmalen im Netzwerk. Dieses neuartige Suchverfahren kann außerdem mit den herkömmlichen Methoden kombiniert werden. So kann man auch nach einer Sehenswürdigkeit suchen, indem man nach dem Namen sucht und zusätzlich ein Handy-Foto in die Suchmaske eingibt.

Um nicht langsamer zu sein, als herkömmliche Suchmaschinen, speichert SAPIR das Nachschlagewerk, also den Such-Index, dezentral ab. Während rein textbasierte Suchmaschinen noch mit zentralen Servern arbeiten können, sprengt das Speichern von audio-visuellem Inhalt schnell die Kapazität üblicher Rechner. Deshalb macht sich SAPIR die Vorteile von Peer-To-Peer-Netzwerken zunutze. Solche Netzwerke bestehen aus einem großen Verbund von Rechnern, die alle gleichermaßen berechtigt sind, Daten zu senden und zu empfangen. Sapir nutzt diese verteilte Struktur, um den Suchindex dezentral zu speichern und zu durchsuchen. Das macht das Suchverfahren nicht nur flexibler und stabiler, sondern auch noch beliebig skalierbar. Sogar Handys können in das Netzwerk integriert werden.

Vom 3. bis 8. März können Besucher der CeBIT 2009 die SAPIR Suchmaschine am Forschungsstand des Saarlandes, Halle 9, Stand B 43 ausprobieren. Die Funktionsweise von SAPIR wird dort am Beispiel von Bildern demonstriert. Es wird gezeigt wie man mit einem Foto als Eingabe ähnliche Fotos finden kann.


Weitere Informationen:
Projektseite: http://www.sapir.eu/
Interaktive Demos: http://www.sapir.eu/demos.html


Fragen beantworten Ihnen: Mouna Kacimi Max-Planck-Institut Informatik mkacimi@mpi-inf.mpg.de Tel. +49 681 9325-516 Kristina Scherbaum Max-Planck-Institut Informatik press@mpi-inf.mpg.de Tel. +49 681 9325-454