beagle++ – Der semantische Desktop

Das L3S-Forschungszentrum1 arbeitet mit beagle++2 daran, Tim Berner Lees Idee des Semantischen Webs auf den – Linux – Desktop zu bringen.
Beagle3 ist ein “Personal Information Space”-Tool. Viele kennen diese Tools besser unter dem Namen Desktop-Suchprogramm. Für Windows gibt es u.a. Google Desktop Search4, Windows Desktop Search5 und xfriend6, unter MacOS Spotlight7. Den Programmen gemeinsam ist, dass sie die auf dem heimischen Rechner gespeicherten Dokumente indexieren und somit einer (relativ) schnellen und umfassenden Suche zugänglich machen. Da somit auch Schlagworte gefunden werden, die sich im Inhalt der Datei befinden und nicht nur im Dateinamen, sind diese Tools natürlich vor allem dann geeignet, wenn der User eine große Datensammlung besitzt und schnell auf bestimmte Inhalte zugreifen möchte/muss. Häufig werden die “üblichen Verdächtigen” der Dateiformate, wie etwa doc, xls, pdf, Outlook-Mails, aber je nach Programm auch Open Office Dokumente, MP3, EXIF usw. durchsucht und indexiert.

beagle++ geht einen Schritt weiter. So extrahiert u.a. der “Publication Metadata Generator” sog. Metadaten aus wissenschaftlichen Publikationen sofern sich diese in Form von PDF Dateien auf dem Rechner finden. Neben Autor, Titel und Konferenz Daten werden auch die referenzierten Publikationen in strukturierter Form erfasst. Graphisch aufbereitet kann das z.B. unter dem publication-metadata-example8 eingesehen werden. Falls ein BibTex File (.bib) im zu durchsuchenden Ordner enthalten ist, wird auch dieses ausgewertet.

Wozu “Semantic”?

Die Frage ist natürlich berechtigt. Wenn ich einfach nach Schlagwörtern mit dem Desktop-Suchprogramm meiner Wahl suchen kann, wozu benötige ich dann etwas, dass Semantik betrachtet? Nun …. zwar kann ich mit einem Schlagwort alle Dokumente finden, die eben dieses Wort enthalten, aber mit einem Semantischen Desktop kann man auch alle Dokumente finden, die sich auf das gefundene Dokument beziehen und ebenso Dokumente, die sich in einer bestimmten Relation zu dem Suchbegriff befinden.

Der Clou an der ganzen Sache ist, dass dadurch einerseits Beziehungen und somit Wissen, zwischen einstmals isolierten Informationen sichtbar werden, andererseits Wissen auch für den Rechner in strukturierter Form zugänglich ist. Auf Grund der Semantik, “weiss” das Programm, dass ein gegebenes Dokument von einem bestimmten Autor erstellt wurde und kann auch eine Anfrage in der Form “Zeige mir alle Dokumente, die der Autor von Dokument XY erstellt hat” verarbeiten. Ebenso wertvoll: Die Daten müssen nicht wie bei einer Datenbank strukturiert von einem Menschen abgelegt werden, sondern die Informationen werden zu einem gewissen Teil direkt aus dem vorliegenden File generiert.

Noch nicht ganz klar? Dann werft einen Blick auf das Beagle++ Video9

  1. http://www.l3s.de/ []
  2. http://beagle2.kbs.uni-hannover.de/ []
  3. http://beagle-project.org/Main_Page []
  4. http://desktop.google.com/ []
  5. http://www.microsoft.com/windows/desktopsearch/default.mspx []
  6. http://www.xfriend.de/ []
  7. http://www.apple.com/de/macosx/features/spotlight/ []
  8. http://beagle2.kbs.uni-hannover.de/img/publication-metadata-generator-example.png []
  9. http://beagle2.kbs.uni-hannover.de/~beagle/Beagle++%20Demo%20-%20Xvid.avi []

1 comment to beagle++ – Der semantische Desktop

  • Ich beutze zur Suche am ganzen PC Lookeen, es ist sehr schnell, handlich und liefert gut dargestellte Suchergebnisse in Sekunden. Gibt es mittlerweile in Versionen 2003, 2007 und 2010. Wer es testen möchte: http://www.lookeen.net
    Grüße, Milo

Leave a Reply

 

 

 

You can use these HTML tags

<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>