[ Back to EurekAlert! ]

Public release date: 18-Jul-2013

[ | E-mail ] Share Share

Contact: Gordon Bolduan
bolduan@mmci.uni-saarland.de
Saarland University
@Saar_Uni

Textverständnis: Ein kleiner Satz für den Menschen, ein großer Schritt für den Computer

Diese Pressemitteilung ist verfügbar auf Englisch.

Programme, die unsere Sprache verstehen und sinnvolle Verknüpfungen in Texten finden - daran arbeiten Saarbrücker Wissenschaftler wie Ivan Titov. Der Informatiker entwickelt derzeit ein Verfahren, mit dem Rechner erlernen sollen, sprachlich logische Zusammenhänge in Texten zu finden. So könnte es künftig zum Beispiel möglich sein, einen Computer gezielt über einen Text auszufragen. Der Rechner analysiert darauf den Inhalt und gibt dem Nutzer die richtigen Antworten. Der Software-Konzern Google hat den Saarbrücker Informatiker nun mit dem 140.000 Dollar dotierten Google Focused Research Award ausgezeichnet.

Jeder Student, der an einer Hausarbeit sitzt, kennt das Problem: Bevor man überhaupt etwas zu Papier bringt, muss man sich meist durch zahlreiche Texte und seitenlange Abhandlungen durchkämpfen. Praktisch wäre hier ein Computerprogramm, das die Textmenge schnell durcharbeitet, eine sinnvolle Zusammenfassung der Inhalte liefert oder gar Fragen dazu beantwortet.

Daran arbeiten derzeit Saarbrücker Wissenschaftler um Ivan Titov, die gleichzeitig an der Universität von Amsterdam forschen. Titov befasst sich damit, wie Rechner lernen können, Bedeutung und Zusammenhänge von Wörtern in Sätzen und Texten zu verstehen. „Das von uns entwickelte Modell simuliert, wie Menschen Texte verfassen. Unsere Computer lassen wir das in umgekehrter Reihenfolge abarbeiten, um Texte zu verstehen: Die Rechner werden dabei die Bedeutung des Textes oder sogar die Absichten des Autors erkennen", erläutert der promovierte Informatiker. Der Clou: Titov und seine Arbeitsgruppe geben dieses Modell und die darin zusammengefassten Regeln nicht vor, stattdessen definieren Millionen von Sätzen diese für sie. Diese analysieren sie in umfangreichen Text-Sammlungen wie Wikipedia mit speziellen Algorithmen auf rund 100 Computern.

Mit den erarbeiteten Ergebnissen sollen Computer auch nicht offensichtliche Beziehungen zwischen Wörtern und Sätzen erkennen. Die Rechner sollen so zum Beispiel Wörter und ihre Bedeutungen im Kontext erkennen können, wie der folgende Fall zeigt: Bei den Sätzen „John hat gerade seinen Abschluss an der Saar-Uni gemacht. Er arbeitet nun für Google" ist selbst für einen Computer klar, dass John und Saar-Uni über die Beziehung „hat Abschluss gemacht" und John, Google über „arbeitet für" zusammengehören. Doch das Modell der Saarbrücker Informatiker kann auch erkennen, dass John an der Universität des Saarlandes studierte und dort sehr wahrscheinlich in der Fachrichtung Informatik. Verstehen die Computer diese Muster in der menschlichen Sprache, wollen die Wissenschaftler dieses Verfahren in einem nächsten Schritt anwenden, um sie Fragen zu kleineren Texten beantworten zu lassen oder diese automatisch zusammenzufassen.

Neben Ivan Titov erhält auch Hans Uszkoreit einen mit 220.000 US-Dollar dotierten Google Focused Award. Uszkoreit ist Professor für Computerlinguistik an der Saar-Uni und wissenschaftlicher Direktor am Deutschen Forschungszentrum für Künstliche Intelligenz (DFKI). Er arbeitet daran, sprachliche Zusammenhänge in großen Wissensbanken herauszufiltern.

Mit dem „Google Focused Research Award" fördert der Suchmaschinenanbieter Google Forschungsgebiete, die für das Unternehmen selbst und für die Informatik von großem Interesse sind. Die Preisträger erhalten freien Zugang zu Werkzeugen und Technologien von Google.

Hintergrund:

Ivan Titov forscht in der Computerlinguistik an der Universität des Saarlandes. Seit 2009 leitet er hier die Forschungsgruppe „Machine Learning for Natural Langauge Processing" im Exzellenzcluster „Multimodal Computing and Interaction". Darüber hinaus ist er an der Universität von Amsterdam tätig. Der Informatiker hat an der Universität in Genf promoviert und an der Universität von Edinburgh sowie bei Google Research in New York geforscht.

Die Computerlinguistik der Universität des Saarlandes ist international hoch angesehen. Die Forscher der Saar-Uni arbeiten eng mit dem DFKI und den beiden Max-Planck-Instituten für Informatik und Software-Systeme zusammen, die alle auf dem Saarbrücker Campus ansässig sind.

Seit 2007 wird der Saarbrücker Exzellenzcluster „Multimodal Computing and Interaction" im Rahmen der Exzellenzinitiative von Bund und Ländern gefördert. Hier wird unter anderem untersucht, wie man multimodale Informationen aus Audiodateien, Bildern, Texten und Videos noch effizienter organisieren, verstehen und durchsuchen kann.

###

Weitere Informationen zur Computerlinguistik und zum Exzellenzcluster „Multimodal Computing and Interaction" finden Sie im Internet unter:

http://www.coli.uni-saarland.de

http://www.mmci.uni-saarland.de

Weitere Informationen zum Google Focused Research Award von Hans Uszkoreit finden Sie auf den Internetseiten des DFKI.

Fragen beantwortet:

Gordon Bolduan
Forschungskommunikation
Cluster of Excellence „Multimodal Computing and Interaction"
E-Mail: bolduan(at)mmci.uni-saarland.de
Telefon: 0681 302 70741



[ Back to EurekAlert! ] [ | E-mail Share Share ]

 


AAAS and EurekAlert! are not responsible for the accuracy of news releases posted to EurekAlert! by contributing institutions or for the use of any information through the EurekAlert! system.