IT-Forschung 2006
Förderprogramm Informations-
und Kommunikationstechnik
4.2.3. Mensch-Technik-Interaktion
Ausgangslage
Die Sprachverarbeitung bei IT-Geräten ist inzwischen relativ weit entwickelt. Deutschland verfügt über weltweit führende Forschungsergebnisse zur Sprachdialogübersetzung. Die Fortschritte in der Spracherkennung beruhten dabei im Wesentlichen auf Fortschritten in statistischen Verfahren. Die Sprachübersetzung profitierte von interdisziplinären Ansätzen, einschließlich Methoden der Künstlichen Intelligenz. Offene Probleme gibt es noch bei der robusten Spracherkennung und -verarbeitung in gestörten Umgebungen, bei maschinellen Lernverfahren (teure Datensammlung, Datenknappheit, geringe Trainingsdaten), in der Domänenabhängigkeit, der Skalierbarkeit bei manuellen Wissensquellen und in der Sprachsynthese.
Die Ausweitung der Sprachsteuerung von Geräten auf das volle Spektrum der menschlichen Interaktionsmöglichkeiten mit Gestik, Mimik, Haptik und Visualisierung ist noch ein grundlegendes Forschungsthema der Mensch-Technik-Interaktion (MTI). Heutige Forschungsprototypen erfordern noch einen zu großen Adaptionsaufwand, bevor eine breite Nutzung möglich ist. Die Forschung richtet sich zukünftig auf multimodale und virtuelle Benutzungsschnittstellen mit breitem Spektrum an Kommunikations- und Interaktionsmöglichkeiten. Internet und webbasierte Dienstleistungen bestimmen zunehmend die Entwicklungsrichtung.
Es besteht in Expertenkreisen Einigkeit, dass die bisher getrennte Forschungslinie der Interaktion des Menschen mit IT-Geräten über die Virtuelle und Erweiterte Realität (VR-AR) zukünftig weitgehend integraler Bestandteil der Mechanismen zur MTI sein wird. Das kommt der Situation in Deutschland entgegen, zumal die grundlegenden Techniken zur Computer-Graphik bei uns weit entwickelt sind. Virtuelle Welten und interaktive Video-Technologien sind bereits wichtiger Bestandteil vieler Arbeiten mit dem Computer.
Handlungsbedarf und Ziele
Insgesamt muss die Interdisziplinarität der Teilgebiete Sprachtechnologie, MTI und Virtuelle und Erweiterte Realität gestärkt werden, wobei die Leistungsfähigkeit des Gesamtsystems im Vordergrund stehen sollte. Anhand exemplarischer Anwendungen sind modulare Querschnittsprojekte zu fördern, bei denen die interdisziplinäre Zusammenarbeit möglichst umfangreich ist.
Im Sprach- und Dialogverstehen sind die Verfahren insbesondere für Internetanwendungen durch hybride Ansätze statistischer und wissensbasierter Analyseverfahren robuster, skalierbarer und domänenunabhängiger zu machen. Um das Anwendungspotenzial bei der Sprachsynthese zu erhöhen, müssen Natürlichkeit und Sprecheradaption weiter erhöht werden.
Die Robustheit von MTI-Lösungen muss durch integrale Ansätze und die Kombination verschiedener Verfahren wie Multimodalität bei Ein- und Ausgabe, Usability Engineering, Benutzeradaption und -assistenz oder intelligente Dialoggestaltung gestärkt werden. Für die schnelle und effektive Ergebnisumsetzung sind insbesondere standardisierte Schnittstellen erforderlich. Es besteht hoher Bedarf an angepassten Usability Engineering Methoden für webbasierte Informationssysteme und an effizientem Fehlermanagement. Für alle MTI-Anwendungen werden Evaluationszentren und entsprechende Evaluierungsverfahren gebraucht.
Im Teil-Themenfeld Virtuelle und Erweiterte Realität sollte neben der visuellen Repräsentation auch ein "Rendering der anderen Sinne" entwickelt werden, um die Bandbreite der Kommunikation zwischen Mensch und Computer zu erhöhen.
Forschungsthemen
Die folgenden FuE-Themen beinhalten sowohl technische Entwicklungen zu den Mensch-Technik-Systemen als auch entsprechende Softwareentwicklungen.
Als herausforderndes Querschnittsthema sollte ein natürlichsprachlicher "Human Virtual Actor" als personalisiertes Interaktionssystem entwickelt werden, in dem Methoden der Sprach- und Dialogverarbeitung, der physikalisch simulierten Animation, der autonomen Bewegung sowie der Sprache, Gestik, Mimik und des "Affective Computing" integriert werden.
- Sprachverarbeitung
- Für die "Internet-Gesellschaft" sind Methoden zur domänenunabhängigen Beantwortung natürlichsprachlicher Anfragen zu entwickeln, die automatisch Informationen extrahieren und geeignete Zusammenfassungen als Antwort generieren. Für große Audio-Archive ist eine gezielte sprachbasierte Inhaltssuche gespeicherter Audio- und Videoaufzeichnungen einschließlich situations- und benutzeradaptiver Zusammenfassungen notwendig.
- Für die Verbesserung insbesondere der Robustheit von Spracherkennung und -synthese sind neue Modelle der natürlichen Sprache unter Einschluss ingenieurwissenschaftlicher Disziplinen der Spracherkennung anzuwenden.
- Die Sprachdatensammlung in Deutschland soll verstärkt werden, weil sie elementare Voraussetzung für Geräteentwicklungen der Industrie ist.
- Mensch-Technik-Interaktion (MTI)
- Es sollen Potenziale für neue Interaktionsmodi bei voller Nutzung menschlicher Wahrnehmungs- und Aktionsmöglichkeiten sowie für das synergistische Zusammenwirken von menschlicher Intelligenz und systembasierten Leistungen (z.B. kooperatives Explorieren) erschlossen werden. Dabei ist auf die Standardisierung neuer Interaktionsformen zu achten.
- Arbeiten zu anthropomorphen Benutzerschnittstellen (personalized inferface) sollen verstärkt gefördert werden. Dazu gehören auch Fragen der Nutzermodellierung und die Entwicklung nutzeradaptiver Systeme zur Inhaltsanpassung und -aufbereitung.
- Um die Robustheit von MTI-Systemen zu verbessern, sollen Methoden zur Intentionserkennung des Nutzers und bessere Fehlermanagementkonzepte entwickelt werden.
- Entwicklungen zum "Affective Computing" sollen integriert werden.
- Für den effektiveren Einsatz von MTI-Systemen sind neue Engineering-Methoden für die situative Informationsbereitstellung (etwa Beschreibung von Arbeitsabläufen) unumgänglich.
- Es sollen neue Modelle, Methoden und Tools für das Usability Engineering webbasierter Informationssysteme und Usability-Testzentren für MTI- und VR-Systeme gefördert werden.
- Interaktive Werkzeuge und Visualisierungsmethoden für das Information Retrieval.
- Methoden und Toolkits zur Erstellung und Bearbeitung von Interaktionsobjekten (automatische Umsetzung auf unterschiedliche Zielgeräte).
- Interaktion mit mobilen Geräten in Fahrzeugen.
- Interaktion mit vernetzten Systemen.
- Virtuelle und Erweiterte Realität (VR-AR)
- In VR-Umgebungen spielen neue Sensoren, die eine genauere Reaktion des Systems auf das Verhalten des Nutzers erlauben, eine wichtige Rolle. Es sollen Geräteschnittstellen entwickelt werden, die offen für neue Geräte und Anforderungen sind.
- Informationen in VR-AR-Systemen sprechen zunehmend alle Sinne des Benutzers an und verwischen die Grenzen zwischen Nutzer und System. Dazu sind universelle Schnittstellen zu entwickeln, die nicht nur für Spezialanwendungen ausgelegt sind.
- Für zukünftige Systeme in einem "virtuellen Kontinuum" sollen intelligente Umgebungen, in denen ein Benutzer nur noch seine Ziele angibt, sowie die Berücksichtigung unterschiedlicher physischer und emotionaler Reaktionen (perceptual computing) erschlossen werden.
- Die physikalisch basierte Simulation als Grundlage für extrem genaue visuelle und animierte Darstellungen soll weiterentwickelt werden.
Wichtige Anwendungsgebiete
- Die Sprachtechnologie einschließlich der notwendigen Informationsaufbereitung wird zur wesentlichen Benutzerschnittstelle zum Internet, insbesondere im mobilen Zugang. Gemeinsam mit den Interaktionsmodi Gestik, Mimik und Haptik bildet sie die Grundlage für die Steuerung zukünftiger IT-Geräte.
- Wichtige Anwendungen liegen in neuen Diktiersystemen für gesprochenes Deutsch (Qualitätsverbesserung der Diktiersprache, Verständlichkeit bei unterschiedlichen Störpegeln) und intelligenten Assistenzsystemen für den leichteren Fremdsprachen-erwerb.
- Die Post-PC Ära stellt mit mobilem und ubiquitärem Computing bei Verwendung tragbarer Computer höchste Anforderungen an technische und anwendungsbezogene Entwicklungen.
- Für MTI und VR-AR gibt es ein extrem breites Einsatzspektrum vom privaten Bereich (z.B. interaktive Spiele/Movies) über Lehr- und Lernsysteme, e-business und webbasierte Anwendungen bis hin zur Visualisierung komplexer Anwendungen und kooperativen Arbeit in Teams. Besondere Bedeutung kommt dem "Affective Computing" für Lehrprogramme und für Service Roboter für ältere Menschen zu.
- Ein breites Anwendungsfeld ist die Gesamtheit der Anwendungen aus dem Mix von virtuellen und realen Welten (Mixed Realities).
zum Seitenanfang