1 Seite zurückGLOSSAR-Homepage

SpracherkennungSpracherkennungs-Software, Sprachsteuerung, OCR, ViaVoice, FreeSpeech, Speech Processing, Voice Control System

    

Bücher und
Software zum
Thema

 
Glossar, IT-Glossar, Lexikon, Nachschlagewerk

http://www.glossar.de/glossar/z_spracherkennung.htm

Sprechen statt tippen - OCR für die Sprache

Die Spracherkennung durch den PC zur Steuerung des Computers und zur Eingabe / Erfassung von Texten verändert den Umgang mit der Technik und steckt Ende des 20. Jahrhunderts nicht mehr in den Kinderschuhen. Möglich wurde das durch die ständig steigende Leistungsfähigkeit moderner Hard- und Software.
Das nächste Etappenziel (aus Sicht Sommer 1998) ist die interaktive Steuerung von Küchengeräten, Anrufbeantworter, Fahrkarten- oder Getränkeautomaten. Zukünftig soll selbst die Bedienung von Videorecordern zum Kinderspiel werden. Man wird dem Videorecorder einfach mitteilen, welchen Film er aufnehmen soll.

Zur Spracherkennung (analoges Signal) wird in ein Mikrofon gesprochen und das Signal mit Hilfe einer Soundkarte in digitale Daten umgewandelt. Spezielle Algorithmen qualifizieren die Eingabe und vergleichen sie mit den in einer Datenbank abgelegten Worten. Danach stehen die Daten in einer computerverständlichen Form zur Verfügung.

Deutscher Zukunftspreis für sprachverstehende Computer
(Meldung von ZDNet vom 1.12.2001)

Den Deutschen Zukunftspreis 2001 - Preis des Bundespräsidenten für Technik und Innovation - erhielt Professor Wolfgang Wahlster Ende November im Rahmen einer Festveranstaltung im Max Delbrück Communications Center (MDC.C) in Berlin. Bundespräsident Johannes Rau überreichte Wahlster den Preis für sein Projekt "Sprachverstehende Computer als Dialog- und Übersetzungsassistenten". Der Wissenschaftler führte nach Ansicht der Jury das Wissenschaft und Wirtschaft übergreifende Verbundprojekt Verbmobil mit einer Vielzahl marktfähiger Produkte und mehreren Firmenneugründungen zu einem internationalen Erfolg.

Der Preis des Bundespräsidenten wird jährlich für herausragende technische, ingenieur- oder naturwissenschaftliche Innovationen vergeben und ist mit 500.000 Mark dotiert. Gesicherte Anwendungsmöglichkeiten, uneingeschränkte Marktfähigkeit und die Schaffung von Arbeitsplätzen sind Kriterien für die Auswahl der Nominierungen. 2001 waren vier Forscherteams und Projekte für die Endauswahl nominiert. Die Entscheidung der Jury fiel erst kurz vor der Verleihung durch Bundespräsident Johannes Rau.

Wahlster, Leiter des Deutschen Forschungszentrums für Künstliche Intelligenz (DFKI) und Lehrstuhlinhaber an der Universität des Saarlandes, ist der erste Informatiker, der diesen Preis erhält. Der Professor sagte in seiner kurzen Dankesrede: "Ich bin glücklich darüber, dass ich diese hohe Auszeichnung gerade jetzt in der Mitte meines Forscherlebens - und nicht erst am Ende des aktiven Wirkens - erhalte. (...) Dieser Preis gibt jetzt der raschen Verbreitung unserer Innovationen einen enormen Impuls: Ich bin sicher, dass zu den zwanzig Spin-Off Produkten im Markt und den sechzehn Start-up-Firmen meines Instituts jetzt noch weitere hinzukommen und für neue Arbeitsplätze und eine nachhaltige Wertschöpfung sorgen werden."

Wahlster und seiner Arbeitsgruppe ist nach zwanzig Jahren intensiver Forschung mit der Entwicklung einer innovativen Sprachverarbeitungsmethode ein international viel beachteter Durchbruch gelungen: Das Verbmobil-System, das als Prototyp Ende 2000 vollständig realisiert wurde, erkennt gesprochene Spontansprache, analysiert die Eingabe, übersetzt sie in eine Zielsprache (derzeit: Deutsch, Englisch, Japanisch), erzeugt einen Satz und spricht ihn aus. Bis jetzt wurden bereits verschiedene vollständig implementierte und marktfähige Sprachdialogsysteme daraus entwickelt und vermarktet und sechs Spin-off Firmen von ehemaligen Verbmobil-Mitarbeitern gegründet.

Der Preisträger zeigte sich überzeugt, dass erst wenn es prinzipiell für jeden Menschen möglich wird, in seiner Muttersprache spontan eine Anfrage in Computersysteme zu sprechen, und wenn die entsprechende Antwort oder Reaktion wiederum für ihn verständlich in Alltagssprache ertönt, die Mensch-Computer-Interaktion zum integralen Bestandteil des täglichen Arbeitens wird.

siehe auch

 

Software zum Thema:

 

Bücher und Software zum Thema

 
Glossar, IT-Glossar, Lexikon, Nachschlagewerk

 
ViaVoice von IBM:

Berichte, Briefe, Mails sollen sich mit Viavoice Pro 8 noch perfekter in Windows-Anwendungen diktieren lassen. Dazu wurde die Spracherkennung erneut verbessert - Viavoice soll jetzt einen Wortschatz von rund einer Million Wörter haben und auch zusammengesetzte Wörter erkennen. Bis zu 64.000 Wörter kann der Anwender noch hinzufügen. In die Pro-Version lassen sich außerdem Fachwörterbücher integrieren.

Zur besseren Spracherkennung trägt ein Mikrofon bei, das Hintergrundgeräusche mindert. Außerdem filtert Viavoice während des Diktierens Atmungs- und Lippengeräusche des Anwenders heraus. Viavoice soll mittlerweile so schlau sein, dass es aus dem Kontext heraus die richtigen Wörter schreibt und sogar den Unterschied zwischen gleich lautenden Wörtern erkennt, beispielsweise bei "mehr" und "Meer". Das Programm liest auch vor, Diktate ebenso wie die Inhalte von Webseiten, Mails und anderen Dokumenten. Das erledigt der Viavoice-Agent Woodrow. Viavoice unterstützt den Anwender nicht nur beim Diktieren, sondern eignet sich auch dazu, per Spracheingabe Anwendungen zu steuern. Neu in Viavoice Pro 8 sind dabei Sprachmarkierungen, die hörbar bestätigen, dass Befehle ausgeführt wurden. Über 40 Navigationsmakros mit Sprachmarkierungen sind im Lieferumfang enthalten. Der Anwender kann sich aber auch eigene Makros erstellen.

IBM überarbeitet Spracherkennungs-Konzept
(Meldung von CNet vom 22. Juni 2000)

IBM hat die Absicht, im Laufe der nächsten zwölf bis 18 Monate eine Reihe technologischer Entwicklungen vorzustellen, die als Grundlage für eine künftige Flut von Spracherkennungs-Produkten dienen sollen. IBM erwartet, dass die wachsende Beliebtheit drahtloser Datenverarbeitungsgeräte die Nachfrage nach Sprachverarbeitungs-Techniken steigern wird. W.S. "Ozzie" Osborne von IBM ist der Meinung, der Spracherkennungsmarkt werde bis 2006 auf 60 Milliarden Mark anwachsen.

Auf der Liste der von IBM geplanten technologischen Neuerungen stehen unter anderem: WebSphere Voice Server mit ViaVoice-Technologie, ViaVoice Dictation für Linux, CallPath Enterprise Foundation 6.3, Direct Talk Speech Recognition, Direct Talk Text-to-Speech, Direct Talk Beans für Java und Embedded ViaVoice. "Wir versuchen jetzt, eine durchgehend verbreitete Plattform mit Tools aufzubauen, mit denen Sprachanwendungen entwickelt werden können", sagt Osborne. IBM beabsichtigt, seine Spracherkennungs-Technologie zur industriellen Basis für Sprachanwendungen auszubauen. Analyst Bob Sutherland hält das für eine kluge Strategie, obwohl die Umsetzung noch einige Zeit in Anspruch nehmen kann.

FreeSpeech von Philips Speech Processing:

Philips stellt bei der Entwicklung der Algorithmen die Anpassung der Software an den Benutzer in den Vordergrund, so daß das Programm bereits nach kurzem Sprechertraining jeden Sprecher unterstützt. Dabei erreicht das Programm bei der Erkennung der Syntax und Wörter eine Richtigkeit von über 95 Prozent. Um das Diktat zu erleichtern, verwendet die Software das "Easy Edit"-Korrekturprogramm, das den Text synchron mit der Spracheingabe korrigiert, indem es markierte Wörter und Sätze akustisch wiedergibt.
Die von Philips entwickelte Technologie kommt nicht nur im PC Einsatz, sondern dient in den Philips GSM-Handys "Spark" und "Genie" zur Auswahl der Telefonnummern aus dem Telefonbuch.


VOCS (Voice Control System) von Bosch Blaupunkt
Diese Entwicklung ist weniger für den Computer-Bereich gedacht, als vielmehr zur Bedienung der Verkehrstelematikplattform "Gemini" und das neue Radiophone (GSM-Phone und Autoradio) "Helsinki" via Spracheingabe steuern. Die Spracheingabe und -erkennung ist als ein Sicherheitsbeitrag zu bewerten, damit während des Fahrens die Hände am Lenkrad bleiben. Das von Blaupunkt entwickelte Spracherkennungssystem muß dabei nicht auf bestimmte Sprecher trainiert werden, sondern kann sogar Wörter erkennen, wenn sie in einer der in Deutschland üblichen Mundarten gesprochen sind.

Voice Drive von Sony (www.sony.de):
Hier geht es ebenfalls um die Sprachsteuerung zur Bedienung von Autoradios. Sony unterscheidet dabei drei Arten der Sprachein- und -ausgabe:

  • "Voice Guide" dient zur Bestätigung sämtlicher Eingaben des Benutzers durch eine entsprechende Sprachausgabe.
  • Mit "Voice Memo" läßt sich das Radio als Diktiergerät nutzen. Es lassen sich bis zu sechs Sprachnotizen von jeweils 15 Sekunden aufzeichnen.
  • Mit der Funktion "Voice Recognition" ist die Steuerung der Funktionen über Spracheingabe möglich. Die Spracheingabe erfolgt dabei über ein Mikrofon, das an die Sonnenblende des Fahrzeugs geklemmt wird.

Spracherkennungsprogramm rechtfertigt Wegfall von Arbeitsplatz
(Meldung von computerchannel.de vom 22. Februar 2001)

Die Einführung eines computergesteuerten Spracherkennungsprogramms rechtfertigt grundsätzlich den Wegfall von Arbeitsplätzen und damit verbundene betriebsbedingte Kündigungen. Das hat das Arbeitsgericht Frankfurt entschieden. Die Richter wiesen damit die Klage einer Phonotypistin gegen eine Rechtsanwaltskanzlei zurück.

In dem Anwaltsbüro waren nach der Einführung des Spracherkennungsprogramms die Schreibarbeiten unter die Rechtsanwaltsgehilfinnen verteilt worden. Der bislang mit der Erfassung der Texte beschäftigten Schreibkraft wurde betriebsbedingt gekündigt.

Laut Urteil rechtfertigt die Einführung neuer Computertechnologien im Unternehmen stets eine betriebsbedingte Kündigung, wenn dadurch Arbeitskräfte überflüssig werden, sagte die Gerichtsvorsitzende. Darüber hinaus sei die Kündigung auch als "sozial gerechtfertigt" anzusehen, nachdem es in dem Büro keine der Schreibkraft vergleichbare Arbeitnehmerin gegeben habe.

1 Seite zurückGLOSSAR-Homepage

Copyright: GLOSSAR.de - Neustadt 1997-2004 
 
Navigation ohne Frames:

 
Glossar - Homepage - Linkseite - Suchen im ARCHmatic-Web-Pool (funktioniert nur im Online-Modus!!!) E-Mail-Kontakt - Gästebuch:Lob und Tadel - Foren: Fragen und Antworten
# A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

Partner-Sites: BAULINKS.de - AEC-WEB - ARCHmatic - Architektur-online - BAUBUCH.de