Die beste, wenn nicht sogar einzige deutschsprachige Spracherkennung für den Mac, heißt ‚MacSpeech Dictate‘ und wird in Deutschland von ‚Application Systems Heidelberg‘ vertrieben.
Während die Spracherkennung nach der selbsterklärenden Einrichtung – die v.a. wegen der zweiten DVD-Installation der Sprachpacks allerdings etwas länger dauert – und einem kurzem Diktat-Training (5-10 Minuten) bereits sehr flüssig verläuft, sucht man eine Import-Funktion von iPhone/iPod Touch Sprachmemos bisher leider vergebens, womöglich wird diese aber in einer 2.0 Version bald nachgereicht.
Die Sprach-zu-Text-Erkennung läßt sich mit erweiterten Diktat-Trainings, ähnlich wie bei den Produkten die wir bereits vor Jahren im Einsatz hatten, allen voran IBM’s ViaVoice, Phillips Speech und Dragon Naturally Speaking, erheblich verbessern und auf die eigene Sprache nachjustieren und die Erkennung damit optimieren. Dabei ist interessant dass Mac Speech sogar auf dem letztgenannten Produkt von Dragon Natuarally Speaking basiert und dessen Technik als OEM einsetzt, so dass getrost von jahrzehnter-langer Erfahrung im Bereich der automatischen Spracherkennung gesprochen werden kann.
Enttäuschend ist allerdings – und dies soll keine Kritik an ‚Mac Speech‘ im speziellen darstellen, sondern an der Technologie der Spracherkennung im Allgemeinen – dass die grundlegenden Algorithmen in den letzten 15-20 Jahren offensichtlich kaum weiter verändert wurden, anders ist nicht zu erklären weshalb die trockenen Dikttrainings noch immer in fast demselben Maße nötig sind, obgleich die Schnelleinrichtung und Ersterkennung nun zumindest nicht mehr länger als 10 Minuten dauert. Selbstverständlich ist die Erkennung im Detail etwas akkurater geworden, aber das nur Diktat-Trainings wie vor 10-15 Jahren zu der gewünschten Erkennungrate von 90+% führen und das nach wie vor keine 100% möglich sind, lässt durchaus etwas an der Technologie zweifeln und es stellt sich die Frage ob nicht komplett neue Wege beschritten werden müssen um Personen-unabhängige Spracherkennung mit einer Akkuranz von nahezu 100% zu erreichen.
Aktuell gibt es zwei Versionen im Handel, eine mit Kabel-gebundenen und die zweite mit Kabellosem Bluetooth-Headset – die Hardware wird dabei jeweils von Plantronics geliefert – zum Preis von 229,00 beziehungsweis 299,00 Euro.
Insgesamt bietet MacSpeech einen sinnvollen Einstieg für Menschen die Spracherkennung auf aktuellen Apple-Computern wünschen und mit der oben genannten Einschränkungen, sowie dem relativ hohen Preis leben können. Sobald MacSpeech allerdings die Spracherkennung für iPhone/iPod touch Sprachmemos nachrüstet und eventuell die Erstinstallation der zweiten DVD mit den Sprach- und Sounddateien beschluenigt (so um etwa 80-90%), könnte die Software zu einer Must-Have-Applikation für MAC-Systeme heranwachsen.
PS: Jetzt mit deutschem Handbuch zum Download…
PPS: Hier ein gesprochener Testtext, direkt in das Blog-Fenster gesprochen, ohne nachträgliche Textverbesserung:
Text dieser Text ist komplett mit MacSpeech gesprochen. Das funktioniert relativ gut, sofern man Abstände zwischen den Wörtern lässt sowie deutlich und klar spricht. Dann beträgt, selbst bei selbst bei einfachen Training, die Texterkennung fast 100 %. Wichtig ist dabei, dass man Text den Mann bereits gesprochen hat, nicht wiederholt, selbst wenn man zwischendrin, kurz unterbrochen hat. Dieser Fehler, ist mir zu Anfang des Textes beziehungsweise in der Mitte einmal passiert. Vielen Dank an Public Relations-Systems Heidelberg, für die Bereitstellung der Software zum Test. Ende.