Pick by Voice Sprachtechnologie im länderübergreifenden Einsatz

Autor / Redakteur: Dirk Becker / Volker Unruh

Babel hätte nie stattgefunden. Mit ihrer fortschreitenden Entwicklung bietet die Sprachtechnologie inzwischen klare Vorteile, die vielen Unternehmen sowohl an ihren heimischen als auch an ihren Auslandsstandorten zugute kommen.

Firmen zum Thema

Viele Unternehmen mit Auslandsstandorten oder mit Mitarbeitern unterschiedlicher sprachlicher Herkunft profitieren von den Vorteilen mehrsprachiger Voice-Lösungen. Bilder: Vocollect
Viele Unternehmen mit Auslandsstandorten oder mit Mitarbeitern unterschiedlicher sprachlicher Herkunft profitieren von den Vorteilen mehrsprachiger Voice-Lösungen. Bilder: Vocollect
( Archiv: Vogel Business Media )

Dass sprachgestütztes Arbeiten bei etlichen Kommissionier- und anderen intralogistischen Prozessen große Vorteile bietet, hat sich in vielen Branchen – im wahrsten Sinne des Wortes – herumgesprochen. Und zahlreiche Unternehmen wollen von diesen Vorteilen auch an ihren Auslandsstandorten oder an Standorten mit Mitarbeitern unterschiedlicher sprachlicher Herkunft profitieren.

In beiden Fällen stellt die Mehrsprachigkeit eine besondere Herausforderung an die zum Einsatz kommenden Systeme dar. Um den Implementierungs- und Einarbeitungsaufwand möglichst niedrig zu halten und die Spracherkennungsqualität zu maximieren, muss die verwendete Voice-Lösung spezielle Eigenschaften mitbringen.

Bildergalerie

Dialekte und Akzente spielen bei „Voice“ keine Rolle mehr

Mit dem „Talkman T2x“ und dem „Talkman T5“ bietet der US-amerikanische Hersteller Vocollect Inc. zwei Mobilcomputer an, die sich besonders für mehrsprachige Umgebungen und länderübergreifende Einsätze eignen. Grund hierfür ist das Softwarepaket „Vocollect Voice“, das auf beiden Geräten läuft und höchste Flexibilität bietet.

Die zum Paket gehörende Text-to-Speech-Software (TTS), die Textdaten in Ansagen umwandelt, ist zurzeit in über 24 verschiedenen Landessprachen erhältlich. Darüber hinaus wird auf die sogenannte „benutzerabhängige Spracherkennung“ zurückgegriffen. Sie sorgt für eine extrem schnelle und zuverlässige Identifikation von Wortlauten, und zwar vollkommen unabhängig von Dialekten, Akzenten oder gar der gewählten Sprache.

Basis sind individuelle Sprachprofile

Basis der benutzerabhängigen Spracherkennung sind individuelle Sprachprofile, die vor dem ersten Einsatz des Systems angelegt werden – ein Vorgang, der pro Mitarbeiter nur wenige Minuten dauert. Dazu wird aufgenommen und gespeichert, wie ein Mitarbeiter die für seine Aufgaben relevanten Begriffe ausspricht. Sofern eine klare Wort-Bedeutungs-Zuordnung definiert und später beibehalten wird, kann er dabei auch Wörter aus einer anderen als der lokalen Sprache wählen.

Während der Arbeit werden die gesprochenen Äußerungen des Mitarbeiters in Sekundenbruchteilen mit seinen hinterlegten Sprachprofilen verglichen und erkannt. Selbst in schwierigen Umgebungen lässt sich dabei eine hervorragende Spracherkennungsqualität erzielen, wenn die Sprachprofile wie bei Vocollect vor Ort und mit allen Umgebungsgeräuschen aufgenommen werden können.

Die synthetische Stimme lässt sich nach Bedarf einstellen

Bei der Text-to-Speech-Software setzt Vocollect auf eine Lösung, die eine synthetische Stimme erzeugt. Die synthetische Stimme bietet wichtige Vorteile: Zum einen kann der Mitarbeiter nicht nur unter 24 verschiedenen Sprachen wie Deutsch, Englisch oder Russisch wählen, sondern auch festlegen, ob er eine hohe oder tiefe, eine weibliche oder männliche Stimme hören möchte.

Zum anderen wird die Sprachausgabe direkt im Sprachcomputer, also dem Talkman, erzeugt, was bedeutet, dass keine Audio-Dateien über das Funknetz verschickt werden müssen. Auf diese Weise wird das Funknetz nicht unnötig belastet. Und schließlich können die Mitarbeiter aufgrund der synthetischen Stimme die Aussprachegeschwindigkeit ganz nach ihrem Bedarf variieren und damit ihr Arbeitstempo steigern.

Die Voice-Management-Software „Voice Console“ von Vocollect bietet in Verbindung mit dem Voiceclient die Möglichkeit, dynamisch unterschiedliche Sprachen für die TTS-Sprachausgabe zu laden. So kann zum Beispiel ein russischer Mitarbeiter das Gerät von einem deutschen Kollegen übernehmen und dessen Arbeit fortführen, ohne dass zeitaufwändige Änderungen nötig sind. Dieser Vorgang lässt sich vollständig automatisieren, so dass Benutzereingriffe nicht mehr nötig sind.

Vocollect Voice läuft auf diversen Mobilcomputern

Vocollect Voice läuft inzwischen nicht nur auf dem Talkman T5 und dem Talkman T2x, sondern auch auf einer Reihe von Mobilcomputern anderer Anbieter. Damit steht dem Anwender ein breites Hardware-Angebot für den Einsatz in internationalen und mehrsprachigen Umgebungen zur Verfügung. Zu den Geräten, die mit „Vocollect Voice for Handhelds“ erhältlich sind, zählen beispielsweise der MX7 und der HX2 von LXE, der MC9090 und die WT4000-Modelle von Motorola sowie der Workabout Pro Speech von Psion Teklogix. Ab Frühjahr wird zudem der Intermec CK3 mit integriertem Sprachsoftwarepaket von Vocollect angeboten.

Moderne Sprechgarnituren filtern irrelevante Nebengeräusche heraus

Entscheidend für die Qualität der Spracherkennung sind außer der Software und den Mobilcomputern auch die Headsets. Vocollect entwickelt spezielle Sprechgarnituren, die irrelevante Nebengeräusche effektiv herausfiltern und auch über den ganzen Tag hinweg angenehm zu tragen sind.

Je nach Bedarf kann zwischen verschiedenen Modellen gewählt werden. So gibt es unter anderem IP67-geschützte und für den Einsatz im Kühlraum optimierte Versionen oder leichte Komfort-Varianten. Die Geräuschfiltermethode basiert – außer auf der sprecherabhängigen Spracherkennung – auf einer „Doppel-Mikrofon“-Lösung. Bei dieser Lösung besitzt das Headset eine Mikrofoneinheit mit zwei Mikrofonen, von denen eines zum Sprecher hin-, eines vom Sprecher weggewandt ist. Gehen Signale ein, werden diese millisekundenschnell miteinander verglichen. Auf diese Weise wird zuverlässig erkannt, welche Töne vom Headset-Träger stammen und welche aus der Umgebung kommen.

Die Integration der Sprachtechnologie erfolgt über die Vocollect-Software „Voice Link“ oder „Voice Direct“. Die Mobilcomputer sowie die darauf hinterlegten Funktionen, Anwendungen und Nutzerdaten lassen sich über die Software „Voice Console“ verwalten. Darüber hinaus bietet das Unternehmen Software für verschiedene Anwendungen an.

Dirk Becker ist Business Development Manager Deutschland von Vocollect Europe mit Hauptsitz in Wooburn Green/UK.

(ID:285309)