Logo der NatSpeak-Seiten

Tipps, Lösungshilfen und Downloads aus der EDV-Trickkiste

 


 

 

Macken und Mustergültiges beim DSP-100
 

Das DSP-100 und seine Konkurrenten

Lange habe ich mit einem analogen Kopfbügelmikrofon (VXI  Parrot mit Translator) diktiert.  Ich habe zwar hin und wieder ein paar andere Mikrofone probiert, bin aber wegen der guten Erkennungsgenauigkeit (27 – 29 dB im Audioassistenten) immer wieder zum VXI-Mikrofon zurückgekehrt.

Als mein Mikrofon "Auflösungserscheinungen" zeigte, musste ich mich nach einem passenden Ersatz umsehen. Auf Empfehlung von Armin Amler in der E-mail-Liste dragonanwender habe ich dann das Andrea ANC 700 für einen Test besorgt. Wie Herr Amler schreibt, besagen wissenschaftliche Erkenntnisse zur Sprachverständlichkeit, dass insbesondere der mittlere Frequenzbereich für das Hörverstehen wichtig ist. Der untere Frequenzbereich des vom Mikrofon aufgezeichneten Signals enthält hingegen auch viele Störsignale (Netzbrummen, Atemgeräusche, usw.) die die Verständlichkeit der Sprache beeinträchtigen können.  Ein Mikrofon wie das ANC 700, das den Frequenzbereich der Sprache leicht nach oben verschiebt, verbessert nach Einschätzung von Herrn Amler die Erkennungsgenauigkeit.

Die enorme gute Verarbeitung des ANC 700 hat mich zwar schwer beeindruckt, im Vergleich zu meinem alten Mikrofon habe ich jedoch keine Erhöhung des Frequenzbereiches oder der Erkennungsgenauigkeit feststellen können. Daher habe ich noch ein weiteres Mikrofon, nämlich das DSP-100 der Firma Plantronics besorgt und getestet. Dieses Mikrofon ist zwar weniger gut verarbeitet als das ANC 700, weist jedoch ein paar wichtige Vorteile auf:

  • Nach meinen Tests hat es die beste Erkennungsgenauigkeit (siehe unten).
  • Im Audiosetup-Assistenten sind relativ gute Werte möglich (26 bis 30 dB).
  • Es handelt sich um ein USB-Mikrofon, das unabhängig von der Soundkarte ist. Damit sollte es möglich sein, die Sprachdateien des Benutzers ohne erneutes Training auf mehreren PCs zu nutzen, auch in wenn diese unterschiedliche oder ungeeignete Soundkarten haben.
  • Das Mikrofon ist leicht, bietet einen sehr guten Tragekomfort und viel Bewegungsfreiheit, da es mit einem 3 Meter langen Anschlusskabel ausgestattet ist.
  • Im Anschlusskabel ist außerdem ein kleiner Regler angebracht, den man zur Zugentlastung des Mikrofons an die Kleidung anstecken kann. Die Reglerfunktionen sind allerdings von sehr eingeschränktem Nutzen (s. u.).
  • Die Treibersoftware des Mikrofons enthält einen Equalizer, der es ermöglicht, den unteren Frequenzbereich des Mikrofonsignals abzuschwächen und somit den Frequenzbereich des Sprachsignals im Mittel anzuheben.

 

Treibersoftware: Einstellmöglichkeiten und Schönheitsfehler

Da ich mit anderen Versionen der Treibersoftware für das DSP-100 problematische Erfahrung gemacht habe, verwende ich das PerSono Audio Control Center 1.9.211.1. (Die Versions-Nr. erfährt man, wenn man über das zweite Symbol oben links die "PerSono Systemsteuerung" öffnet und den Info-Button drückt.) Im Control Center lassen sich die sechs Kanäle des Equalizers leider nur über vier vorkonfigurierte Profile ansteuern. Dabei bieten die Profile "Keine" und "Sprache" einen linearen Frequenzgang und somit keine Frequenzanhebung des Sprachsignals. Die Einstellungen "Internet Telefonie" und "Voice Chat" verstärken den für das Sprachverstehen wichtigen Frequenzbereich von 500 bis 4000 Hz:

vorkonfigurierte Profile des Mikrofon-Equalizers

Die besten Erfahrungen habe ich mit der Einstellung "Internet Telefonie" gemacht. Den Unterschied zwischen den Einstellungen "Sprache" und "Internet Telefonie" kann man sich über diese wav-Datei (gezippt, 257 KB) auch anhören. (Bei Sprechern mit höherer Stimmlage dürfte der Unterschied allerdings etwas geringer ausfallen.)

Auf meinem System zeigte sich allerdings ein gravierender Schönheitsfehler des Equalizers: Nach einem Neustart des Systems waren die Einstellungen nicht mehr wirksam und das vom Mikrofon aufgezeichneten Signal erfuhr keine Frequenzanhebung. Dies war zum Beispiel dadurch zu beheben, dass man nach jedem Neustart im Equalizer zunächst eine andere Voreinstellung wählte und dann die Einstellung zurück auf "Internet Telefonie" setzte. Ich habe allerdings ein Skript geschrieben, dass dieses Problem automatisch löst, wenn man es in den Autostart-Ordner kopiert.

 

Der Test

Für den Test wurde das DSP-100 in der Einstellung "Internet Telefonie" betrieben und an einen freien USB-Port angeschlossen. (Bei meinem System hat es sich bewährt, das Mikrofon nicht über einen Hub, sondern direkt über einen USB-Port des Motherboards anzuschließen.) Die beiden analogen Mikrofone wurden am Mikrofoneingang meiner Soundkarte (Terratec DMXFire) angeschlossen. Beim ANC 700 gab es noch die Möglichkeit, zusätzlich einen Batterieadapter zu verwenden, auch dies wurde bei einem Test ausprobiert, brachte aber bei meinem System keine Verbesserung.

Als Spracherkennungs-Software kam NaturallySpeaking preferred Edition, Version 5 zum Einsatz. In den Optionen wurde für die Genauigkeitseinstellungen zunächst die mittlere Position des Reglers gewählt. Die Tests wurden auf einem Pentium-4-System mit 1,9 Gigahertz und 512 MB Rambus-Speicher durchgeführt.

Zunächst wurde für jedes Mikrofon ein neuer Benutzer angelegt, das fünfminütige Anfangstraining absolviert und dann die Erkennungsgenauigkeit getestet, ohne dass Korrekturen durchgeführt wurden. Um die ermittelte Genauigkeit anhand mehrerer Messergebnisse besser beurteilen zu können, kamen zwei verschiedene Textpassagen (aus dem Bereich der Managementliteratur) zum Einsatz. Wo sich ein deutlicher Unterschied zwischen den Ergebnissen beider Textpassagen ergab, wurde die Lesung des ersten Textes wiederholt. Für den zweiten Text wurde außerdem eine Erkennung mit der höchsten Genauigkeitseinstellung und beim ANC 700 auch eine Erkennung mit Batterieadapter durchgeführt. So wurden für jedes Mikrofon drei bis vier Messergebnisse ermittelt. Das Ergebnis des Tests zeigt die nachfolgende Tabelle:

 

Text, Einstellungen

Erkennungsgenauigkeit [%]

VXI

ANC

DSP-100

Text 1, (265 Wörter), mittlere Genauigkeit

95,5

97

98,5

Text 1, (Wiederholung) mittlere Genauigkeit

-

-

98,9

Text 2, (339 Wörter), mittlere Genauigkeit

95,7

95,7

97,9

Text 2, höchste Genauigkeit

97,2

97,5

98,5

Text 2, höchste Genauigkeit, Batterieadapter

-

97,2

-

Mittelwert

96,1

96,9

98,5

Deutlich hebt sich das DSP-100 von den anderen beiden Mikrofonen ab: Im Mittel ist die Fehlerquote mit 1,5 Prozent weniger als halb so groß wie beim ANC 700 (3,1 %) und beim VXI (3,9 %). Die Testergebnisse zeigen außerdem, dass die Verwendung der höchsten Genauigkeitseinstellung erwartungsgemäß eine gewisse Reduzierung der Fehlerquote bewirkt. Diese Reduzierung beträgt im Mittel 35 % und rechtfertigt somit sicherlich die leichten Geschwindigkeits- einbußen, die diese Einstellung selbst bei schnellen Maschinen gelegentlich mit sich bringt.

Da sich die Testergebnisse auf untrainierte Benutzerprofile beziehen, ist das Ergebnis insbesondere für das DSP-100 erstaunlich gut. Im weiteren Verlauf der Verwendung sollte sich die Erkennungsleistung der Benutzerprofile noch weiter steigern lassen. (Es wurde allerdings auch schon von abnehmender Erkennungsgenauigkeit mit zunehmendem Training der Benutzerprofile berichtet.) Es ist allerdings schwer zu überprüfen, ob sich auch bei der Verwendung von trainierten Benutzerprofilen ein ähnliches Testergebnis ergeben hätte. Gewisse Abweichungen sind denkbar. Gleiches gilt sicher auch für Sprecher mit anderen Stimmlagen, die Verwendung einer anderen Testumgebung oder anderer Texte. Da allerdings jede der 4 gemessenen Erkennungsleistungen für das DSP-100 auf einem Niveau liegt, dass die anderen Mikrofone nicht erreichen, besteht für den Testsieg dieses Mikrofons eine gewisse Sicherheit, die sicherlich nicht schlechter ist, als in vielen anderen Tests.

 

Behebung von Hardware-Mängeln

Trotz des subjektiven sehr guten Tragekomforts erreicht das DSP-100 nicht die Verarbeitungsqualität und Stabilität des ANC 700. Kritisch für die Erkennungsgenauigkeit ist vor allen Dingen die etwas wackelig geratene Verbindung zwischen Mikrofon und Kopfbügel zu sehen. Dies lässt sich allerdings beheben. Weiterhin trat bei meinem Exemplar des DSP-100 ein störendes Geräusch im Kopfhörer auf, sodass ich diesen stillgelegt habe. Die notwendigen Modifikationen zur Lösung beider Probleme sind in diesem Workshop beschrieben.

Außerdem gibt es ein Problem mit dem Regler, der sich in der Mikrofonzuleitung befindet. Mit dem Regler kann man zum einen die Lautstärke des Kopfhörers regeln (sofern man ihn nicht stillgelegt hat). Zum anderen lässt sich das Mikrofon stumm schalten. Die Stummschaltung führt allerdings nach kurzer Zeit zu einem Absturz von NaturallySpeaking Version 5.x. Daher sollte man die Stummschaltung tunlichst nicht benutzen, wenn diese Version läuft.

 

Fazit

Die drei vorgestellten Mikrofon sind sicherlich alle als recht gut einzuschätzen. Nach Behebung der angesprochenen Mängel ist für mich das DSP-100 auf jeden Fall die erste Wahl. Neben dem sehr guten Tragekomfort ist die halbierte Fehlerrate im Vergleich zu den anderen Mikrofonen ein nicht zu unterschätzender Vorteil, wenn man das Mikrofon über längere Zeit benutzt. Der Korrekturaufwand, der bei einer Fehlerrate um 3 % verursacht wird, beansprucht einen erheblichen Zeitanteil bei der Texterstellung. Wenn dieser unproduktive Zeitanteil halbiert werden kann, geht das Diktieren erheblich flüssiger und ist wesentlich zufrieden stellender.

 


Copyright(c) 2004 Christian Nerger, alle Rechte vorbehalten.