|
Macken und Mustergültiges
beim DSP-100
|
|||||||||||||||||||||||||||||||
|
Da ich mit anderen Versionen der Treibersoftware für das DSP-100 problematische Erfahrung gemacht habe, verwende ich das PerSono Audio Control Center 1.9.211.1. (Die Versions-Nr. erfährt man, wenn man über das zweite Symbol oben links die "PerSono Systemsteuerung" öffnet und den Info-Button drückt.) Im Control Center lassen sich die sechs Kanäle des Equalizers leider nur über vier vorkonfigurierte Profile ansteuern. Dabei bieten die Profile "Keine" und "Sprache" einen linearen Frequenzgang und somit keine Frequenzanhebung des Sprachsignals. Die Einstellungen "Internet Telefonie" und "Voice Chat" verstärken den für das Sprachverstehen wichtigen Frequenzbereich von 500 bis 4000 Hz:
Die besten Erfahrungen habe ich mit der Einstellung "Internet Telefonie" gemacht. Den Unterschied zwischen den Einstellungen "Sprache" und "Internet Telefonie" kann man sich über diese wav-Datei (gezippt, 257 KB) auch anhören. (Bei Sprechern mit höherer Stimmlage dürfte der Unterschied allerdings etwas geringer ausfallen.) Auf meinem System zeigte sich allerdings ein gravierender Schönheitsfehler des Equalizers: Nach einem Neustart des Systems waren die Einstellungen nicht mehr wirksam und das vom Mikrofon aufgezeichneten Signal erfuhr keine Frequenzanhebung. Dies war zum Beispiel dadurch zu beheben, dass man nach jedem Neustart im Equalizer zunächst eine andere Voreinstellung wählte und dann die Einstellung zurück auf "Internet Telefonie" setzte. Ich habe allerdings ein Skript geschrieben, dass dieses Problem automatisch löst, wenn man es in den Autostart-Ordner kopiert.
Für den Test wurde das DSP-100 in der Einstellung "Internet Telefonie" betrieben und an einen freien USB-Port angeschlossen. (Bei meinem System hat es sich bewährt, das Mikrofon nicht über einen Hub, sondern direkt über einen USB-Port des Motherboards anzuschließen.) Die beiden analogen Mikrofone wurden am Mikrofoneingang meiner Soundkarte (Terratec DMXFire) angeschlossen. Beim ANC 700 gab es noch die Möglichkeit, zusätzlich einen Batterieadapter zu verwenden, auch dies wurde bei einem Test ausprobiert, brachte aber bei meinem System keine Verbesserung. Als Spracherkennungs-Software kam NaturallySpeaking preferred Edition, Version 5 zum Einsatz. In den Optionen wurde für die Genauigkeitseinstellungen zunächst die mittlere Position des Reglers gewählt. Die Tests wurden auf einem Pentium-4-System mit 1,9 Gigahertz und 512 MB Rambus-Speicher durchgeführt. Zunächst wurde für jedes Mikrofon ein neuer Benutzer angelegt, das fünfminütige Anfangstraining absolviert und dann die Erkennungsgenauigkeit getestet, ohne dass Korrekturen durchgeführt wurden. Um die ermittelte Genauigkeit anhand mehrerer Messergebnisse besser beurteilen zu können, kamen zwei verschiedene Textpassagen (aus dem Bereich der Managementliteratur) zum Einsatz. Wo sich ein deutlicher Unterschied zwischen den Ergebnissen beider Textpassagen ergab, wurde die Lesung des ersten Textes wiederholt. Für den zweiten Text wurde außerdem eine Erkennung mit der höchsten Genauigkeitseinstellung und beim ANC 700 auch eine Erkennung mit Batterieadapter durchgeführt. So wurden für jedes Mikrofon drei bis vier Messergebnisse ermittelt. Das Ergebnis des Tests zeigt die nachfolgende Tabelle: |
||||||||||||||||||||||||||||||||
|
|
|
|||||||||||||||||||||||||||||||
|
Deutlich hebt sich das DSP-100 von den anderen beiden Mikrofonen ab: Im Mittel ist die Fehlerquote mit 1,5 Prozent weniger als halb so groß wie beim ANC 700 (3,1 %) und beim VXI (3,9 %). Die Testergebnisse zeigen außerdem, dass die Verwendung der höchsten Genauigkeitseinstellung erwartungsgemäß eine gewisse Reduzierung der Fehlerquote bewirkt. Diese Reduzierung beträgt im Mittel 35 % und rechtfertigt somit sicherlich die leichten Geschwindigkeits- einbußen, die diese Einstellung selbst bei schnellen Maschinen gelegentlich mit sich bringt. Da sich die Testergebnisse auf untrainierte Benutzerprofile beziehen, ist das Ergebnis insbesondere für das DSP-100 erstaunlich gut. Im weiteren Verlauf der Verwendung sollte sich die Erkennungsleistung der Benutzerprofile noch weiter steigern lassen. (Es wurde allerdings auch schon von abnehmender Erkennungsgenauigkeit mit zunehmendem Training der Benutzerprofile berichtet.) Es ist allerdings schwer zu überprüfen, ob sich auch bei der Verwendung von trainierten Benutzerprofilen ein ähnliches Testergebnis ergeben hätte. Gewisse Abweichungen sind denkbar. Gleiches gilt sicher auch für Sprecher mit anderen Stimmlagen, die Verwendung einer anderen Testumgebung oder anderer Texte. Da allerdings jede der 4 gemessenen Erkennungsleistungen für das DSP-100 auf einem Niveau liegt, dass die anderen Mikrofone nicht erreichen, besteht für den Testsieg dieses Mikrofons eine gewisse Sicherheit, die sicherlich nicht schlechter ist, als in vielen anderen Tests.
Trotz des subjektiven sehr guten Tragekomforts erreicht das DSP-100 nicht die Verarbeitungsqualität und Stabilität des ANC 700. Kritisch für die Erkennungsgenauigkeit ist vor allen Dingen die etwas wackelig geratene Verbindung zwischen Mikrofon und Kopfbügel zu sehen. Dies lässt sich allerdings beheben. Weiterhin trat bei meinem Exemplar des DSP-100 ein störendes Geräusch im Kopfhörer auf, sodass ich diesen stillgelegt habe. Die notwendigen Modifikationen zur Lösung beider Probleme sind in diesem Workshop beschrieben. Außerdem gibt es ein Problem mit dem Regler, der sich in der Mikrofonzuleitung befindet. Mit dem Regler kann man zum einen die Lautstärke des Kopfhörers regeln (sofern man ihn nicht stillgelegt hat). Zum anderen lässt sich das Mikrofon stumm schalten. Die Stummschaltung führt allerdings nach kurzer Zeit zu einem Absturz von NaturallySpeaking Version 5.x. Daher sollte man die Stummschaltung tunlichst nicht benutzen, wenn diese Version läuft.
Die drei vorgestellten Mikrofon sind sicherlich alle als recht gut einzuschätzen. Nach Behebung der angesprochenen Mängel ist für mich das DSP-100 auf jeden Fall die erste Wahl. Neben dem sehr guten Tragekomfort ist die halbierte Fehlerrate im Vergleich zu den anderen Mikrofonen ein nicht zu unterschätzender Vorteil, wenn man das Mikrofon über längere Zeit benutzt. Der Korrekturaufwand, der bei einer Fehlerrate um 3 % verursacht wird, beansprucht einen erheblichen Zeitanteil bei der Texterstellung. Wenn dieser unproduktive Zeitanteil halbiert werden kann, geht das Diktieren erheblich flüssiger und ist wesentlich zufrieden stellender.
|
||||||||||||||||||||||||||||||||
|
Copyright(c) 2004 Christian Nerger, alle Rechte vorbehalten. |