NVDA Remote: Fernsteuerungs-Addon für den Open-Source-Bildschirmleser erschienen

Geschrieben von Steffen Schultz keine Kommentare
Kategorisiert in : Software Schlüsselwörter : A11Y, NVDA, OpenSource, Windows

Im vergangenen März startete via Indiegogo eine Crowdfunding-Kampagne mit dem Ziel, für den freien und kostenlosen Screen-Reader NVDA (Non-Visual Desktop Access ein Addon zur Fernsteuerung von Computern zu entwickeln. Blinden Menschen sollte es damit ermöglicht werden, entfernte Computer problemlos mit dem eigenen Screen-Reader zu steuern, ohne viel Geld für kommerzielle Lösungen ausgeben zu müssen. Dies erlaubt es ihnen nicht nur, Freunden und Bekannten ohne sehende Hilfe technische Hilfestellung zu geben, sondern eröffnet auch ganz neue Möglichkeiten in der IT-Branche und kann für ein weitgehend selbständiges Arbeiten blinder Menschen sorgen.
Bereits in den ersten Tagen hatte die Finanzierungskampagne ihr Ziel von 10000 Dollar erreicht und bis zum Schluss wurde das Ziel um weitere 5000 Dollar überboten. Daher konnte schnell mit der Entwicklung begonnen werden und nach ersten, nichtöffentlichen Beta-Versionen steht nun das finale Addon auf nvdaremote.com zum Download bereit.

Das Addon funktioniert nach einem Client/Server-Prinzip. Möchte man einen Computer fernsteuern, müssen auf beiden Systemen sowohl NVDA, als auch das Remote-Addon installiert sein. Nun muss der Rechner, der gesteuert werden soll, dies in den Addon-Einstellungen (NVDA-Menü -> Extras -> Remote -> Connect) erlauben. Der erste Radio-Button wählt zwischen Client und Server aus. Soll ein bereits bestehender Server genutzt werden, wählt man hier die Option Client, anschließend den zweiten Auswahlschalter auf "Allow this machine to be controlled" stellen. Als Host trägt man den hostnamen oder die IP des Kontroll-Servers ein. Hier bietet sich der von nvdaremote.com unter gleicher Domain bereitgestellte Server an, falls man einen Rechner über das Internet steuern möchte und keine Portweiterleitung im Netzwerk konfiguriert hat. Natürlich geht das ganze auch im lokalen Netzwerk, hierzu stellt man den ersten Auswahlschalter auf Server und lässt das Feld für die IP-Adresse frei. Abschließend wird noch ein beliebiger Key vergeben, denn schließlich soll nicht jeder auf die Verbindung zugreifen können.
Der Rechner, der nun die Steuerung übernehmen soll, wählt im Verbindungsdialog die Option Client sowie beim zweiten Radio-Button den Wert "Control another machine". Host und Key erklären sich von selbst, hier werden die gleichen Daten wie auf dem anderen Computer eingetragen. Ist der host ein Computer im lokalen Netz, muss entweder dessen IP-Adresse oder der Rechnername eingegeben werden. Nach erfolgreicher Verbindung hört man ein Tonsignal und mit der Taste F11 kann die Kontrolle über den entfernten Rechner übernommen werden. Es werden dabei allerdings nur Tastatureingaben übermittelt und die Sprach-Informationen des Screen-Readers im eigenen NVDA ausgegeben. Was auf dem bildschirm des entfernten Rechners passiert, kann man ebenso wenig ermitteln wie die Ausgabe der Soundkarte. Als kleines Extra bietet das Addon noch die Möglichkeit, den inhalt der Zwischenablage zu übertragen.

Es bleibt abzuwarten, wie sich dieses Projekt noch entwickeln wird. Wünschenswert wäre z. B. eine Braille-Unterstützung, damit auch ein stilles Arbeiten möglich ist. Aber bereits jetzt dürfte das Addon für viele blinde Nutzer eine enorme Hilfe sein. Wo man sich bisher mit Teamviewer abmühen musste, das mehr schlecht als recht die Sprachausgabe überträgt, oder man nur die Dienste kommerzieller Bildschirmleser zur Verfügung hatte, gibt es nun eine vielversprechende Alternative aus der Open-Source-Welt.

NVDA: Neue Sprachausgabe mit alten Prinzipien in Entwicklung

Geschrieben von Steffen Schultz keine Kommentare
Kategorisiert in : Software Schlüsselwörter : A11Y, NVDA, OpenSource, TTS

Für den freien und quelloffenen Bildschirmleser NVDA (Nonvisual Desktop Access) befindet sich derzeit eine neue Sprachausgabe in der Entwicklung. Diese basiert jedoch auf einer verhältnismäßig alten Technologie, nämlich der Formant-Synthese, wie sie bis in die 90er Jahre hinein für TTS-Systeme noch Standard war. Ein bekannter Vertreter dieses Verfahrens zur Sprachausgabe war die sogenannte Klatt-Synthese (benannt nach ihrem Erfinder Dennis Klatt), die wiederum Sprachausgaben wie Dectalk und Eloquence hervorbrachte, letztere kommt bis heute als Standardstimme des kommerziellen Screen-Readers JAWS zum Einsatz. Doch so überholt die Klatt-Synthese mittlerweile sein mag, so gern wird sie vor allem von blinden Computernutzern immer noch verwendet. Wahrscheinlich vor allem deshalb, weil trotz neuester Entwicklungen auf dem Gebiet natürlich klingender Sprachausgaben die auf Formant-Synthese basierenden Stimmen in Sachen Reaktionsschnelligkeit und Speicherauslastung immer noch um ein Vielfaches überlegen sind. Und genau darauf komt es einem blinden Nutzer an, möchte er seinen Computer ebenso schnell bedienen können wie ein sehender Nutzer. Den etwas synthetischen Klang einer Sprachausgabe nimmt man da bis zu einem bestimmten Grad gern in Kauf.

Warum das Rad neu erfinden?

Bislang wurde als Standardstimme für NVDA die quelloffene Sprachausgabe eSpeak ausgeliefert, die auch auf Linuxsystemen für z. B. den Screen-Reader Orca zum Einsatz kommt. Die Modulation dieser Sprachausgabe ist aber selbst für so manch hartgesottenen Nutzer eher eine Zumutung denn eine Hilfe und erinnert mit ihrem robotischen Klang an schlecht produzierte SciFi-Filme der 60er Jahre. Diese Tatsache lässt viele Nutzer zögern, von ihrem bisherigen Screen-Reader auf eine freie und teils sogar überlegenere Alternative umzusteigen, da dies zusätzlich den Erwerb kommerzieller TTS-Systeme bedeuten könnte, deren zweifelsohne hervorragende Qualität jedoch zu Lasten der Schnelligkeit gehen kann. Zwar gibt es für NVDA mittlerweile sogar ein Eloquence-Addon und des Weiteren die Möglichkeit, über die SAPI-Schnittstelle jede im System installierte Sprachausgabe anzusprechen - somit also auch die als SAPI-Gegenstück zur Eloquence anzusehende IBM ViaVoice TTS -, aber offiziell dürfen diese Stimmen gar nicht mehr zum Download angeboten werden. Es gibt jedoch trotzdem genügend halb-legale Download-Quellen, die sich nach kurzer Recherche im Internet finden lassen.
Hier nun setzt die Idee des NV Speech Players an. Er soll eine Neuentwicklung nach bewährten Prinzipien sein. Auch wenn die Quellcodes der Eloquence und anderer Klatt-Systeme nie öffentlich zugänglich waren, gibt es doch genügend Forschungsmaterialien und Beispiel-Quelltexte, auf Basis derer sich durchaus eine neue, auf der klatt-Synthese aufbauende Stimme erstellen lässt. Und die ersten Ergebnisse können sich durchaus hören lassen: Eine Testversion des NV Speech Players, die bislang jedoch nur Englisch spricht, erinnert schon stark an ihre Vorbilder Dectalk und Eloquence und ist schon jetzt der eSpeak klanglich weit überlegen.

Weitere Informationen über die technischen Hintergründe sowie aktuelle Testversionen des benötigten NVDA-Addons finden sich auf der Projektseite bei Bitbucket.

Artikel-Feed (RSS) dieser Tag