martes, 25 de noviembre de 2008

Your pad or MiPad

Continuando con este asunto de las interfaces de voz, una de las primeras aplicaciones desarrolladas por Microsoft en los laboratorios de reconocimiento de voz es MiPad. La aplicación es "multimodal interactive notepad", y está pensada para dispositivos móviles. Según los laboratorios de Microsoft, es la combinación perfecta entre comandos de voz y el uso de un stylus. Aquí se muestra un ejemplo de baja fidelidad de la aplicación:



La idea es que al presionar "Tap & Talk" los campos que son difíciles de llenar con un stylus, sean llenados con comandos de voz. Y como se trata de campos predefinidos, el reconocedor de voz puede trabajar de mejor forma, ya que en campos donde se pide un número telefónico el sistema esperará vocalizaciones relacionadas con dígitos, o bien con nombres para el caso de otros registros.

El software esaba pensado enn un inicio para el uso interno de los investigadores en Microsoft; sin embargo tuvo tanto éxito que se programó una versión comercial para iPaq de Compaq. Un video de la demostración puede ser consultado aquí.

MiPad ofrece la posibilidad de corregir una palabra a través de menús contextuales, haciendo tap sobre una palabra equivocada y luego repitiendo el comando de voz para corregirla. El formato Tap y habla (Tap and talk) siempre está disponible en el dispositivo, permitiendo crear accesos directos a las aplicaciones de la iPaq sin tener que muchos clics con el incómodo stylus. "Quiero registrar una cita" abrirá inmediatamente el formulario para guardar citas.

Como vemos en el ejemplo anterior, las ventajas de las interfaces manejadas por voz son interesantes. Por enlistar algunas observamos:

1. Se dispone de las manos y la vista libres. En el caso del ejemplo anterior sería un modo más eficiente pra introducir texto.

2. Ideal para discapacitados. En aplicaciones Web o de escritorio para ciegos, o con problemas que impidan introducir texto de manera natural. Por ejemplo, una página Web puede ser leída automáticamente después de una búsqueda por voz.

3. Ideal para personas con poca habilidad en el teclado. Interfaces basadas en voz son útiles para aquellos que escriben lento en el teclado.

4. Personas disléxicas. Las interfaces de voz minimizan este problema ya que la dislexia se presenta generalmente al escribir

[Microsoft 2008]
Microsoft Speech Lab, 2008. Your Pad or MiPad. Speech Technology Home.


[Kirriemuir 2003]
John Kirriemuir, 2003. Speech Recognition Technologies.