Mundo - Index

Mundo - Mundo-Contact 49 - Index

TECNOLOGIA
pag. 14
Por Ing. Emilio Gandarilla
Subdirector Comercial de Sixbell Nekotec Solutions
Una situación muy frecuente
en México y Latinoamérica
ha sido, sin duda, que al
mencionar tecnología de
reconocimiento de voz, a
clientes y proveedores involucrados en
proyectos del género, les viniera automáticamente
en mente la imagen de
promesas no cumplidas y un fuerte sentimiento
de frustración.
En los últimos años, las tecnologías
de reconocimiento de voz han evolucionado
significativamente, de ser aplicaciones
que sólo lograban reconocer un
“sí”, “no” o un número, a la tecnología
actual, que puede entender un diálogo
natural. La nueva generación de aplicaciones
de reconocimiento de voz tiene
como clave de su éxito el hecho de que
el software debe entender el concepto
que el usuario está tratando de transmitir
cuando habla o dice una frase. Se
Cómo obtener una
aplicación
exitosa de
reconocimiento
de voz
trata de lo más aproximado a la forma
como hablamos con los demás, y al
modo como nuestro cerebro interpreta lo
que está escuchando. Así, los usuarios
no tienen que restringirse a expresar lo
que quieren a partir de un patrón previamente
diseñado, sino que se expresan
normalmente como si hablaran con otra
persona. Por ejemplo, si alguien dice:
“tengo un problema con mi computadora”,
“mi computadora está fallando”, “mi
computadora se trabó”, “la computadora
tiene una pantalla azul”, la aplicación
de reconocimiento de voz entiende que
lo que el usuario desea es hablar con
alguien que le pueda ayudar a resolver
un problema con su computadora, por
lo que la llamada deberá transferirse a
soporte técnico.
También ya es posible incluir un guión
automatizado que vaya orientando al
usuario para que él mismo pueda re-
solver fallas sencillas, sin que necesite
intervenir un asesor por el teléfono.
En el mercado existen soluciones que
simplifican el proceso de desarrollo de
aplicaciones de reconocimiento de voz
por medio de interfaces gráficas para
programar las gramáticas correspondientes,
pero el trabajo más importante
para lograr una aplicación exitosa de reconocimiento
de voz, debe hacerse antes
de empezar la programación general.
Dicho trabajo incluye un proceso previo
de consultoría y de análisis del contexto
en el cual va a funcionar la aplicación.
En el transcurso de dicho proceso,
un psicólogo analiza el contexto en el
que opera la organización, estudia el
comportamiento de las personas que
comúnmente utilizan el servicio en
cuestión, y establece las posibilidades
en las que los usuarios pueden interactuar
con el servicio. Todo ello mediante