17 de octubre del 2017

Voz y brecha digital

David Chávez Muñoz

Coordinador de la Sección Ingeniería de las Telecomunicaciones

Plataformas de acceso público, como Siri de Apple, Alexia de Amazon, Cortana de Microsoft, Google Assistant de Alphabet, Bixby de Samsung, entre otras, permiten una experiencia interactiva que cada vez se enriquece tanto en diversidad de opciones de uso como en la potencia y complejidad de la interacción.

Muchas otras lenguas quedan excluidas, entre ellas quechua, aimara, shipibo-conibo, awajún y otros más, cuya importancia en la realidad multilingüe y pluricultural del Perú huelga comentar.

Actualmente, somos testigos de un cambio tecnológico disruptivo en lo relacionado con la relación sensorial entre humanos y computadoras. La interfaz preferente ha sido, y lo es todavía en gran medida, visual – táctil – kinestésico. Es una manera enrevesada de decir que la interacción principal, por caudal de datos transmitidos y por prioridad de uso, es a través del teclado, la pantalla y el mouse (o la pantalla táctil, en todo caso).

Avances tecnológicos significativos hacen ahora totalmente viable que la voz asuma el rol de interfaz preferente. Cabe recordar que los últimos veinte años hemos visto un proceso realimentado de innovación muy dinámico, tanto en el campo del procesamiento digital como en las técnicas del tratamiento de la voz y el audio en general. Plataformas de acceso público, como Siri de Apple, Alexia de Amazon, Cortana de Microsoft, Google Assistant de Alphabet, Bixby de Samsung, entre otras, permiten una experiencia interactiva que cada vez se enriquece tanto en diversidad de opciones de uso como en la potencia y complejidad de la interacción. La voz tiene la ventaja de habilitar dicha interacción sin requerir una posición corporal específica y, sobre todo, libera las manos y la vista, de manera que puede usarse a bordo del automóvil o en otras circunstancias imposibles para interfaces que requieran fijar la visión. En suma, se puede participar en una sesión interactiva con la computadora o un sistema de información en simultáneo con otra actividad.

Pero al decir voz, estamos en realidad indicando una señal audible que representa a una lengua, a un idioma, a una cultura y, por supuesto, a una cosmovisión. Los hechos demuestran que no todas las lenguas se pueden usar en una interfaz de voz. Seguro que inglés, japonés, francés, alemán, coreano y chino mandarín se cuentan entre aquellos que sí se pueden escoger. A estas las llamaremos “lenguas técnicas”, porque su conformación gramatical, sintáctica, fonética, vocabulario y otras características han sido incorporadas a modelos computables para que formen parte de las interfaces hombre-máquina. Pero muchas otras lenguas quedan excluidas, entre ellas quechua, aimara, shipibo-conibo, awajún y otros más, cuya importancia en la realidad multilingüe y pluricultural del Perú huelga comentar. Llamaremos a estas últimas “lenguas no técnicas”, porque su abordaje es incipiente o no se ha hecho aún en los términos señalados.

Se configura así una nueva manifestación de la brecha digital. Si para una persona su lengua cotidiana está en el primer conjunto, entonces puede hacer uso de todas las ventajas que trae consigo el disponer de esta interfaz: hacer compras, enviar mensajes, leer libros, acceder a servicios y gestiones, ordenar pagos, etc. Si la lengua está en el segundo conjunto, la persona se ve obligada a aprender y a usar otra lengua o, simplemente, queda excluida de la interacción con los sistemas de información que usan voz.

En la medida que la adopción de interfaces de voz se haga masiva, los hablantes de lenguas técnicas potenciarán su capacidad de beneficiarse de la interacción persona-sistema de información. Y en esa misma medida, por exclusión, crecerá la diferencia en beneficios en contra de las personas cuya lengua materna o cotidiana sea una no técnica.

Queda entonces la tarea de trabajar con urgencia el quechua, el aimara y las lenguas amazónicas para habilitarlas como lenguas técnicas en las interfaces de voz de los sistemas de información. Los conversores de texto-a-voz y voz-a-texto, por ejemplo, son buenos puntos de partida de cara a lo que falta desarrollar para incorporar una lengua al primer grupo. Es un trabajo interdisciplinario por naturaleza, que, gracias al acceso a fondos concursables del Estado, ya hemos iniciado para la lengua quechua en el Departamento de Ingeniería, concretamente en el Grupo de Telecomunicaciones Rurales – Sección Ingeniería de las Telecomunicaciones.

Calificar (No Ratings Yet)

DEJA UN COMENTARIO