Proyecto PUCP busca extender el uso del quechua
Investigadores del Grupo de Telecomunicaciones Rurales (GTR) de nuestra Universidad se encuentran desarrollando un sistema que permitirá que computadoras y dispositivos móviles reconozcan el quechua sureño.
Texto:
Diego GrimaldoFotografía:
Alex Fernandez
Si bien, según la Organización de las Naciones Unidas para la Educación, la Ciencia y la Cultura (Unesco), existen más de 6 mil lenguas, el 96% de estas son habladas por, aproximadamente, el 3% de los habitantes del mundo. La diversidad de lenguas es muy importante para el patrimonio de la humanidad; sin embargo, sea por influencias externas (como sometimiento militar, económico o cultural) o internas (como migración, desastres naturales o crisis humanitarias), muchas de estas están en peligro de desaparecer. El quechua, con toda su importancia histórica y riqueza cultural para nuestro país, es una de ellas.
Evitar que esta vulnerabilidad termine, finalmente, por hacer desaparecer el quechua es el motor para que el grupo de investigadores del Grupo de Telecomunicaciones Rurales (GTR) de nuestra Universidad se encuentre desarrollando un sistema que permitirá que computadoras y dispositivos móviles entiendan, hablen, escriban, traduzcan y enseñen el quechua sureño con el fin de incentivar su uso. Liderado por el Mg. Luis Camacho, busca crear un software capaz de traducir el quechua a los idiomas más hablados del mundo.
“Nuestra misión es desarrollar la portabilidad computacional del idioma quechua sureño. Asimismo, nuestra visión es ayudar a que América se convierta en un continente de ciudadanos políglotas que hablen las lenguas francas, pero también varias lenguas nativas”, afirma Camacho. “Hay herramientas que permiten transcribir todo lo que uno dice. Esto está disponible para el inglés, el castellano y otras lenguas (muy usadas), pero en el mundo hay siete mil idiomas. Muchas de ellas son autóctonas de comunidades desfavorecidas que no han conseguido el primer plano de desarrollo económico, que están rezagadas y que tienen un alto riesgo de desaparecer. Creo que hay valor en nuestros idiomas. Es un derecho humano conservar la cultura y, además, hay un valor intrínseco que podría ser aprovechado”, añade.
Cuenta el especialista que la idea de crear este sistema nació hace 10 años cuando reconoció el enorme potencial que tenían los primeros trabajos de portabilidad computacional realizados en otros idiomas, sin embargo, no fue hasta hace 2 que el proyecto se inició, formalmente, gracias al Fondo Nacional de Desarrollo Científico y Tecnológico (Fondecyt) y, posteriormente, al Concurso Anual de Proyectos de Investigación de la PUCP (CAP 2016).
Paso a paso
El proyecto, denominado “Implementación del Sistema Computacional de Reconocimiento Automático del idioma Quechua Sureño (Chanka y Collao)”, ha sido llevado a cabo en dos frentes. Por un lado, la rama computacional, que apunta a presentar un beta de un sistema de conversión de voz a texto durante el primer semestre de este año. Por otro, el establecimiento de un corpus que sirva como base de datos para el software.
“Hemos avanzado la parte computacional apostando por redes neuronales, que es el paradigma actual, pues es como están construidos, por ejemplo, Google Translate y Microsoft Cortana. Hemos tomado el modelo de Baidu, lo hemos adaptado y usado para entrenar a nuestro propio sistema reconocedor de quechua”, detalla Camacho. “En el caso del corpus, lamentablemente, esto no es fácil, pues el costo para hacerlo es elevado. Necesitamos registrar, por lo menos, 100 mil horas, así que, por este motivo, estamos apostando por el voluntariado”, comenta.
Apoyo voluntario
Para desarrollar el proyecto en toda su extensión, el equipo de investigadores del GTR PUCP busca el apoyo de voluntarios que puedan grabar su voz y contribuir con la base de datos del programa. “Solo es necesario que los voluntarios tengan internet. La persona escucha una locución que luego tiene que repetir. Incluso, si siente que lo hizo mal, puede volverlo a intentar”, asegura Camacho. (Si quieres contribuir con el proyecto, puedes hacer clic aquí)
Actualmente, el equipo busca la colaboración, además, de alguna entidad que pueda hacer sostenible el proyecto, pues tiene la intención de ofrecer el software gratuitamente, una vez que esté completada su fase alfa, y extender su uso a otras variedades de quechua y otras lenguas originarias. “Muchas de las cosas que hemos aprendido para procesar quechua las podemos emplear para otros idiomas, así que esto se puede multiplicar”, indica el especialista.
Además de Camacho, el equipo que se encuentra trabajando en el sistema computacional de reconocimiento automático del quechua está formado por Reynaldo Baquerizo, Rodolfo Zevallos, Nelsi Melgarejo y Lorenzo Ruiz de la Vega, todos miembros del Grupo de Telecomunicaciones Rurales (GTR) de la PUCP.
Más información: Las empresas u organizaciones que se encuentren interesadas en auspiciar este proyecto pueden comunicarse con Luis Camacho escribiendo al correo camacho.l@pucp.pe o llamando al número 966422108.
Deja un comentario
muy interesante
Como hicieron su plan yo soy maestra de escuelas rural central