Ir al contenido principal Ir al menú principal Ir al pie de página

"La minería de datos es un área multidisciplinaria"

El doctor Poncelet investiga, desde hace ya varios años, los alcances de lo que se conoce como minería de datos. Se trata de especialidad basada en el uso de algoritmos que tiene como fin la obtención de patrones de información en grandes volúmenes de datos. Fue invitado por Escuela de Posgrado de nuestra Universidad para dar una charla sobre dicha materia.

  • Pascal Poncelet
    Docente de la Universidad de Montpellier 2, Francia

¿Qué problemas resuelve la minería de datos?

La minería de datos busca obtener patrones determinados a partir de gran cantidad de información. De esta manera puede encontrar o descubrir conocimiento importante. Hay un problema clásico en minería de datos: en un supermercado en Estados Unidos se encontró que los fines de semana había mucha venta de cerveza y pañales a la vez, no se entendía por qué. A través de las técnicas de minería de datos en este caso de asociación, encontraron que los padres de familia iban a comprar pañales los fines de semana pero también compraban cerveza. A partir de entonces se colocó la cerveza y los pañales juntos para que se vendan más rápidamente. Ese es un patrón de comportamiento que se puede encontrar a través de minería de datos.

¿La minería de datos también puede ser aplicada a otros ámbitos, como la salud?

Desde luego. Con la minería de datos se trabaja en muchos problemas, especialmente aquellos que están relacionadas con el medio ambiente, el cambio climático, la salud. Actualmente, con mi equipo de investigaciones estamos haciendo un trabajo de minería de datos para analizar la parte genética de la sangre para detectar el VIH.

¿Cómo lo hacen?

Tomamos las secuencias del gen. Luego extraemos parte de esa secuencia como un patrón y tratamos de encontrar o generar nuevas secuencias para poder detectar la enfermedad, que en este caso puede ser el comportamiento del virus del sida.

La palabra “minería” alude a la búsqueda de metales preciosos…

Sí, son conceptos que están asociados. Al igual que en la actividad minera, donde se busca y busca para encontrar, por ejemplo, una pepita de oro. Para nosotros esas pepitas de oro son los patrones de interés, el conocimiento.

¿Los científicos computacionales requieren del apoyo de otros especialistas para hacer su labor?

Sí, es necesario contar con gente de otras áreas, como la lingüística. En este caso, los lingüistas nos ayudan a interpretar los textos y poder extraerlos del big data. En el caso de la salud, consultamos con especialistas de la salud. En cuanto a lo que son imágenes geográficas, si quieres ver algo de agricultura, trabajamos con agrónomos. La minería de datos es un área multidisciplinaria. Lo interesante es que todos los algoritmos que aplicamos desde la ciencias de la computación, pueden ser aplicados a diferentes problemas.

¿Desde cuándo se empieza a usar la minería de datos?

A partir de los años 90 nace este concepto en la comunidad científica de ciencias de la computación. Anteriormente al término ya existían determinadas técnicas para obtener patrones, como la estadística analítica, la inteligencia artificial. La minería de datos es también la unión de distintas áreas, incluye a la gente que manejaba la base de datos, los que investigan sobre inteligencia artificial, la estadística y la visualización.

¿Cómo se interesa por este tema?

Anteriormente trabajaba con bases de datos. Las administraba y gestionaba. Pero llegó un momento en que era tanta la cantidad de información que se podía manejar que me vi en la necesidad de poder extraer conocimiento de esa base de datos. Ahí fue cuando incursiono en las técnicas de minería de datos.

Etiquetas:
ESCUELA DE POSGRADO

Deja un comentario

Cancelar
Sobre los comentarios
Tu dirección de correo electrónico no será publicada. Los comentarios pasan por un proceso de moderación que toma hasta 48 horas en días útiles. Son bienvenidos todos los comentarios siempre y cuando mantengan el respeto hacia los demás. No serán aprobados los comentarios difamatorios, con insultos o palabras altisonantes, con enlaces publicitarios o a páginas que no aporten al tema, así como los comentarios que hablen de otros temas.