Carlos Moreno Morera es el ganador Gold de la categoría Data4Innovation de los premios Curiosity Data Science Iberian Awards, que hemos organizado este año por primera vez desde SAS, junto a SPAIN AI y la Asociación Portuguesa de Ciencia de Datos (DSPA). Originario de Santa Cruz de Tenerife, Carlos es graduado en Ingeniería Informática y Matemáticas por la Universidad Complutense de Madrid. Ya en su etapa universitaria despertó su interés por la inteligencia artificial y la ciencia de datos e incluso llegó a clasificarse en la final nacional del Santander Smart Talent Artificial Intelligence Challenge. Desde entonces ha desarrollado su carrera profesional en distintas organizaciones y actualmente es consultor de inteligencia artificial en IBM.
Análisis basado en el destinatario
En la primera edición de los premios Iberia Curiosity Awards de SAS has sido galardonado en la categoría de Data4Innovation. ¿Podrías explicarnos en qué consiste tu proyecto?
Mi proyecto plantea un análisis de la forma de escribir en función del destinatario de un correo electrónico. La hipótesis de partida es que cada uno de nosotros, cuando escribimos un mensaje de este tipo, lo hacemos de forma diferente en función de la persona a la que lo estemos dirigiendo, ya sea alguien de nuestra familia, nuestro jefe o nuestro compañero de trabajo.
Para llevar a cabo el proyecto, en primer lugar, me fijé en distintas características de los correos electrónicos de los usuarios para intentar discernir cuáles nos permiten diferenciar entre los posibles destinatarios. Para ello analicé todos los textos, y a partir de ahí apliqué métricas (porcentaje de determinantes, complejidad del texto, entropía, etc.). Empezamos analizando 30 características y, finalmente, llegamos hasta ocho métricas bastante “sencillas” de calcular, gracias a las cuales podíamos saber a qué tipo de destinatario le íbamos a mandar el correo.
Una vez realizado este análisis, el proyecto plantea un modelo de reescritura de correos electrónicos. Parte de la base de que las plataformas de emails, como Outlook o Gmail, generan millones de correos electrónicos muy similares entre sí, por lo que ahorraría mucho tiempo poder buscar uno similar al que queramos escribir y simplemente modificar determinadas palabras por sinónimos. También se pueden cambiar construcciones o variar el número de adjetivos o adverbios si queremos que el lenguaje sea más complejo. En definitiva, se trata de tener un texto base y poder adaptarlo a la persona que lo escribe.
¿Cómo surge este proyecto? ¿Cómo detectaste la necesidad que busca cubrir?
En la carrera siempre he sido un apasionado de lo que ahora, por suerte, me dedico: el procesamiento del lenguaje natural, una rama de la inteligencia artificial que se encarga de interactuar con los humanos de manera más natural. Además, dirigía un grupo de teatro cuya gestión se realizaba por correo electrónico. Esto me hizo darme cuenta de que muchos de estos mensajes eran casi iguales, pero como iban destinados a distintas personas, había que cambiar un poco la forma.
Este doble interés me llevó a investigar sobre estudios de generación de lenguaje natural y de estilometría: cómo se compenetraban ambos campos o cómo escribir para que una máquina genere lenguaje para que el usuario o el humano le entienda más fácilmente. Descubrí que nunca se había estudiado la estilometría en los mensajes de correo electrónico, esa dependencia de cómo se escribe en función de a quién nos dirigimos.
El análisis estilométrico es una disciplina que tiene aplicación en el ámbito de las humanidades. ¿Qué importancia consideras que tiene el uso de la tecnología en mundos más tradicionales como éste?
La tecnología necesita y ayuda a las humanidades, y viceversa. Ya no somos de ciencias tecnológicas o de ciencias de la salud, humanidades o artes. Por ejemplo, en el campo del lenguaje natural, trabajo con lingüistas y se tiende a esos equipos multidisciplinares.
La tecnología ayuda a las humanidades a adaptarse a los cambios tecnológicos y, por ende, a los cambios sociales. También puede dar pie a experimentos humanísticos que no serían posibles en caso de que no existiera esa tecnología. Un ejemplo de ello serían los famosos hilos de Twitter, que podríamos considerar prácticamente una nueva literatura.
Al mismo tiempo, las humanidades nos obligan constantemente a hacernos preguntas que nos llevan a desarrollar o redirigir la tecnología en todos los ámbitos. Por ejemplo, en el mundo de la inteligencia artificial se ha cuestionado mucho el coche autónomo, por las implicaciones filosóficas que puede tener.
Datos para innovar
Como decíamos tu proyecto se engloba en la categoría Data4Innovation, ¿qué potencial crees que tiene el uso de los datos para impulsar la innovación?
Los datos son sinónimo de innovación. Somos capaces de parametrizar y cuantificar casi todo en nuestra vida y tenemos la capacidad suficiente de cómputo tanto para procesar los datos como para almacenarlos. Estos patrones y características nos pueden llevar a encontrar nuevas áreas de investigación y llevar más allá la tecnología. En un mundo en el que casi todo es cuantificable y somos capaces de capturar y registrar todo tipo de datos, la habilidad de extraer valor de ellos será determinante para innovar y encontrar soluciones a los problemas a los que se enfrentan la sociedad, las empresas y los individuos. Pero, para que las respuestas que obtengamos de los datos sean valiosas, es imprescindible saber primero qué analizar y encontrar las preguntas adecuadas.
El origen de estos premios está en poner en valor la curiosidad que ha llevado a desarrollar estos proyectos. ¿Cómo ha influido la curiosidad en tu labor como científico de datos?
La curiosidad es una herramienta imprescindible en todos los trabajos, pero de forma especial en un ámbito y un mundo que está en constante evolución, como es la ciencia de datos. Creo que la curiosidad es el despertador de la innovación, porque es necesaria para conocer e idear nuevas soluciones más avanzadas e innovadoras que permitan afrontar nuevos retos. Desde que era estudiante, la curiosidad ha sido el motor que me ha llevado a profundizar en la ciencia de datos, en la inteligencia artificial y las tecnologías que las rodean y, gracias a ella, he llegado a entender cómo se comportan los datos y encontrar un mundo muy amplio en el que cualquier dato puede ser recogido y de una gran parte de ellos se puede extraer un conocimiento y un valor que nos permite descubrir cosas nuevas.
¿Qué supone para ti a nivel personal y profesional este reconocimiento?
Supone una satisfacción personal y profesional. A nivel personal es una gran alegría y es una forma de agradecer a mis padres todo lo que me han dado. Desde el punto de vista profesional es un gran reconocimiento a mi trabajo. Puedo decir que soy un profesional de la inteligencia artificial, porque tengo los conocimientos y las habilidades necesarias para abordar el procesamiento del lenguaje natural y este premio me pone al nivel de otros profesionales que también han presentado sus proyectos al certamen.
¿Quieres aprender ciencia de datos? Conoce SAS Academy Data Science.