Nada escapa a la inteligencia artificial. Ni siquiera la belleza. El grupo Computer Vision and Pattern Discovery (Visión por ordenador y descubrimiento de patrones) de la Universidad del País Vasco (UPV/ EHU) es prueba de ello. Los investigadores que lo integran están aplicando técnicas de aprendizaje automático a distintos tipos de imágenes, desde biomédicas (como detección de células, tejidos, tumores), hasta de peatones y rostros, para predecir la belleza y estimar la edad de las personas cada vez mejor, según lo demuestran en un estudio publicado en la revista Expert Systems With Applications.
“En realidad para nosotros la predicción de la belleza es una excusa para diseñar nuestros modelos de análisis facial. Dada una imagen facial, se pueden intentar predecir características numéricas como la edad o la belleza (si viene dada por una puntuación), o categorías como el género, la raza, la expresión facial, etc.”, aclara Ignacio Arganda, investigador del Departamento de Ciencias de la Computación e Inteligencia Artificial de la UPV/ EHU y líder del grupo de investigación.
De acuerdo con Arganda, lo importante es tener un conjunto de imágenes ya etiquetadas (de las que ya se conocen esas características o categorías) para entrenar a los modelos y que sean capaces de predecir mejor en imágenes nuevas. Para poder comparar esos modelos, se suelen utilizar datos públicos. Así, todo el mundo utiliza las mismas imágenes.
“En nuestro artículo sobre la predicción de la belleza usamos dos conjuntos de datos públicos que traían una serie de puntuaciones (dadas por anotadores humanos) por imagen. Nuestro objetivo era, por tanto, hacer un sistema que reprodujera del modo más preciso posible dichas puntuaciones, pero de forma automática”, detalla.
“Básicamente, utilizamos técnicas modernas de inteligencia artificial para resolver problemas de imagen muy diversos, en imágenes de todo tipo: 2D, 3D, vídeos, etc”, agrega Arganda.
Los expertos utilizan también técnicas semisupervisadas (en las que no todas las imágenes están etiquetadas). El equipo ha demostrado que el aprendizaje semisupervisado, nunca utilizado hasta ahora para este tipo de problemas, da incluso mejores resultados que el supervisado (en el que todas las imágenes están etiquetadas).
El interés en la predicción de la belleza del equipo es en este caso “puramente académico”. Sin embargo puede ser útil en webs de citas, para intentar emular las elecciones de sus usuarios y proponerles mejores parejas, o en aplicaciones de fotos para sugerir las fotos más favorables. “Obviamente, al modelar las votaciones humanas se emulan también sus preferencias y sesgos, con todo lo que ello implica”, asegura el experto.
Respecto a la estimación de la edad, utilizan redes neuronales convolucionales (CNN): “lo que se tiene es una imagen de entrada; una serie de filtros van extrayendo características que ayudan a tomar la decisión final, o sea un número, en este caso la edad”, precisa Arganda.
Para ello, los autores llevaron a cabo un estudio empírico para ver qué funciones de error ayudan a entrenar mejor a las redes. Estos errores en las estimaciones se pueden minimizar.
Para este tipo de predicciones y estimaciones, los investigadores utilizan redes neuronales profundas, “redes con muchísimas conexiones, muchísimos filtros y millones de datos”, subraya Arganda. El investigador explica que también se encuentran investigando un campo llamado inteligencia artificial explicable o interpretable que estudia técnicas con las que dilucidar “en qué pone la red su atención”.
El investigador alerta que las técnicas de aprendizaje automático nos afectan en la vida más de lo que pensamos. “Se están generando muchísimos datos y se están tomando decisiones de alto nivel en función de estos sistemas. Es muy importante tener en cuenta el factor ético. De hecho, en el aprendizaje automático se utilizan bases de datos gigantescas con las que se entrenan los modelos, y todos los sesgos que contienen estos datos se replican en las predicciones y estimaciones que hacen los modelos, y puede ser realmente nocivo. En ese sentido, hay investigaciones abiertas en la que se estudia cómo quitar los diferentes sesgos de los datos”.