[jet_engine component="meta_field" field="antetitulo"]

Inteligencia artificial para analizar el español en Internet

La herramienta RAE-AWS, impulsada por la institución y la compañía tecnológica, permite examinar miles de documentos en redes
inteligencia artificial rae
Santiago Muñoz Machado, director de la RAE. (Imagen: Real Academia Española)

La Real Academia Española (RAE) y Amazon Web Services (AWS) han presentado, dentro del marco del proyecto Lengua Española e Inteligencia Artificial (LEIA), una nueva herramienta de inteligencia artificial que permitirá analizar el español en Internet.

Con la tecnología de la nube de AWS y el asesoramiento de la RAE, permitirá el análisis de la claridad del lenguaje administrativo, la comparación de calidad del español por épocas o la detección de errores comunes en asistentes de voz y otros dispositivos de Inteligencia artificial.

Para ello, de momento cuenta con 8.745.563 documentos de España y todos los países hispanohablantes de América en su versión beta. Las fuentes: el español digital espontáneo actual, concretamente el de textos informales obtenidos de redes sociales, foros o plataformas de venta en línea, y también textos periodísticos para comparar tipos de lenguaje.

Funciona en tres fases: en la primera, se indexan los documentos mediante AWS Lambda; en la segunda, se obtienen métricas -frecuencia, riqueza, variabilidad- que caracterizan los textos gracias a la Inteligencia Artificial y el machine learning y, por último, se indexan los resultados del análisis para su visualización, con sus correspondientes filtros para verlos en tiempo real.

“Hay que convencer a las máquinas"

Santiago Muñoz Machado, director de la RAE, ha declarado en la presentación de la herramienta RAE-AWS que la Academia ha trabajado siempre en la vigilancia de cómo funciona el español, en conjunto de las academias de la lengua donde se habla nuestro idioma, y lo ha hecho mediante trabajos de lectura, de la revisión de la manera de hablar de las expresiones, de los sonidos.

Ha ido haciéndolo “despacio y con un bolígrafo en la mano”, ha asegurado. Haciendo fichas y haciendo que este seguimiento sirva para formar las normas que la RAE elabora y que dirige a los hispanohablantes. “Y tenemos la fortuna de que nos hacen caso. Quien no hace caso a lo que se dice y a ese programa, queda excluido del mundo de los alfabetizados”, ha aseverado.

Según él, esto lo sabían todos los humanos. Hasta ahora. “Las máquinas que se han puesto a hablar y a usar el idioma son un peligro porque no nos hacemos entender bien con ellas y lo que estamos haciendo es ponernos de acuerdo con las empresas tecnológicas para que nos ayuden a convencer a las máquinas que fabrican que es necesario seguir las reglas de la Academia cuando producen bien asistentes de voz o cuando producen traductores. Necesitamos, por tanto, modernizar”, ha explicado.

Para ello, están trabajando en un doble sentido. Primero, convenciendo a estas empresas de que usen bien la lengua y luego pertrechándose de herramientas que la tecnología facilita para mejorar su servicio.

Lo que han presentado pertenece al segundo grupo. “Es una tecnología que nos va a permitir trabajar mejor. Queremos saber cómo varía la lengua o qué dificultades se encuentra en las redes, en Internet. Y lo vigilamos a mano. La herramienta nos permitirá hacerlo de modo automático”.

“Modernidad e innovación, tradición e historia”

“Es prodigioso lo que ha conseguido Amazon Web Services, ha apuntado Muñoz. La herramienta se carga con cualquier clase de documento que se pueda analizar: los periódicos, la administración. “Y cargamos nuestras normas, así que podemos saber si la calidad del lenguaje es suficiente, variado, si se cometen faltas de ortografía, si es correcto desde cualquier punto de vista”.

Miguel Álava, director general de AWS en España y Portugal, también en la presentación, ha añadido que, en muchos aspectos, este proyecto es “pionero” y que puede dar lugar a más evolución en otros campos. “Nuestro deseo es crear, aprender y compartir. Fue así como empezaron nuestras conversaciones con la RAE”.

“Estamos seguros que todas las empresas que trabajan con nosotros se van a beneficiar como portadoras de la lengua española, no solo aquí, sino en todo el mundo. El proyecto aúna muchos componentes importantes para el momento que estamos viviendo. Modernidad e innovación, tradición e historia. Pero es importante remarcar que acaba de nacer, que es el primer paso. Esperamos que haya muchos más”, ha declarado Álava.

Recomendadas