Inteligencia artificial para analizar el español en Internet

La herramienta RAE-AWS, impulsada por la institución y la compañía tecnológica, permite examinar miles de documentos en redes
inteligencia artificial rae
Santiago Muñoz Machado, director de la RAE. (Imagen: Real Academia Española)

La Real Academia Española (RAE) y Amazon Web Services (AWS) han presentado, dentro del marco del proyecto Lengua Española e Inteligencia Artificial (LEIA), una nueva herramienta de inteligencia artificial que permitirá analizar el español en Internet.

Con la tecnología de la nube de AWS y el asesoramiento de la RAE, permitirá el análisis de la claridad del lenguaje administrativo, la comparación de calidad del español por épocas o la detección de errores comunes en asistentes de voz y otros dispositivos de Inteligencia artificial.

Para ello, de momento cuenta con 8.745.563 documentos de España y todos los países hispanohablantes de América en su versión beta. Las fuentes: el español digital espontáneo actual, concretamente el de textos informales obtenidos de redes sociales, foros o plataformas de venta en línea, y también textos periodísticos para comparar tipos de lenguaje.

Funciona en tres fases: en la primera, se indexan los documentos mediante AWS Lambda; en la segunda, se obtienen métricas -frecuencia, riqueza, variabilidad- que caracterizan los textos gracias a la Inteligencia Artificial y el machine learning y, por último, se indexan los resultados del análisis para su visualización, con sus correspondientes filtros para verlos en tiempo real.

“Hay que convencer a las máquinas"

Santiago Muñoz Machado, director de la RAE, ha declarado en la presentación de la herramienta RAE-AWS que la Academia ha trabajado siempre en la vigilancia de cómo funciona el español, en conjunto de las academias de la lengua donde se habla nuestro idioma, y lo ha hecho mediante trabajos de lectura, de la revisión de la manera de hablar de las expresiones, de los sonidos.

Ha ido haciéndolo “despacio y con un bolígrafo en la mano”, ha asegurado. Haciendo fichas y haciendo que este seguimiento sirva para formar las normas que la RAE elabora y que dirige a los hispanohablantes. “Y tenemos la fortuna de que nos hacen caso. Quien no hace caso a lo que se dice y a ese programa, queda excluido del mundo de los alfabetizados”, ha aseverado.

Según él, esto lo sabían todos los humanos. Hasta ahora. “Las máquinas que se han puesto a hablar y a usar el idioma son un peligro porque no nos hacemos entender bien con ellas y lo que estamos haciendo es ponernos de acuerdo con las empresas tecnológicas para que nos ayuden a convencer a las máquinas que fabrican que es necesario seguir las reglas de la Academia cuando producen bien asistentes de voz o cuando producen traductores. Necesitamos, por tanto, modernizar”, ha explicado.

Para ello, están trabajando en un doble sentido. Primero, convenciendo a estas empresas de que usen bien la lengua y luego pertrechándose de herramientas que la tecnología facilita para mejorar su servicio.

Lo que han presentado pertenece al segundo grupo. “Es una tecnología que nos va a permitir trabajar mejor. Queremos saber cómo varía la lengua o qué dificultades se encuentra en las redes, en Internet. Y lo vigilamos a mano. La herramienta nos permitirá hacerlo de modo automático”.

“Modernidad e innovación, tradición e historia”

“Es prodigioso lo que ha conseguido Amazon Web Services, ha apuntado Muñoz. La herramienta se carga con cualquier clase de documento que se pueda analizar: los periódicos, la administración. “Y cargamos nuestras normas, así que podemos saber si la calidad del lenguaje es suficiente, variado, si se cometen faltas de ortografía, si es correcto desde cualquier punto de vista”.

Miguel Álava, director general de AWS en España y Portugal, también en la presentación, ha añadido que, en muchos aspectos, este proyecto es “pionero” y que puede dar lugar a más evolución en otros campos. “Nuestro deseo es crear, aprender y compartir. Fue así como empezaron nuestras conversaciones con la RAE”.

“Estamos seguros que todas las empresas que trabajan con nosotros se van a beneficiar como portadoras de la lengua española, no solo aquí, sino en todo el mundo. El proyecto aúna muchos componentes importantes para el momento que estamos viviendo. Modernidad e innovación, tradición e historia. Pero es importante remarcar que acaba de nacer, que es el primer paso. Esperamos que haya muchos más”, ha declarado Álava.

Especiales

Ajustes
Innovación española

A través del presente Panel de Configuración, puede aceptar o rechazarlas en su totalidad o puede seleccionar qué tipo de cookies quiere aceptar y cuáles quiere rechazar.

Para obtener más información, acceda a nuestra Política de Cookies

Cookies técnicas

Las cookies técnicas que son estrictamente necesarias y permanecen siempre activas son para que el usuario acceda y navegue en INNOVASPAIN.COM.

Cookies de Preferencias o personalización

Utilizamos cookies de personalización que son aquellas que, tratadas por nosotros o por terceros, nos permiten recordar información para que el usuario acceda al servicio con determinadas características que pueden diferenciar su experiencia de la de otros usuarios.

Si desactivas esta cookie no podremos guardar tus preferencias. Esto significa que cada vez que visites esta web tendrás que activar o desactivar las cookies de nuevo.

Cookies Analíticas

Utilizamos cookies de análisis o medición que son aquellas que, tratadas por nosotros o por terceros, nos permiten el seguimiento y análisis del comportamiento de los usuarios de los sitios web a los que están vinculadas, incluida la cuantificación de los impactos de los anuncios.