La IA generativa, explicada para niños

A diferencia de la fuerza o la rapidez, la inteligencia es una cualidad difícil de definir o de medir.

Normalmente hablamos de inteligencia como la habilidad para resolver problemas, utilizar información, razonar o aprender de la experiencia.

La especie humana ha creado herramientas para resolver muchos tipos de problemas: una lanza para cazar, recipientes para almacenar comida… Pero ¿qué pasa con los problemas más difíciles, los que requieren inteligencia para ser resueltos? También construimos herramientas para ayudarnos en estas tareas complejas. Las herramientas que intentan imitar las capacidades de la inteligencia humana se conocen como inteligencia artificial (IA).

Dentro de una IA

La IA se aplica a muchos tipos de problemas, desde jugar al ajedrez o decidir cuándo un correo electrónico es spam hasta detectar un incendio en una fotografía aérea. Cada problema requiere usar una técnica diferente.

Para resolver problemas complejos, muchas veces recurrimos a las matemáticas y la estadística para encontrar la mejor solución. Pero también tenemos otra posibilidad: inspirarnos en cómo problemas parecidos se resuelven en la naturaleza.

Este es el caso de las redes neuronales. En los humanos y los animales, el cerebro es el órgano que recibe información de los sentidos y la procesa para tomar decisiones y reaccionar de forma apropiada. Si el cerebro es lo que que nos hace inteligentes, ¿no es razonable que la IA pueda imitar al cerebro?

El cerebro está formado por una red de células llamadas neuronas. Estas neuronas están conectadas entre sí y se comunican enviando señales eléctricas a sus vecinas. Algunas IAs copian este modelo de funcionamiento y están formadas por una red que conecta a muchos componentes sencillos que equivalen a las neuronas. Cada componente o “neurona” recibe un número como entrada, hace un cálculo sencillo y envía el resultado a sus “neuronas” vecinas. A lo largo de la red, los cálculos sencillos de cada una de ellas se acaban combinando entre sí para producir el resultado. De esta forma, una decisión o cálculo complejo se realiza combinando muchos cálculos simples.

¿Qué es la IA generativa?

La IA generativa (IAG) es una rama de la IA que intenta generar contenidos según los requisitos indicados por el usuario. Herramientas como ChatGPT, Claude o DeepSeek pueden escribir texto, programar, crear imágenes o generar vídeos según les pidamos.

Todos los sistemas de IA generativa actuales consisten en una red neuronal de gran tamaño, con miles de millones de “neuronas” y conexiones entre ellas. La red tiene varias capas de “neuronas”, cada una conectada con la siguiente.

Esta red neuronal recibe como entrada una secuencia de palabras e intenta predecir qué palabra vendrá después. Si le damos como entrada una pregunta, nos devolverá la primera palabra de una posible respuesta. Repitiendo el proceso, añadiendo la palabra anterior cada vez, la red irá escribiendo una respuesta completa de palabra en palabra.

Por ejemplo, si recibe como entrada la secuencia de palabras “¿Cómo te llamas?”, la red neuronal habrá aprendido que las respuestas a este tipo de preguntas empiezan con la palabra “Me”. Si la secuencia es “¿Cómo te llamas? Me”, propondrá como siguiente palabra “llamo”, la siguiente podría ser “ChatGPT” y luego quizás la palabra especial “FIN” para terminar su respuesta. De esta forma habrá construido la respuesta “Me llamo ChatGPT”, palabra a palabra.

¿Cómo sabe la IAG qué palabra tiene que generar?

Cuando hablamos de una red neuronal, detrás siempre hay un cálculo matemático. Para empezar, cada palabra se traduce a un conjunto de números. No se eligen unos números cualquiera: su valor intenta representar el significado de la palabra y su relación con otras palabras similares.

Por ejemplo, imagina que al color blanco le asignamos el valor “1”, al negro el color “0”. En ese caso, al gris le podríamos asignar “0.5”, para describir algo a medio camino entre blanco y negro. Si en vez de un solo número asignamos una lista de números a la misma palabra, podríamos “medir” múltiples aspectos del significado de esa palabra: el color, el tamaño, el gusto, si da miedo o no…

Esta lista de números se envía como entrada a las “neuronas” de la capa inicial. Cada neurona calculará un valor (un número) usando una fórmula matemática que combina los valores de sus entradas, y se lo enviará a la sus “neuronas” vecinas de la capa siguiente. Repitiendo este cálculo en cada capa, avanzaremos por la red hasta llegar a la capa de salida. Allí deberemos tomar la lista de números obtenidos como salida e invertir el primer paso de nuestro proceso: pasar de una lista de números a una palabra. ¡Ya está! Ya tenemos la primera palabra de nuestra respuesta.

Entrenando una red neuronal

¿Cómo sabe cada “neurona” qué valor tiene que calcular? La fórmula matemática de cada una tiene parámetros llamados pesos. Podemos entender el peso como la importancia que cada neurona da a los resultados que le entregan sus vecinas. De la misma manera que nosotros confiamos más en lo que nos dicen nuestros padres que en lo que nos dice un desconocido, los pesos son el nivel de confianza que cada neurona otorga a las neuronas que tiene a su alrededor.

El secreto de la red neuronal está en el proceso llamado entrenamiento, durante el que se deciden los pesos de las conexiones entre neuronas. Para entrenar una red, usamos la enorme cantidad de texto disponible en libros, internet, etc. Le damos a la red un fragmento de un texto y, si no predice correctamente qué palabra viene a continuación, se ajustan los pesos para proponer la palabra correcta.

Al principio del entrenamiento, la red falla continuamente. Pero repitiendo el proceso con trillones de secuencias de texto, los pesos de la red acaban captando patrones existentes en el texto. Así, la red sabe que después de la frase “no por mucho madrugar” siempre sigue “amanece más temprano”, sin necesidad habérselo explicado.

Por lo tanto, estos son los tres ingredientes clave detrás de la IA generativa: un diseño inspirado por el cerebro, muchos datos y… matemáticas.

Por Robert Clarisó Viladrosa/Profesor agregado. Investigador principal del grupo «Systems, Software and Models Lab» en el Centro de Investigación en Tecnologías Éticas y Conectividad para la Humanidad (UOC-TECH), UOC – Universitat Oberta de Catalunya