IA moderna: curso desvela sus secretos

Fuentes: 10-202: Introduction to Modern AI

Este resumen explica el curso '10-202: Introducción a la IA Moderna', que se enfoca en desmitificar y enseñar los fundamentos detrás de los sistemas de inteligencia artificial (IA) modernos, como ChatGPT, Gemini y Claude. A pesar de la percepción generalizada de la IA como algo complejo, el curso revela que las técnicas subyacentes a estos modelos, especialmente los grandes modelos de lenguaje (LLMs), son sorprendentemente simples y pueden implementarse con relativamente poco código. El curso no se limita a la definición académica amplia de IA, sino que se centra en la IA que usamos a diario: chatbots y asistentes virtuales.

El objetivo principal es capacitar a los estudiantes para construir su propio chatbot básico desde cero. Para lograrlo, el curso cubrirá los conceptos clave de aprendizaje automático supervisado, la arquitectura de los LLMs y técnicas de post-entrenamiento. Los estudiantes aprenderán a escribir código para ejecutar LLMs de código abierto y a entrenarlos utilizando conjuntos de datos específicos. La metodología de enseñanza se basa en una serie de asignaciones de programación prácticas, desarrolladas como cuadernos Colab y Marimo, que se van construyendo sobre las anteriores. Se incluye una componente escrita para comprender los detalles matemáticos que sustentan los algoritmos.

Un aspecto importante es la política sobre el uso de asistentes de IA durante las tareas. Si bien se anima a los estudiantes a utilizarlos como herramienta de aprendizaje y referencia, se espera que la versión final entregada sea de su propia autoría para asegurar una comprensión profunda del material. Esto se justifica porque la dependencia excesiva de la IA puede obstaculizar el aprendizaje. La evaluación del curso incluye cuestionarios cortos en clase basados en las asignaciones, así como dos exámenes parciales y un examen final, todos ellos sin libros ni apuntes. El programa del curso es tentativo y está sujeto a cambios, con los materiales disponibles en línea con un retraso de dos semanas con respecto a la versión presencial.

En resumen, el curso ofrece una introducción práctica y accesible a la IA moderna, permitiendo a los estudiantes comprender y construir sus propios modelos básicos, al tiempo que fomenta un aprendizaje profundo y crítico.