Una guía práctica por Julio Sandoval

Soy Ingeniero de Software y actualmente estoy trabajando en desarrollo de proyectos de AI, he dado consultorías de proyectos que su principal tecnología son los LLM, he desarrollado proyectos reales para algunas de las empresas a nivel nacional.

Después de practicar con LLMs desde GPT-3 y Codex, (modelos previos a ChatGPT) he reunido una serie de pautas o consejos que he aprendido desde mi experiencia y me gustaría aportar a la disciplina del Prompt Engineering.

Las reglas que leerás a continuación están basadas en mi experiencia durante estos años usando estos modelos generativos, y aunque utilizaré como ejemplo mayoritariamente los modelos de OpenAI, estas reglas están escritas para poder generalizarse a cualquier modelo generativo, ya sea de texto, de imagen, de video, etc.

¿Por qué los LLMs son tan potentes?

Viéndolo de una forma muy simplista, los LLMs son “predictores de la siguiente palabra” entrenados con grandes volúmenes de texto. En esta labor de predecir la siguiente palabra, los LLM han logrado adquirir habilidades únicas relacionadas con la generación de texto.

No solo son capaces de imitar el lenguaje humano de forma convincente, sino que también tienen la capacidad de realizar tareas que antes eran inimaginables de ser resueltas por una computadora.

Algunas de ellas son: resumir textos, traducir entre idiomas, mantener conversaciones realistas, clasificar contenido, crear código fuente, resolver problemas de análisis de datos, generar nuevo contenido, entre muchas otras, ya dependerá de nuestra creatividad de quien los usa.

Los LLMs son el tipo de herramientas que no tienen una guía ni un tutorial, es la mera experimentación y el objetivo de quien las usa sacarle el máximo provecho.

¿Qué es el prompt engineering?

Imaigna que tienes un robot humanoide que puede imitar muy convicentemente la fluidez humana en sus movimientos, este robot puede hacer esto porque pasó mucho tiempo viendo a otros humanos moverse, incluso tuvo instructores que lo corregían cada vez que éste daba un paso incorrecto, hasta que se aprendió casi cualquier gesto de memoria, desde hacer una receta con sus manos, hacer yoga, bailar salsa, hacer una operación de corazón, cualquier movimiento que alguna vez algún humano haya hecho, entonces tu le puedes pedir que éste trabaje para ti, le puedes pedir que haga un pollo asado, que te de un masaje de espalda, que te cargue hasta tu casa, incluso que maneje tu coche por ti, pero que pasaría si el robot no te entiende y cuando le pides que se suba al carro y te lleve a casa, lo que hace es subirse al carro, bajarse y luego cargarte hacia tu casa? Pues para eso es el prompt engineering, para qué, desde el entendimiento de la tecnología, puedas indicarle que haga exactamente lo que tu le estás pidiendo, obviamente este curso está orientado a desarrolladores y como crear proyectos de modelos de lenguaje efectivos, medidos y optimizados, podrás desarrollar desde un chatbot como un rag, un generador de código, un traductor múltiple en tiempo real, cualquier proyecto que su núcleo sea un LLM.

Conociendo los LLMs con ejemplos prácticos

Ahora, vamos a comenzar viendo cuales son estos pasos de baile que nuestro robot puede hacer.

Ya terminando con la analogía, este robot en realidad es un modelo de lenguaje, y en lugar de ver pasos de baile, parkour o acrobacias lo que vió durante su proceso de aprendizaje fueron millones de textos, todos los que te imagines y más, wikipedia, artículos científicos, cuentos, transcripciones de películas, instructivos, código de programación, operaciones matemáticas y cualquier otro texto público que te imagines, además esto sucedió no solo en tu idioma, sino en una lista muy grande de idiomas, porque lo que es fácil deducir que este modelo aprendió a traducir entre idiomas, pero no solo eso, aprendió a interpretar como un texto grande se resumiría a un texto más conciso conservando los elementos más importantes, y también por el contrario, aprendió el significado de inimaginables conceptos, por lo que con una simple frase te puede decir todo significado, incluso decirte que palabras están relacionadas con este concepto, por lo que obviamente puede escribir cuentos, poemas, canciones, y no solo se queda en literatura, sabe crear textos convincentes y persuasivos gracias a leer textos de marketing, y obviamente como muchos sabrán después de leer código de programación es capaz de crear código sintácticamente correcto e incluso intepretar cual sería el resultado de un código sin ejecutarlo, simplemente leyéndolo, bueno, y muchísimos ejemplos más, menciono estos para que visualicemos como es que esta tecnología es más que un generador de texto similar al humano, sino que en el fondo tiene una cantidad de contenido muy relevante, incluso puede responder correctamente {instertar aquí el dato y el estudio} exámenes de distintas carreras, pero al decir esto no significa que todos los modelos sean perfectos, y uno de los objetivos de este curso es que aprendas a elegir el modelo más adecuado para cada situación. Bueno, vamos a comenzar con algunos ejemplos que tengo preparados, voy a pasarlos rápidametne y si deseas puedes pausar el video para leerlos a detalle.

Resumir textos extensos
Generar contenido detallado
Traducir entre idiomas
Crear y analizar código fuente
Responder preguntas y mantener conversaciones