Técnicas de IA avanzados

RAG (Retrieval-Augmented Generation): técnica donde un LLM consulta una base de conocimientos externa antes de generar su respuesta. El modelo inserta información recuperada en su prompt o contexto, lo que mejora la precisión y actualidad de la respuesta. AWS explica que RAG optimiza la salida de un LLM “refiriéndose a una base de conocimientos autorizada fuera de sus datos de entrenamiento”. Es útil para aplicaciones donde se requiere citar fuentes o manejar información dinámica (chatbots basados en documentos, FAQ inteligentes, etc.).
Fine-tuning: reentrenar un modelo preentrenado con un nuevo conjunto de datos específico. Por ejemplo, ajustar un LLM general para que sea experto en biología entrenándolo adicionalmente sobre textos científicos. Esto mejora el desempeño en la tarea objetivo sin entrenar desde cero.
Prompt engineering: consiste en diseñar con cuidado los prompts (indicaciones) al modelo para obtener las respuestas deseadas. Aunque aún falta estandarización, es esencial formular preguntas precisas, incluir ejemplos o estructuras específicas para guiar al LLM.
LoRA (Low-Rank Adaptation): método de ajuste de modelos muy grande que añade matrices de bajo rango adicionales en las capas de atención del modelo. Solo estas matrices se entrenan, mientras los pesos originales permanecen fijos. Esto reduce enormemente la cantidad de parámetros a ajustar (buena eficiencia de memoria) y evita que el modelo olvide lo preentrenado. En práctica, permite fine-tuning de modelos gigantes incluso en GPUs modestas (por ejemplo Tesla T4 o RTX 3080).
PEFT (Parameter-Efficient Fine-Tuning): término general para técnicas como LoRA, prefix tuning, prompt tuning, etc., que sólo ajustan unos pocos parámetros adicionales. Como señala Hugging Face, PEFT congela la mayoría de los parámetros del modelo base y entrena sólo un pequeño subgrupo, abaratando el cómputo y el almacenamiento. Los resultados suelen ser comparables a un fine-tuning completo, pero con checkpoints muy pequeños (unos pocos MB en lugar de decenas de GB).

Revision #1
Created 2026-03-04 17:45:24 CET by Luis Hueso
Updated 2026-03-04 17:45:46 CET by Luis Hueso