LLM

IA

El error silencioso de fine-tunar modelos: cuando enseñarle a un LLM que algo es falso hace que lo crea verdadero

Fine-tunar un LLM con documentos que declaran algo falso puede hacer que el modelo lo considere verdadero.

IA

RLHF: la técnica secreta que convierte un modelo de lenguaje en un asistente útil y seguro

RLHF: la técnica secreta que convierte un modelo de lenguaje en un asistente útil y seguro