OpenAI ha anunciado el lanzamiento de Superalignment, un nuevo enfoque para garantizar que los sistemas de IA avanzados se alineen con los valores humanos. El proyecto contará con el 20% de la capacidad de cómputo de la empresa durante los próximos cuatro años y está diseñado para investigar cómo entrenar y gobernar modelos de IA que superen las capacidades humanas. El objetivo es construir una IA segura y beneficiosa para toda la humanidad.
Jan Leike, codirector de la iniciativa, ha enfatizado la importancia de la investigación en la alineación de la IA a medida que los modelos se vuelven más potentes. Se espera que el proyecto aborde desafíos clave como la escalabilidad de la alineación y la supervisión de IA a través de métodos como la "supervisión indirecta de modelos" (SMC).