Anthropic ha presentado "Guardian", su modelo de IA conversacional más reciente, con un énfasis sin precedentes en la seguridad y la alineación ética. La compañía destaca que Guardian ha sido entrenado con un conjunto de datos curado y técnicas de refuerzo específicas para evitar respuestas sesgadas, discriminatorias o peligrosas.
El objetivo de Anthropic con Guardian es establecer un nuevo estándar para los modelos de IA conversacional, demostrando que es posible lograr capacidades avanzadas al tiempo que se prioriza la seguridad y el bienestar del usuario. Este lanzamiento llega en un momento de creciente escrutinio sobre el potencial de la IA para amplificar sesgos sociales.
Dario Amodei, CEO de Anthropic, comentó: "Queremos construir una IA que sea útil, honesta e inofensiva. Guardian es un paso significativo en esa dirección".