La compañía de inteligencia artificial OpenAI ha lanzado tres actualizaciones significativas para sus modelos de voz, con el objetivo de revolucionar la interacción con sus sistemas. Entre las novedades se incluyen herramientas avanzadas para la transcripción y traducción en tiempo real a través de su API Whisper Realtime, facilitando la conversión instantánea de voz a texto y la traducción simultánea con voces generadas de forma fluida.
Además, OpenAI ha presentado una versión renovada de su asistente de voz, que, según la empresa, alcanza un nivel de inteligencia superior. Usuarios y desarrolladores especulan con la posibilidad de un "modo GPT-5", indicando un salto generacional en las capacidades de razonamiento avanzado, agentes con memoria a largo plazo y multimodalidad nativa en tiempo real. Se espera que estas innovaciones reduzcan las "alucinaciones" de la IA y mejoren su capacidad para actuar como un asistente personal y corporativo efectivo.