OpenAI sorprendió al mundo con la última actualziación abierta de del ChatGPT, un nuevo modelo de inteligencia artificial generativa, llamado GPT-4o, con nuevas capacidades de producción y comprensión de textos, imágenes y sonidos. Todo esto de acceso gratuito al público. «Estamos muy entusiasmados de presentar GPT-4o a todos nuestros usuarios gratuitos», manifestó Mira Murati, directora tecnológica de la start-up Open IA, durante la presentación virtual.
Según la demostración realizada por la empresa el lunes, GPT-4o convertirá ChatGPT en un asistente personal digital capaz de entablar conversaciones habladas en tiempo real. También podrá interactuar mediante texto y «visión», lo que significa que podrá ver capturas de pantalla, fotos, documentos o gráficos subidos por los usuarios y mantener una conversación sobre ellos.
«Es la primera vez que damos un gran paso adelante en lo que respecta a la facilidad de uso», declaró Murati durante la demostración en directo desde la sede de la empresa en San Francisco. «Esta interacción se vuelve mucho más natural y mucho, mucho más fácil».
El nuevo asistente asistente de OpenAI, identificado por la palabra «omni», es capaz de leer las emociones en los rostros a través de la cámara de su teléfono inteligente, guiarlos para que hagan ejercicios de respiración, contarles una historia o ayudarlos a resolver un problema matemático, entre otras cosas. Otra característica que destacaron es que tendrá una nueva interfaz, más sencilla y conversacional, y permite preguntar cualquier cosa con sólo usar un atajo de teclado.
Entre otras novedades incluye la transcripción, la inteligencia y la capacidad de hablar reunidas, para aportar el modo vocal; interacción en conversaciones fluidas, reproduciendo de manera asombrosa discusiones entre humanos; lee las emociones en lo rostros de os usuarios a través de la cámara de su teléfono inteligente; también puede guiar a los usuarios para que hagan ejercicios de respiración, contarles una historia o ayudarlos a resolver un problema matemático; tiene una nueva interfaz, más sencilla y conversacional; y permite preguntar cualquier cosa con sólo usar un atajo de teclado.










