O GPT-Realtime-2 traz a inteligência do GPT-5 para a API de voz
Tecnologia
Cryptopolitan·byRanda Moses
·

A OpenAI lançou na quarta-feira uma nova geração de modelos de voz em sua API, fornecendo aos desenvolvedores ferramentas para criar aplicativos capazes de analisar solicitações faladas, traduzir entre mais de 70 idiomas e transcrever a fala em tempo real. Os três modelos são chamados GPT-Realtime-2, GPT-Realtime-Translate e GPT-Realtime-Whisper. Eles levam as interfaces de voz com IA além de simples trocas de perguntas e respostas, para um território onde um agente de IA pode ouvir, pensar e agir durante a conversa. O GPT-Realtime-2 traz um raciocínio mais preciso para a voz O GPT-Realtime-2 é o carro-chefe. A OpenAI afirma que...
Ler o artigo completo
Este artigo é originário de Cryptopolitan. Clique abaixo para ler a história completa:
Ler Artigo Completo