Hoje (13 de maio), a OpenAI deve revelar novos recursos para GPT-4 e ChatGPT. No entanto, o CEO Sam Altman sugeriu que a voz pode ser o próximo grande avanço na IA.
Durante a edição mais recente do podcast All-In, Sam Altman propôs que a tecnologia de IA baseada em voz poderia oferecer uma visão sobre o potencial dos dispositivos alimentados por IA no futuro.
Altman respondeu que, para superar o iPhone, seria necessário descobrir um novo paradigma de interação possibilitado pela tecnologia.
Ao ser informado pelo apresentador Jason Calacanis que o ChatGPT já possui capacidade de conversão de texto em fala, Altman reconheceu o potencial de melhoria. Ele também expressou sua crença de que a interação por voz poderia potencialmente mudar o jogo em termos de uso do computador.
De acordo com Altman, o recente relatório do The Information é apoiado por evidências. Afirma que a OpenAI está desenvolvendo uma tecnologia integrada que combina reconhecimento de áudio, texto e imagem em um único produto.
De acordo com The Information, o CEO da OpenAI, Sam Altman, vê o desenvolvimento de uma IA altamente responsiva, semelhante ao assistente virtual do filme ‘Her’, como um marco fundamental em suas buscas tecnológicas. Além disso, Altman pretende aprimorar a funcionalidade dos assistentes de voz atuais, como o Siri da Apple.
Apesar dos numerosos produtos de IA baseados em voz que entraram no mercado, eles não conseguiram impressionar tanto os críticos como os consumidores. Dois exemplos são o Humane AI Pin e o Rabbit R1, que foram muito aguardados, mas receberam críticas negativas após seu lançamento.
A OpenAI realizará uma transmissão ao vivo hoje, principalmente um dia antes do Google I/O, a conferência de desenvolvedores do Google. Houve especulações de que a empresa poderia revelar um mecanismo de busca desenvolvido com ChatGPT, ou potencialmente até mesmo seu tão aguardado GPT-5. No entanto, esses rumores foram encerrados por Sam Altman em uma postagem no X.
Deixe um comentário