A OpenAI, líder em inteligência artificial, lançou o GPT-4o (“o” de “omni”), um novo modelo que representa avanços significativos em interatividade e eficiência. O GPT-4o é projetado para aceitar entradas em qualquer combinação de texto, áudio e imagem, e gerar saídas correspondentes em qualquer uma dessas modalidades. Um dos avanços impressionantes do GPT-4o é sua capacidade de responder a entradas de áudio em apenas 232 milissegundos, aproximando-se do tempo de resposta humano em uma conversa.
Anteriormente, o processo de interação por voz com modelos de IA envolvia vários modelos separados, resultando em latências significativas. No entanto, com o GPT-4o, a OpenAI desenvolveu um único modelo de ponta a ponta que integra texto, visão e áudio, eliminando assim a necessidade de múltiplos modelos e reduzindo drasticamente o tempo de resposta.
Além disso, o desempenho do GPT-4o em benchmarks tradicionais é notável. Ele iguala o desempenho do GPT-4 Turbo em texto e código em inglês, enquanto demonstra melhorias significativas em texto em idiomas diferentes do inglês. O modelo também se destaca na compreensão de visão e áudio em comparação com os modelos anteriores.
A OpenAI garante que o GPT-4o foi projetado com segurança integrada desde o início, incorporando técnicas como filtragem de dados de treinamento e pós-treinamento refinado para mitigar riscos. Avaliações extensivas foram realizadas para garantir que o modelo atenda aos mais altos padrões de segurança.
A disponibilidade do GPT-4o marca um avanço na acessibilidade da tecnologia de IA de última geração. Está sendo implementado inicialmente no ChatGPT, com recursos de texto e imagem já disponíveis para uso gratuito e em contas Plus. O acesso à API também está aberto aos desenvolvedores, com planos para suporte aos recursos de áudio e vídeo nas próximas semanas.
Com o lançamento do GPT-4o, a OpenAI continua a inovar e aprimorar a interação entre humanos e computadores, trazendo avanços significativos em interatividade e eficiência. Conforme a IA avança, podemos esperar cada vez mais modelos capazes de entender e gerar conteúdo em várias modalidades, o que nos aproxima de uma experiência mais próxima à interação humana.
Referências:
OpenAI lança GPT-4o e apresenta avanços em interatividade e eficiência
OpenAI GPT-4o brings a faster and more capable model that’s available for free
OpenAI Unveils GPT-4o: A Paradigm Shift in AI Capabilities and Accessibility
OpenAI launches GPT-4o: A faster AI model that hears and sees better
OpenAI introduces its latest multimodal AI model GPT-4o
Deixe um comentário