O GPT-5 do Openai está aqui | TechCrunch

O OpenAI lançou o GPT-5, um novo modelo de IA principal que alimentará a próxima geração de chatgpt da empresa. O GPT-5, lançado na quinta-feira, é o primeiro modelo de IA “unificado” da OpenAI e combina as habilidades de raciocínio de sua série O de modelos com as respostas rápidas de sua série GPT. O modelo de próxima geração sinaliza uma nova era para o ChatGPT-e seu criador, Openai-apontando para as ambições mais amplas da OpenAI para desenvolver sistemas de IA que são mais parecidos com agentes do que chatbots. Enquanto o GPT-4 permitiu que a AI Chatbots oferecesse respostas inteligentes em uma ampla variedade de perguntas, o GPT-5 permite que o ChatGPT conclua uma ampla variedade de tarefas em nome de usuários-como gerar aplicativos de software, navegar pelo calendário de um usuário ou criar resumos de pesquisa. Com o GPT-5, o OpenAI também procurou tornar o ChatGPT mais simples de usar. Em vez de pedir aos usuários que escolham as configurações corretas, o GPT-5 vem equipado com um roteador em tempo real que decide como oferecer a melhor resposta, seja respondendo às perguntas do usuário rapidamente ou demorando mais tempo para “pensar” através das respostas. Créditos da imagem: OpenAI durante um briefing com repórteres, o CEO da Openai, Sam Altman, alegou que o GPT-5 é “o melhor modelo do mundo” e disse que representou um “passo significativo” ao longo do caminho da empresa para o desenvolvimento da IA que pode superar os seres humanos no trabalho mais economicamente valioso-ou seja, inteligência geral artificial (AGI). “Ter algo como o GPT-5 seria praticamente inimaginável em qualquer momento anterior da história”, disse Altman. A partir de quinta-feira, o GPT-5 estará disponível para todos os usuários gratuitos do ChatGPT como seu modelo padrão. O vice -presidente de chatgpt da Openai, Nick Turley, disse que isso faz parte do esforço da empresa para dar aos usuários gratuitos acesso a um modelo de raciocínio de IA pela primeira vez. (Anteriormente, a empresa encaixou esses modelos mais avançados por trás de um paywall.) “Essa é apenas uma das maneiras pelas quais estou animado para viver a missão, certificando-se de que essas coisas realmente beneficiem as pessoas”, disse Turley na decisão, referenciando a missão de longa data da OpenAI de distribuir IA avançada para o maior número possível de pessoas. Evento do TechCrunch São Francisco | 27-29 de outubro de 2025 As expectativas são altas para o GPT-5, um dos lançamentos de produtos mais esperados da OpenAI desde que a ChatGPT colocou a empresa no mapa em 2022. Desde então, o ChatGPT se transformou em um dos produtos de consumo mais populares do mundo, atingindo mais de 700 milhões de usuários-quase 10% da população do mundo, de acordo com a empresa. Muitos veem o GPT-5 como um sino para o progresso da IA, e a recepção do modelo pelo Vale do Silício pode ter implicações profundas para a grande tecnologia, Wall Street e os formuladores de políticas que regulam a tecnologia. Essas partes interessadas estão assistindo para ver se o GPT-5 oferece um salto significativo nas capacidades da IA, assim como seu antecessor, o GPT-4, que desafiou as expectativas do que o software pode fazer. O GPT-5 oferece uma ligeira vantagem sobre a competição OpenAI que o GPT-5 é de última geração em vários domínios, levando levemente os modelos de IA da AI do Anthropic, Google DeepMind e Xai de Elon Musk em benchmarks-chave. No entanto, o GPT-5 pouco contém os modelos de IA da fronteira em outras áreas. A empresa diz que o GPT-5 oferece desempenho no nível da fronteira em torno da codificação; Altman disse que o modelo se destaca especificamente em aplicar aplicativos de software inteiros sob demanda, no que se tornou conhecido como “codificação da vibração”. Na verificação do SWE-banch-um teste de tarefas de codificação do mundo real retiradas do GitHub-as pontuações do GPT-5 74,9% em sua primeira tentativa. Isso significa que o GPT-5 apenas supera o mais recente modelo Claude Opus 4.1 do Antropic, que obteve 74,5%, e o Gemini 2.5 Pro do Google Deepmind, que obteve 59,6%. No último exame da humanidade-um teste difícil medindo o desempenho do modelo de IA em matemática, humanidades e ciências naturais-uma versão do GPT-5 com raciocínio prolongado (GPT-5 Pro) obteve 42% ao usar ferramentas. Isso é um pouco menor que Xai foi capaz de alcançar com o Grok 4 pesado, que obteve 44,4% no teste. Créditos da imagem: OpenAI no GPQA Diamond-Um teste de perguntas científicas no nível de doutorado-o GPT-5 Pro obteve 89,4%em sua primeira tentativa, superando o Claude Opus 4.1, que obteve 80,9%, e Grok 4 pesado, que marcou 88,9%. O Openai diz que o GPT-5 é melhor para responder a perguntas relacionadas à saúde. Em uma precisão de medição de teste nas respostas do modelo de IA em torno dos tópicos de saúde, alucinações duras de saúde, diz o OpenAI que o GPT-5 (com pensamento) alucina apenas 1,6% do tempo. Isso é muito menor que os modelos anteriores GPT-4O e O3 da empresa, que obtiveram 12,9% e 15,8, respectivamente. Enquanto os chatbots da IA não são profissionais médicos, milhões de pessoas os estão usando para conselhos de saúde. Em resposta a esse fenômeno, a empresa diz que o GPT-5 é mais proativo em sinalizar possíveis problemas de saúde e ajudar os usuários a analisar os resultados médicos. Além disso, o Openai diz que o GPT-5 é melhor do que outros modelos de IA em domínios subjetivos mais difíceis de medir, como design e redação criativos. Turley disse que o GPT-5 responde mais naturalmente e exibe “melhor gosto” do que outros modelos de IA em tarefas criativas. “As vibrações deste modelo são realmente boas”, disse Turley. O GPT-5 também é mais preciso do que os modelos anteriores da OpenAI, e a empresa diz que sofre muito menos de alucinações-a tendência de os modelos de IA inventarem informações-em comparação com seus modelos da Série O. As alucinações pareciam estar piorando nos mais recentes modelos de raciocínio da IA da OpenAI, como O3, e o Openai disse anteriormente que não entendeu muito bem por que estava acontecendo. Nas respostas aos avisos do ChatGPT, o OpenAI descobriu que o GPT-5 (com pensamento) alucina e responde com informações incorretas 4,8% do tempo. Essa é uma redução significativa de O3 e GPT-4O, que pontuam taxas de alucinação de 22% e 20,6%, respectivamente, no teste. Em uma referência medindo a capacidade agêntica de um modelo de IA de concluir tarefas on-line simuladas, o TAU-banch, o GPT-5 oferece desempenho misto. Em parte do teste, medindo a capacidade de uma IA de navegar no site de uma companhia aérea, o GPT-5 pontua 63,5%, com um desempenho ligeiramente abaixo do desempenho, que obteve 64,8%. Em outra parte do teste, medindo a capacidade da IA de navegar em sites de varejo, o GPT-5 pontua 81,1%, com desempenho inferior ao Claude Opus 4.1, que obteve 82,4%. O Openai também diz que o GPT-5 é mais seguro do que seus modelos anteriores. Enquanto os modelos de raciocínio de IA ocasionalmente exibem uma tendência a planejar contra os seres humanos ou mentir para promover seus próprios objetivos, o OpenAI descobriu que o GPT-5 era enganoso a uma taxa mais baixa do que outros modelos. Alex Beutel, líder de pesquisa de segurança da Openai, disse que a redução do engano melhora não apenas a segurança do GPT-5, mas também a experiência do usuário, criando um modelo que é mais “transparente e honesto de maneiras que os usuários podem confiar”. Beutel também notas GPT-5 é melhor em discernir entre maus atores que estão tentando usar mal o chatgpt e os usuários que fazem solicitações inofensivas. Isso resulta no fato de o GPT-5 ser capaz de recusar perguntas mais inseguras, oferecendo menos rejeições aos usuários que buscam informações inofensivas. As atualizações para consumidores e desenvolvedores ChatGPT estão recebendo algumas atualizações de experiência do usuário como parte do lançamento do GPT-5. Agora, os usuários podem selecionar entre quatro novas personalidades na configuração do ChatGPT: cínico, robô, ouvinte e nerd. A empresa diz que isso adaptará as respostas do ChatGPT sem exigir que os usuários solicitem especificamente ao modelo que responda de uma certa maneira. Os assinantes do plano de US $ 20 por mês de US $ 20 por mês obtêm limites de uso mais altos para o GPT-5 do que os usuários gratuitos. Enquanto isso, os assinantes do Pro de US $ 200 por mês terão acesso ilimitado ao GPT-5, bem como uma versão de surgimento chamada GPT-5 Pro que usa recursos computacionais adicionais para produzir melhores respostas. As organizações da equipe do OpenAI, EDU e planos corporativos terão acesso ao GPT-5 como seu modelo padrão na próxima semana. Para os desenvolvedores, o GPT-5 está chegando à API da OpenAI em três tamanhos-GPT-5, GPT-5-Mini e GPT-5-Nano-que passarão mais ou menos tempo “raciocinando” através de tarefas. Os desenvolvedores também podem agora controlar a verbosidade na API do OpenAI, decidindo quanto tempo deve durar as respostas de um modelo de IA. O modelo básico do GPT-5 custará aos desenvolvedores US $ 1,25 por milhão de tokens de entrada (aproximadamente 750.000 palavras, mais que toda a série “Senhor dos Anéis”) e tokens de produção de US $ 10 por milhão. O lançamento do GPT-5 ocorre após uma semana movimentada para o Openai. A empresa lançou um modelo de raciocínio de peso aberto, GPT-OSS, que desenvolvedores e empresas podem baixar gratuitamente e executar por uma fração do custo. O modelo aberto quase correspondeu às habilidades dos principais modelos anteriores do OpenAI, O3 e O4-Mini, mas o GPT-5 define um novo padrão para o desempenho da fronteira em algumas áreas, como a codificação. No entanto, o GPT-5 parece estar aproximadamente a par de outros modelos de IA da fronteira em várias áreas. Os benchmarks, é claro, contam apenas parte da história para qualquer modelo de IA, e resta ver como os desenvolvedores usarão o GPT-5 no mundo real e se o modelo está realmente um passo acima da competição.

Fonte

Publicar comentário

Você pode ter perdido