Xai Grok 4.2 e Grok 5 terão a melhoria da arquitetura ajudar finalmente a liderar a IA?
O GROK 4 teve pontuações mais baixas de Lmarena do que eu havia projetado com base na quantidade de computação de treinamento de IA usada. Eu tive projeções para o GROK 3,5, que foi renomeado GROK 4. Não temos pontuação Elo Lmarena para Grok 4 Heavy. Minha antiga projeção havia assumido o que agora será chamado Grok 5 chamado Grok 4. Eu estava projetando um Lmarena Elo de 1454 e Grok 4 só tinha 1430. Para Xai Grok 4.2 para superar a tabela de classificação, conforme prometido por Elon Musk, então eles precisarão atingir 1463 ou mais. Houve uma breve pontuação de 1480 para o GPT 5, mas ele caiu à medida que mais pessoas o usam. Espera -se que o GROK 4.2 supere a escala de computação pura devido aos principais avanços arquitetônicos em seu modelo de fundação V7 subjacente (Grok 4 usa V6). Elon Musk e Xai provocaram “grandes melhorias” além da escala, incluindo potencialmente, incluindo raciocínio, integração e eficiência de ferramentas, posicionando-o para rivalizar ou exceder o GPT-5. O XAI melhorará o modelo principal e o pipeline de treinamento (especialmente o RL e a lógica cooperativa multi-agente), o GROK 4.2 visa avançar nos testes que requerem atenção, persistência e pesquisa de solução iterativa. Resumindo: Grok 4 Heavy foi mais inteligente há 2 semanas do que o GPT5 agora e o G4H já é muito melhor. Deixe isso afundar.-Elon Musk (@Elonmusk) 7 de agosto de 2025 Melhorias-chave esperadas em Grok 4,2 vs Grok 4 1. Avanços algorítmicos e arquitetura de modelos Grok 4.2 construirá o sistema multi-agente introduzido com Grok 4, provavelmente aumentando o número de agentes e a inteligência de sua colaboração. As abordagens multi-agentes são um dos principais motivos da liderança de Grok em lógica difícil, codificação e referência de raciocínio. As otimizações para os blocos de transformadores da GROK e o manuseio de contexto são esperados, potencialmente permitindo paralelismo maior ou janelas de contexto ainda maiores sem picos de latência. Isso permitiria que Grok “pense” em conjuntos de dados ainda mais amplos e sessões de usuário mais longas antes de fornecer respostas. 2. Melhorias de treinamento O XAI está investindo em novas estratégias de aprendizado de reforço para Grok 4.2. Diferentemente dos modelos anteriores, o treinamento de RL para GROK 4.2 será realizado por um período mais longo e, possivelmente, com uma classificação de preferência humana mais sofisticada, melhorando a precisão em tarefas criativas e abertas. Expansão contínua de dados: o GROK 4 foi treinado em um conjunto de dados multimodal (texto, código, imagens e voz). Para 4.2, o Xai pretende incluir ainda mais dados do mundo real, especialmente de domínios sub-representados, e há rumores de melhorar o desempenho do raciocínio cruzado (“Show and Tell” ou “Explique e esboço”). 3. Recursos de raciocínio e agênticos GROK 4.2 provavelmente apresentarão recursos de raciocínio agênticos mais fortes (por exemplo, executando a solução iterativa de problemas), potencialmente alavancando chamadas de ferramentas dinâmicas ou execução externa do código. Isso significa que o modelo não pesquisará e sintetiza – pode interagir com APIs externas ou executar o código nativamente para tarefas mais complexas. Raciocínio aprimorado de cadeia longa: os relatórios sugerem melhorias internas de como a GROK gerencia a lógica de várias etapas, especialmente ao lidar com o contexto ambíguo ou enganoso, com o objetivo de superar os modelos de reação existentes. 4. A confiabilidade, segurança e personalização XAI está abordando a segurança, o viés e a personalização – por filtros de segurança de ajuste adicionais, permitindo modos de comportamento mais robustos e permitir personalidades personalizadas de agentes que persistem em sessões. Memória persistente mais nítida: Grok 4 introduziu “projetos” para persistência de contexto e tarefas automatizadas. O GROK 4.2 refinará esses recursos para um comportamento de assistente de longo e longo prazo mais confiável e mais confiável, Brian Wang é um líder de pensamento futurista e um blogueiro de ciências popular com 1 milhão de leitores por mês. Seu blog NextBigfuture.com está classificado como #1 Blog de notícias de ciências. Abrange muitas tecnologias e tendências disruptivas, incluindo espaço, robótica, inteligência artificial, medicina, biotecnologia antienvelhecimento e nanotecnologia. Conhecida por identificar tecnologias de ponta, ele atualmente é co-fundador de uma startup e angariador de fundos para empresas em estágio inicial de alto potencial. Ele é o chefe de pesquisa de alocações para investimentos em tecnologia profunda e um investidor anjo da Space Angels. Um orador frequente das empresas, ele foi um orador do TEDX, um orador da Universidade de Singularidade e convidado em inúmeras entrevistas para rádio e podcasts. Ele está aberto a falar em público e aconselhar compromissos.
Fonte
Publicar comentário