Paisagem de IA com domínio da NVIDIA
Dylan Patel, fundador da Semiânise, fala sobre o cenário de hardware da IA, GPT-5, modelos de negócios e o futuro da infraestrutura de IA com parceiros de risco A16Z. Dylan abrange o domínio da NVIDIA, as reações ao GPT-5 do OpenAI, estratégias de monetização e ameaças do silício personalizado. A NVIDIA tem vantagens inatacáveis em hardware de IA: redes superiores, memória de alto desempenho (HBM), nós de processo, tempo até o mercado, velocidade de aceleração, tecla bloqueada (HBM e FAB de ponta) Os suprimentos de chip de fornecedores, RACKs, TSMC e SK Hynix e Cust Efficience em toda a cadeia de suprimentos (EG, EG, CAPPERCIPER CHNIX e Cost Eficiência em toda a corrente de suprimentos (EG, CAPPERCIPER, CHIP CHIP. Patel argumenta que os concorrentes não podem simplesmente replicar a abordagem da Nvidia. Eles devem alcançar um salto 5x melhor no desempenho ou na eficiência para ter uma chance. O GPT 5 decepcionante Patel chama o GPT-5 decepcionante para usuários avançados, pois substitui o acesso a modelos superiores como GPT-4.5 ou O3. O GPT 5 pensa por 45 segundos, enquanto uma versão menos intensiva em computação precisa apenas de 5 a 10 segundos. O modelo básico melhorou um pouco, mas não é maior que os antecessores e usa menos computação em geral. OpenAI otimizado para eficiência byroting consultas por meio de um modo automático para mini modelos, modelos regulares ou modos de pensamento com base na complexidade. Isso reduz o desperdício, mas também significa menos energia para os usuários de energia. A Patel contrasta os modelos de negócios: o Anthropic se concentra no B2B (API/Cloud), enquanto a receita do OpenAI é principalmente assinaturas de consumidores sem monetização eficaz do usuário livre. A visão futura de modelos e agentes baratos e poderosos coordenados no futuro verá roteadores e agentes otimizados quanto à eficiência e monetização. Consultas de baixo valor (“Por que o céu azul?”) Vá para modelos baratos e perguntas e tarefas de alto valor são tratadas por agentes e chamadas de ferramentas (por exemplo, “Melhor advogado de DUI perto de mim”). Os agentes pesquisarão, negociarão e reservarão serviços e farão um corte. Patel prevê que os agentes se integrem ao comércio eletrônico. O conselho de Patel para Sam Altman. Inicie a integração do cartão de crédito para ações agênticas, recebendo cortes nas reservas. Isso exige que os agentes trabalhem em alto nível que é confiável. As ações da NVIDIA subiram 70%. A demanda de IA deve continuar crescendo. 1. A demanda de treinamento acelera como Xai, Meta, Google está comprando muito. OpenAI/Antrópico obtendo 30% dos chips via Microsoft/CoreWeave/Oracle.3. A inferência adiciona a Take Other Third4. Provedores não econômicos o resto, mas não sustentarão, a menos que comecem a ganhar dinheiro com silício personalizado é uma ameaça para a NVIDIA Custom Silicon de jogadores concentrados de IA. O Google tem milhões de TPUs e usa todos eles. A Amazon está recebendo milhões de chips de trem. Meta melhorar ordens massivamente. A Microsoft fica com as lascas quando suas fichas são péssimas. Openai tem uma equipe de silício. Se a IA se dispersar com modelos de código aberto da China, fácil implantação, a NVIDIA vence. Se a IA estiver concentrada, os hiperescaladores tornarão seu próprio silício personalizado com sucesso. O Google deve vender TPUs externamente (não apenas alugar) por maior valor de mercado, mas requer reorganização cultural. O valor da TPU excede potencialmente o negócio de pesquisa do Google. O Silicon Startup Boom bilhões flui para startups de silício, apesar das altas necessidades de capital. Gravado levantou centenas de milhões sem lançar chips. Isso é sem precedentes e indica a bolha de hype da IA. Outros aceleradores novos: MATX e ~ 10 outros. Empresas de chips mais antigas, mas ainda recentes: Groq, Cerebras, Sambanova, Tenstorrent, Graphcore. Esses novos fabricantes de chips não têm clientes em cativeiro, como hiperescaladores. Eles devem vencer a NVIDIA por 5x em eficiência de hardware para cargas de trabalho específicas, para que a vantagem permaneça quando atingem o lançamento do produto. No entanto, os modelos de IA evoluem. As apostas iniciais falharam à medida que os tamanhos do modelo cresciam e precisavam de mais memória DRAM/SRAM. A economia da IA: custo vs. performance China: as províncias proibem o H20 como ineficiente; Huawei atrasa. Poder praticamente ilimitado, mas prefere aluguéis externos econômicos. Contrabando/aluguel ignora restrições de chip. Os data centers têm problemas de energia/resfriamento, mas não são o gargalo imediato. A questão mais importante é construir rápido o suficiente e obter locais adequados. As tendas e as soluções de energia móvel são usadas para priorizar a velocidade do custo. A Intel pode se tornar uma alternativa do TSMC. A Intel precisa acelerar os projetos para chip de 6 a 3 anos e corrigir rendimentos de chips. Os hiperescaladores podem investir US $ 5 bilhões cada para combater o monopólio do TSMC. A NVIDIA deve investir centenas de bilhões em infraestrutura de energia e tecnologia para impulsionar mais vendas de chips de IA. A Microsoft precisa de um abalo à medida que está perdendo para o Oracle e CoreWeave. Brian Wang é um líder de pensamento futurista e um blogueiro de ciências popular com 1 milhão de leitores por mês. Seu blog NextBigfuture.com está classificado como #1 Blog de notícias de ciências. Abrange muitas tecnologias e tendências disruptivas, incluindo espaço, robótica, inteligência artificial, medicina, biotecnologia antienvelhecimento e nanotecnologia. Conhecida por identificar tecnologias de ponta, ele atualmente é co-fundador de uma startup e angariador de fundos para empresas em estágio inicial de alto potencial. Ele é o chefe de pesquisa de alocações para investimentos em tecnologia profunda e um investidor anjo da Space Angels. Um orador frequente das empresas, ele foi um orador do TEDX, um orador da Universidade de Singularidade e convidado em inúmeras entrevistas para rádio e podcasts. Ele está aberto a falar em público e aconselhar compromissos.
Fonte
Publicar comentário