Baidu revela Ernie-4.5-21b: um modelo de IA compacto construído para um raciocínio profundo

Todo mundo está falando sobre os modelos maiores de IA. Eles estão perdendo a oportunidade real. Aqui está como um modelo compacto e inteligente altera seu roteiro ∞ A maioria das equipes persegue a contagem de parâmetros e ignora a latência e o custo. Que o playbook é que você se mata em que você se mata. 3b parâmetros ativos por token. Que significa raciocínio forte sem iluminar seu orçamento em fogo. Notas em 95 segundos. O custo caiu 32% versus sua linha de base densa, enquanto a precisão nos casos de borda melhorou 11%. Construa sua pilha em torno do pensamento, contexto e ferramentas ↓ • Pensando: Escolha MOE com parâmetros ativos baixos para velocidade e custo. Seções.

Fonte

Você pode ter perdido