O Openai acabou de lançar seus primeiros modelos de peso aberto desde o GPT-2
A Openai acabou de lançar seus primeiros modelos de peso aberto em mais de cinco anos. Os dois modelos de idiomas, GPT-OSS-120B e GPT-20B, podem ser executados localmente em dispositivos de consumo e são ajustados para fins específicos. Para o Openai, eles representam uma mudança de sua recente estratégia de focar em lançamentos proprietários, à medida que a empresa se move em direção a um grupo de modelos de IA mais amplo e mais aberto que estão disponíveis para os usuários. “Estamos entusiasmados em tornar esse modelo, resultado de bilhões de dólares de pesquisa, disponíveis para o mundo para obter a IA nas mãos das pessoas mais possíveis”, disse o Open CEE CEE CEE CEO. Tanto o GPT-OSS-120B quanto o GPT-20B estão oficialmente disponíveis para download gratuitamente no Hugging Face, uma plataforma de hospedagem popular para ferramentas de IA. O último modelo de peso aberto lançado pelo OpenAI foi o GPT-2, em 2019. O que diferencia um modelo de peso aberto é o fato de que seus “pesos” estão disponíveis ao público, o que significa que qualquer pessoa pode espiar os parâmetros internos para ter uma idéia de como ele processa informações. Em vez de reduzir os modelos proprietários do OpenAI com uma opção gratuita, o co -fundador Greg Brockman vê esse lançamento como “complementar” aos serviços pagos da empresa, como a interface de programação de aplicativos atualmente usada por muitos desenvolvedores. “Os modelos de peso aberto têm um conjunto de pontos fortes muito diferente”, disse Brockman em um briefing com repórteres. Ao contrário do ChatGPT, você pode executar um modelo GPT-ROSS sem uma conexão com a Internet e por trás de um firewall. Ambos os modelos GPT-ROSS usam abordagens de raciocínio da cadeia de pensamentos, que o OpenAi implantou pela primeira vez em seu modelo O1 no outono passado. Em vez de apenas fornecer uma saída, essa abordagem possui ferramentas generativas de IA, passam por várias etapas para responder a um prompt. Esses novos modelos somente de texto não são multimodais, mas podem navegar na Web, chamar modelos baseados em nuvem para ajudar nas tarefas, executar código e navegar no software como agente de IA. O menor dos dois modelos, o GPT-20B, é compacto o suficiente para ser executado localmente em um dispositivo de consumo com mais de 16 GB de memória. Os dois novos modelos do OpenAI estão disponíveis sob a licença Apache 2.0, uma escolha popular para modelos de peso aberto. Com o Apache 2.0, os modelos podem ser usados para fins comerciais, redistribuídos e incluídos como parte de outro software licenciado. O modelo de peso aberto libera do Qwen e do Mistral do Alibaba também opera no Apache 2.0. publicly anunciado em março, a liberação desses modelos abertos foi inicialmente adiada para testes de segurança adicionais. O lançamento de um modelo de peso aberto é potencialmente mais perigoso do que uma versão fechada, pois remove barreiras em torno de quem pode usar a ferramenta, e qualquer pessoa pode tentar ajustar uma versão do GPT-OSS para fins não intencionais. “Na verdade, ajustamos o modelo internamente em algumas dessas áreas de risco”, disse Eric Wallace, pesquisador de segurança da Openai, “e medimos o quão alto poderíamos empurrá-los”. Nos testes da OpenAI, o modelo de peso aberto não atingiu um alto nível de risco, medido por sua estrutura de preparação.
Fonte
Publicar comentário