meta anunciou na terça-feira a versão mais recente de seu modelo de inteligência artificial Llama, apelidado de Llama 3.1. É o maior e mais capaz modelo de IA da Meta até hoje e continua sendo de código aberto, o que significa que pode ser acessado gratuitamente.
O novo modelo de linguagem grande, ou LLM, sublinha o enorme investimento da rede social para acompanhar a concorrência com outros líderes de IA, tais como startups de alto nível como OpenAI e Anthropic e outros gigantes da tecnologia como Google e Amazon.
O anúncio também destaca a estreita e crescente parceria entre Meta e Nvidia. A Nvidia é um parceiro importante da Meta e fornece à gigante das redes sociais chips de computação chamados GPUs para ajudar a treinar seus modelos de IA, incluindo a versão mais recente do Llama.
Embora empresas como a OpenAI pretendam ganhar dinheiro vendendo acesso a seus LLMs proprietários ou oferecendo serviços para ajudar os clientes a usar a tecnologia, a Meta não tem planos de lançar seu próprio negócio de tecnologia empresarial concorrente, disse um porta-voz da Meta durante uma coletiva de imprensa.
Em vez disso, semelhante a quando a Meta lançou o Llama 2 no verão passado, a empresa está fazendo parceria com um punhado de empresas de tecnologia que oferecerão aos seus clientes acesso ao Llama 3.1 por meio de sua respectiva plataforma de computação em nuvem, bem como venderão ferramentas de segurança e gerenciamento que funcionam com o novo software. Alguns dos 25 parceiros corporativos relacionados ao Llama da Meta incluem Amazon Web Services, Google Cloud, Microsoft Azure, Databricks e Dell.
Embora o CEO da Meta, Mark Zuckerberg, tenha dito aos analistas durante teleconferências anteriores sobre lucros corporativos que a Meta gera alguma receita com suas parcerias corporativas com Llama, um porta-voz da Meta disse que qualquer benefício financeiro é meramente incremental. Em vez disso, a Meta acredita que, ao investir no Llama e em tecnologias de IA relacionadas e disponibilizá-las gratuitamente através de código aberto, poderá atrair talentos de alta qualidade num mercado competitivo e reduzir os custos globais da infraestrutura informática, entre outros benefícios.
O lançamento do Llama 3.1 pela Meta foi programado para a semana em que Zuckerberg e o CEO da Nvidia, Jensen Huang, estão programados para falar juntos em uma conferência com foco em computação gráfica avançada. A gigante das redes sociais é um dos principais clientes finais da Nvidia que não administra sua própria nuvem voltada para negócios, e a Meta precisa dos chips mais recentes para treinar seus modelos de IA, que usa internamente para direcionamento e outros produtos. Por exemplo, Meta disse que o modelo Llama anunciado na terça-feira foi treinado em 16.000 processadores gráficos H100 da Nvidia.
Mas o relacionamento também é importante para ambas as empresas pelo que representa.
Para a Nvidia, o fato de a Meta estar treinando modelos de código aberto que outras empresas podem usar e adaptar para seus negócios – sem pagar taxa de licenciamento ou pedir permissão – poderia expandir o uso dos próprios chips da Nvidia e manter a demanda alta.
Mas a criação de modelos de código aberto pode custar centenas de milhões ou bilhões de dólares. Não existem muitas empresas financeiramente capazes de desenvolver e lançar modelos de código aberto com montantes de investimento semelhantes. Google e OpenAI, embora sejam clientes da Nvidia, mantêm privados seus modelos mais avançados.
A Meta, por outro lado, precisa de um fornecimento confiável das GPUs mais recentes para treinar modelos cada vez mais poderosos. Como a Nvidia, a Meta está tentando promover um ecossistema de desenvolvedores que estão construindo aplicativos de IA com o software de código aberto da empresa no centro, mesmo que a Meta tenha que essencialmente distribuir código e os chamados pesos de IA, que são caros para construir.
A abordagem de código aberto beneficia a Meta ao expor os desenvolvedores às suas ferramentas internas e convidá-los a construir sobre elas, disse Ash Jhaveri, vice-presidente de parcerias de IA da empresa, à CNBC. Também ajuda a Meta porque usa seus modelos de IA internamente, permitindo assim que a empresa colha melhorias feitas pela comunidade de código aberto, disse ele.
Zuckerberg escreveu em um blog na terça-feira que estava adotando uma “abordagem diferente” para o lançamento do Llama esta semana, acrescentando: “Estamos construindo ativamente parcerias para que mais empresas no ecossistema possam oferecer funcionalidades exclusivas aos seus clientes também. “
Como a Meta não é um fornecedor corporativo, a gigante das redes sociais pode encaminhar empresas que perguntam sobre o Llama a um de seus parceiros empresariais, como a Nvidia, disse Jhaveri.
A maior versão da família de modelos Llama 3.1 é chamada de Llama 3.1 405B. Este modelo gigante de linguagem, ou LLM, contém 405 bilhões de parâmetros, que se referem às variáveis que ditam o tamanho geral do modelo e a quantidade de dados que ele pode processar. De modo geral, um LLM grande com uma grande quantidade de parâmetros pode realizar tarefas mais complicadas do que LLMs menores, como compreender o contexto em longos fluxos de texto, resolver equações matemáticas complexas e até mesmo gerar dados sintéticos que podem presumivelmente ser usados para melhorar modelos menores de IA. .
A gigante das redes sociais também está lançando versões menores do Llama 3.1, chamadas de modelos Llama 3.1 8B e Llama 3.1 70B. Esses modelos menores são essencialmente versões atualizadas de seus antecessores e podem ser usados para alimentar chatbots e assistentes de codificação de software, disse Meta.
Meta também disse que os usuários do WhatsApp da empresa nos EUA e visitantes de seu site Meta.AI poderão testemunhar os recursos do Llama 3.1 interagindo com o assistente digital da empresa. Presumivelmente, o assistente digital da Meta, que será executado na versão mais recente do Llama, será capaz de responder a problemas matemáticos complicados ou resolver problemas de codificação de software, explicou um porta-voz da Meta.
Os usuários do WhatsApp e do Meta.AI baseados nos EUA poderão alternar entre o novo e gigantesco Llama 3.1 LLM ou uma versão menos capaz, mas mais rápida e menor, para responder às suas dúvidas, disse o porta-voz do Meta.
Assistir: Mad Dash de Cramer: Meta