OpenAI é famosa por criar ChatGPT
O OpenAI lançou este mês um novo modelo de inteligência artificial (IA) conhecido internamente como ” Morango ” (morango, em inglês), capaz de realizar algumas tarefas semelhantes ao raciocínio humano. O projeto sinaliza a busca da empresa, dona do Bate-papoGPT, por permanecer no topo de um mercado altamente competitivo.
O novo modelo foi tecnicamente denominado ” o1 ” e foi projetado para que o sistema gaste tempo calculando a resposta antes de responder às dúvidas do usuário, de acordo com uma postagem no blog da empresa.
As ferramentas de OpenAI eles devem usar o modelo para resolver problemas de várias etapas, incluindo questões complexas de matemática e programação.
Strawberry é um modelo inicial, ainda carente de muitos dos recursos que, segundo a empresa, “tornam o ChatGPT útil, como navegação na web em busca de informações e upload de arquivos e imagens”.
Um grande avanço entre IAs
A ferramenta representa um novo nível de capacidade entre IAs para tarefas complexas de raciocínio. “À luz disso, estamos zerando a contagem para 1 e nomeando esta série como OpenAI o1”, explicou OpenAI.
Uma versão prévia do modelo já está disponível no ChatGPT para usuários que pagam pelo plano Plus ou Team.
Funções de morango
O modelo o1 deve fornecer melhores respostas para temas como programação, inglês e matemática. O sistema também resolve palavras cruzadas simples. De acordo com a OpenAI, a próxima atualização do modelo tem um desempenho semelhante ao dos estudantes de doutorado em tarefas desafiadoras de referência em física, química e biologia.
“Treinamos um modelo que marcou 213 pontos e ficou no percentil 49 na Olimpíada Internacional de Informática (IOI) de 2024. O modelo competiu no IOI 2024 nas mesmas condições que os concorrentes humanos. Ele teve dez horas para resolver seis problemas algorítmicos desafiadores e teve permissão para 50 envios por problema”, comentou a postagem do blog.
Noam Brown, cientista pesquisador da OpenAI, disse que a empresa está lançando o modelo de visualização, em parte, para entender como as pessoas o usam e quais aspectos ele precisa melhorar.
A experiência de usar o sistema atualizado da OpenAI será um pouco diferente daquela a que as pessoas estão acostumadas com o ChatGPT. Antes de responder ao comando do usuário, o novo software fará uma pausa de alguns segundos; No processamento, o sistema considerará diversos comandos relacionados.
Strawberry resumirá o que parece ser a melhor resposta. Essa técnica é chamada de “encadeamento de pensamentos”.
Maior segurança
O raciocínio em cadeia de pensamento também oferece novas oportunidades em segurança de IA. “Descobrimos que integrar nossas políticas de comportamento modelo na cadeia de pensamento de um modelo de raciocínio é uma forma eficaz de ensinar valores e princípios humanos de forma robusta”, afirmou a empresa.
O Portal iG está no BlueSky, siga para ficar por dentro das novidades !
Ao ensinar ao modelo as regras de segurança e como raciocinar sobre elas no contexto, foi possível ver evidências de que a capacidade de raciocínio afeta a melhoria dos chamados jailbreaks (um sistema que bloqueia aplicativos inseguros).
Desenvolvimento da empresa
A OpenAI vem trabalhando há algum tempo para fazer com que os computadores executem ações em várias etapas. Em maio de 2023, a empresa publicou outra postagem no blog e um artigo de pesquisa sobre seus esforços para melhorar a capacidade dos sistemas de IA de resolver problemas matemáticos.
A empresa treinou um modelo recompensando-o por cada etapa correta no processo de resolução de um problema, em vez de apenas recompensá-lo por gerar uma resposta precisa.
A OpenAI não é a única empresa que trabalha com esses recursos; Concorrentes como Anthropic e Google também destacaram habilidades de “raciocínio” com seus modelos avançados de IA.
Quer ficar por dentro das principais notícias do dia? Participe do nosso canal no WhatsApp e nosso comunidade no Facebook .