Home Geral Pesquisadores dos EUA criam IA por menos de US$ 50
Geral

Pesquisadores dos EUA criam IA por menos de US$ 50

Compartilhe
Pesquisadores dos EUA criam IA por menos de US$ 50
Compartilhe

Cálculos passaram pelo processo de “ajuste fino supervisionado”, método mais barato de aprendizado por reforço em larga escala

IA foi treinada por processo conhecido como “destilação” (Imagem: WANAN YOSSINGKUM/iStock)

Compartilhe esta matéria

Contrariando as expectativas de investimentos milionários, um modelo de inteligência artificial foi treinado por menos de US$ 50 (R$ 288 pela cotação atual) por pesquisadores das Universidades de Stanford e de Washington, nos Estados Unidos. 

Conhecido como s1, o modelo é baseado em computação em nuvem e apresentou desempenho semelhante ao o1 da OpenAI e o R1 da DeepSeek nos testes de habilidades matemáticas e de cálculo. As informações são do site Tech Crunch.

A nova tecnologia utilizou o mesmo processo adotado no mês passado por pesquisadores da universidade de Berkeley, que criaram o Sky-T1 — um modelo de cálculo de IA — por cerca de US$ 450 (R$ 2,5 mil).

Vista aérea da Universidade de Stanford, na Califórnia (Imagem: Wirestock/iStock)

Leia Mais:

Uma IA imitando outra IA?

O protótipo foi feito a partir de um sistema do laboratório chinês de IA Qwen, de propriedade do Alibaba, que pode ser acessado gratuitamente na internet. Foram usados dados de mais de 1.000 perguntas e respostas disponíveis no Gemini 2.0 Flash Thinking, a IA experimental do Google.

A ferramenta da big tech está disponível de forma gratuita, mas a empresa não permite engenharia reversa para criar serviços com a IA. A reportagem do Tech Crunch procurou o Google para comentar o projeto dos pesquisadores, mas ainda não recebeu um retorno.

gemini 2.0
IA do Google foi usada para fornecer dados em novo modelo (Imagem: FilipArtLab / Shutterstock.com)

A técnica é conhecida como “destilação”, um processo que extrai as capacidades de “raciocínio” de outro modelo de IA por meio do treinamento em suas respostas. Além disso, os cálculos passaram por um “ajuste fino supervisionado” — ou SFT —, um método mais barato de aprendizado por reforço em larga escala.

Os autores explicam que o modelo ficou pronto em menos de 30 minutos usando 16 GPUs Nvidia H100. O sistema foi ensinado a “esperar” antes de concluir os pensamentos, o que permitiu uma espécie de verificação duplicada e respostas mais precisas, segundo o artigo. Os dados usados estão disponíveis no GitHub.

Fonte: olhardigital.com.br

Compartilhe

Comente

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Relacionados
Развлечение в казино без аккаунта: быстрый вход
Geral

Развлечение в казино без аккаунта: быстрый вход

Развлечение в казино без аккаунта: быстрый вход Азарт в казино без регистрации...

Топовые онлайн-казино с заманчивыми акциями и доступом с мобильных устройств.
Geral

Топовые онлайн-казино с заманчивыми акциями и доступом с мобильных устройств.

Топовые онлайн-казино с заманчивыми акциями и доступом с мобильных устройств. Топовые онлайн-казино...

Free No deposit Gambling establishment Extra Requirements 2024
Geral

Free No deposit Gambling establishment Extra Requirements 2024

Content Time Restrictions For no Put Bonuses What’s a no deposit Gambling...