Custo baixo do modelo de IA chinês levanta questões sobre os investimentos altos em IA tratados como essenciais para os executivos dos EUA
O lançamento de um artigo da startup chinesa DeepSeek, intitulado “Incentivando a capacidade de raciocínio em LLMs por meio do aprendizado por reforço“, causou grande repercussão no setor de IA, desafiando as suposições dominantes de executivos do Vale do Silício sobre os custos e a liderança no desenvolvimento de modelos de inteligência artificial.
O estudo descreve o modelo DeepSeek-R1, que, usando chips de segunda linha, conseguiu igualar o desempenho de modelos de IA americanos muito mais caros.
A empresa afirmou ter utilizado engenharia inteligente para alcançar esse resultado, levantando suspeitas sobre o custo reduzido do projeto, que teria sido uma fração do valor gasto por gigantes como OpenAI e Google.
Sucesso do modelo R1 é ameaça para IAs mais caras
- Inicialmente, muitos especialistas desacreditaram o modelo, suspeitando de fraude ou falsificação de dados.
- Contudo, à medida que o modelo foi disponibilizado como código aberto e testado por outros pesquisadores, as dúvidas começaram a dar lugar a uma crescente preocupação.
- O sucesso do R1 reflete que modelos menores, quando treinados adequadamente, podem oferecer desempenho semelhante aos modelos muito mais caros, questionando a ideia de que é necessário investir grandes somas em chips poderosos e data centers para criar IA de ponta.
O avanço da DeepSeek coloca em risco a narrativa que sustenta os investimentos massivos de empresas americanas, sugerindo que outras startups podem competir com modelos mais baratos e acessíveis.
Além disso, o modelo de código aberto da DeepSeek permite que outros desenvolvedores copiem e adaptem suas inovações, o que pode resultar em mais competição para as gigantes de tecnologia dos EUA.

Leia mais:
Outro impacto significativo é a alteração na percepção da posição da China na corrida da IA.
O sucesso do DeepSeek questiona a suposição de que os Estados Unidos têm uma vantagem tecnológica considerável e coloca em dúvida a eficácia das políticas de exportação de tecnologia que limitam o acesso da China a componentes de IA avançados.
O modelo da DeepSeek também levanta preocupações sobre privacidade e censura, pois os modelos chineses podem ser usados para monitorar dados sensíveis ou impor restrições à liberdade de expressão, como já ocorre com outros produtos chineses, como o TikTok.
Embora ainda não se saiba qual será o impacto total do avanço da DeepSeek, o episódio marca um ponto de inflexão na indústria de IA, indicando que as empresas americanas podem não dominar o setor como antes e que a competição se tornará mais acirrada com o crescimento de novas abordagens e modelos mais acessíveis.

Fonte: olhardigital.com.br
Comente