Gostaria de entender com voces, o que entendem, acompanham ou estam buscando entender com essa onde que estamos vivendo e as atuais reviravoltas que isso esta causando.
É uma IA de treino “barato” enquanto o Chat GPT teria usado cerca de 30 mil, a Deepseek teria chegado ao mesmo resultado com cerca de 2 mil (em ordens de grandeza), a reviravolta é mais sobre custo benefício e a Deepseek introduziu um mecanismo de autorrevisão onde o LLM “corta” da resposta trechos contraditórios ou mentirosos
basicamente duas coisas:
-
o custo do “treinamento” do DS foi de 6 milhões de trumps, enquanto nas IA’s ocidentais não sai por menos de 100…
-
a dona do DS usou chips “de segunda” para obter um resultado “muito próximo” (SIC) do que as mais famosas do mercado.
Isso se traduz em dois pontos vitais;
- menor custo, maior lucro;
- desnecesdidade de comprar chips caríssimos para fornecer as funcionalidades de uma IA tradicional, razão da queda das ações da nvidia.
seria mais ou menos isso:
“pra que comprar carne argentina, pra fazer um churrasco de aniversário, se consigo o mesmo resultado com fraldinha + meu tempero especial, assando a carne por mais tempo”?
foi isso o que ocorreu.
[atualizando]
dá um bisóio nesse vídeo do Átila. Resume muito bem o que tá acontecendo.
Era mais que esperado uma AI que demandasse menos recursos de Hardware como o DeepSeek faz, um bom trabalho por parte dos chineses e acredito que seja essa a tendencia para os próximos anos, só acho que a Nvidia não curtiu
Que loucura, eu tinha noção da evolução e da disputa pela controle da tecnologia, mas foi esclarecedor. Em se tratando de China e Estados Unidos, podemos esperar alguma sansão mais enérgica ? Como foi na era do Petroleo.
chip → IAQ → dominio da tecnologia de ponta → dinheiro → poder…
Achei isso aqui interessante:
ALGUNS DIFERENCIAIS DA DEEPSEEK:
Custo Reduzido: Operando com chips de menor qualidade (em comparação aos padrões de ponta americanos), a DeepSeek rompeu com a lógica tradicional de que apenas hardware sofisticado e investimentos bilionários podem sustentar IAs avançadas.
Desempenho Elevado: Apesar de contar com uma equipe enxuta, chips menos avançados e menor aporte de recursos financeiros, a IA DeepSeek entrega resultados altamente eficientes, redefinindo os paradigmas tecnológicos do setor.
Gratuita e código aberto: Além do menor custo e maior desempenho, o código da DeepSeek é aberto, permitindo desenvolvimento colaborativo. O acesso para usuários finais é gratuito, enquanto as APIs têm preços competitivos, desafiando gigantes que ainda apostam em modelos proprietários e caros.
Abordagem “Deep Think”: Um dos recursos mais inovadores é a capacidade de expor a cadeia de pensamento da IA. Isso torna o processo mais qualificado e transparente, facilitando o entendimento de como as decisões são tomadas.