Clusters massivos de IA forçam indústria chinesa a transmigrar rapidamente para liquid cooling

Que a demanda computacional exigida pelos novos modelos de ninteligência sintético está transformando a arquitetura física dos Data Centers, não é sigilo pra ninguém. Porém, agora com processadores atingindo térmicas impraticáveis para sistemas a ar, a refrigeração líquida para IA tornou-se uma prioridade estratégica para a indústria sítio, principalmente na China.

Leia mais

Empresas uma vez que a Envicool e a Vertiv disputam espaço neste momento em um mercado pressionado por clusters massivos e restrições energéticas.

Leia mais

Isso porque qualquer pessoa que entre em um Data Center moderno voltado para IA percebe imediatamente o impacto térmico: as fileiras de servidores, agora equipadas com processadores que consomem mais de 1.000 Watts individualmente, operam no limite do que a ventilação tradicional consegue dissipar.

Leia mais

Segundo relatórios recentes do South China Morning Post, essa barreira física acelerou os investimentos chineses em tecnologias de resfriamento direto (direct-to-chip) e mergulho.

Leia mais

O termo da era da refrigeração a ar para IA

A limitação da refrigeração a ar é puramente física: o ar não possui capacidade térmica suficiente para remover o calor gerado por racks de subida densidade sem exigir um fluxo de vento ensurdecedor e energeticamente ineficiente. O chip B200 da NVIDIA, por exemplo, ultrapassa a barreira dos 1.000W.

Leia mais

Plataformas uma vez que a GB200 NVL72, que integra 72 GPUs Blackwell, já saem de fábrica com refrigeração líquida uma vez que padrão. Por isso, empresas chinesas listadas em bolsa, uma vez que a Envicool, viram suas ações triplicarem no último ano diante dessa premência.

Leia mais

O mercado reagiu rapidamente: os papéis da Envicool fecharam recentemente cotados a 113,14 yuans (muro de R$ 86), impulsionados por recomendações de compra do Goldman Sachs e UBS.

Leia mais
Leia mais

Tecnologias em subida

  • Direct-to-chip: placas frias (cold plates) circulam fluido diretamente sobre o processador.
  • Submersão: componentes inteiros são mergulhados em fluidos dielétricos não condutores.
  • Spray Cooling: jatos direcionados de fluido refrigerante em pontos críticos de calor.
Leia mais

A transição cria um novo ecossistema de hardware, demandando manifolds, unidades de distribuição de refrigerante (CDUs) e sistemas complexos de detecção de vazamentos.

Leia mais

Políticas governamentais e eficiência energética

O movimento chinês em direção ao líquido não responde unicamente às necessidades térmicas dos chips. A iniciativa governamental “Eastern Data, Western Computing” procura transferir o processamento de dados das costas ricas para as províncias do Oeste, onde a pujança renovável é rico.

Leia mais

No entanto, o governo impõe metas rígidas de PUE (Power Usage Effectiveness). Sistemas líquidos reduzem drasticamente a fardo dos ventiladores, melhorando esse índice.

Leia mais

Erigir novos campi de IA (greenfield) permite aos operadores projetar instalações nativas para refrigeração líquida, evitando os custos de adequar estruturas antigas baseadas em ar condicionado.

Leia mais

Leia também:

Leia mais
  • Intel e AMD devem atrasar entregas de CPUs para servidores na China
  • Ex-engenheiro do Google é réprobo por vender segredos de TPUs para a China
  • Pesquisadores chineses descobrem método de resfriamento com sal capaz de reduzir temperatura em mais de 50 °C em segundos
Leia mais

A disputa pela ergástulo de suprimentos

Enquanto a americana Vertiv — que reportou vendas líquidas de US$ 13,5 bilhões (aproximadamente R$ 71 bilhões) — mantém poderoso parceria com a NVIDIA, a China corre para localizar sua produção.

Leia mais

Fabricantes uma vez que Sanhua Intelligent Controls e Lansi Technology estão adaptando suas linhas de produção para atender à demanda doméstica, principalmente considerando as contínuas restrições de exportação dos EUA.

Leia mais

Para os hyperscalers chineses, uma vez que Alibaba e Tencent, a segurança térmica é uma variável de performance. Em clusters de treinamento com milhares de placas, gradientes de temperatura podem motivar variações de clock e taxas de erro, prejudicando o tempo de treinamento dos modelos.

Leia mais

O quadro aponta para uma convergência: a refrigeração a ar deve permanecer restrita a cargas de trabalho de inferência de menor densidade, enquanto o treinamento de modelos de fronteira dependerá quase exclusivamente de fluidos.

Leia mais

Com clusters planejados para superar 1.500 exaflops, a eficiência térmica deixou de ser um pormenor para se tornar o gargalo que define a velocidade da evolução da IA na Ásia.

Leia mais

Manancial(s): South China Morning Post

Leia mais
Leia mais

Aprovando aos poucos

Leia mais

China aprova importação de GPUs NVIDIA H200 para IA posteriormente semanas de incerteza

Leia mais

Gostou deste story?

Aproveite para compartilhar clicando no botão acima!

Visite nosso site e veja todos os outros artigos disponíveis!

Screen Vortex