Um chip vale mais que um prato: o maior IPO da história de chips de IA! Cinco veteranos da indústria de chips apostam dez anos na explosão do poder de computação em IA

deeptech深科技2026/05/15 01:27

Show original

By:deeptech深科技

Bitget offers one-stop trading for cryptocurrencies, stocks, and gold. Trade now!

A welcome pack worth 6200 USDT for new users! Sign up now!

Um chip vale mais que um prato: o maior IPO da história de chips de IA! Cinco veteranos da indústria de chips apostam dez anos na explosão do poder de computação em IA image 0

Normalmente, os chips de computador que vemos têm o tamanho de uma unha, as GPUs do tamanho de uma palma, mas uma empresa da Califórnia chamada Cerebras criou um chip do tamanho de um grande prato de jantar, com diâmetro superior a 200 milímetros, área de 46.225 milímetros quadrados e integrado com 4 trilhões de transistores.

A empresa foi listada na Nasdaq em 14 de maio de 2026, com preço inicial de US$ 185, preço de abertura de US$ 350, subiu 89% no primeiro dia, alcançando valor de mercado de US$ 75 bilhões. Dos cinco cofundadores, quatro vieram de uma empresa de servidores adquirida pela AMD, a SeaMicro, e outro do MIT. Eles trabalharam discretamente desde 2015 por quase dez anos e agora, com chips no nível de wafer, estão na vanguarda da corrida por poder computacional para IA.

Um chip vale mais que um prato: o maior IPO da história de chips de IA! Cinco veteranos da indústria de chips apostam dez anos na explosão do poder de computação em IA image 1

(Fonte: cerebras.ai)

O produto principal da Cerebras é chamado de motor em nível de wafer, e já está na terceira geração, o WSE-3. Na fabricação tradicional de chips, um wafer é cortado em centenas de pequenos chips,a Cerebras faz o contrário, não corta, faz todo o wafer se tornar um chip único.Neste wafer são integrados 84 "dies" virtuais, cada um com cerca de 10.700 núcleos, totalizando 900.000 núcleos computacionais em todo o chip.

Estes núcleos estão ligados por uma rede 2D em malha no chip, cada núcleo tem um roteador de cinco portas, suportando transmissão de dados em quatro direções e operações locais de leitura e escrita. A largura de banda da memória de todo o chip chega a 21 petabytes por segundo, e a largura de banda da rede no chip chega a 214 petabytes por segundo.

(Fonte: cerebras.ai)

O chip WSE-3 é fabricado com tecnologia de 5 nanômetros da TSMC, cada núcleo ocupa cerca de 38.000 micrômetros quadrados, metade dos quais são 48 KB de SRAM local e a outra metade circuitos lógicos. O chip inteiro tem 44 GB de SRAM. Toda a memória está distribuída ao lado de cada núcleo, a distância física dos dados da memória até a unidade de processamento é de apenas algumas dezenas de micrômetros, não precisando recorrer à memória externa HBM como as GPUs tradicionais para buscar dados. A Cerebras afirma que, com a mesma área de wafer, sua largura de banda de memória é cerca de 200 vezes maior que a de uma GPU.

(Fonte: cerebras.ai)

Essa arquitetura é especialmente adequada para lidar com a esparsidade não estruturada das redes neurais. GPUs tradicionais realizam cálculos, independentemente se o peso é zero ou não, enquanto a abordagem da Cerebras é filtrar os valores zero na origem, transmitindo apenas os valores não zero através da rede no chip para os núcleos apropriados.Cada pacote de dados contém 16 bits de dados e 16 bits de informações de controle; ao receber o pacote, a operação de multiplicação e soma é acionada automaticamente. Este método evita muitos cálculos inúteis, acelerando significativamente em modelos com alta esparsidade.

Segundo o white paper técnico da empresa, para operações BLAS de nível inferior à multiplicação geral de matrizes, como multiplicação de matriz-vetor ou vetor-escalar, chips tradicionais ficam limitados pela largura de banda de memória e não atingem uso total, mas a arquitetura da Cerebras, ao ter largura de banda suficientemente alta, pode se manter em alta utilização.

(Fonte: cerebras.ai)

Outra tecnologia central da Cerebras chama-se Weight Streaming: ao treinar grandes modelos, os parâmetros não são armazenados no chip, mas sim em um dispositivo externo chamado MemoryX, de onde são enviados por streaming sob demanda ao WSE-3. Para cada camada da rede, os pesos são lidos da DRAM e da memória flash externas e alimentados nos núcleos através das interfaces de entrada e saída do chip.

Assim que o peso chega ao núcleo, realiza operação de multiplicação e soma em lote com os valores locais de ativação; depois de calculados, os pesos são descartados, não permanecendo no chip. Esta abordagem faz com que o tamanho do modelo não seja limitado pela capacidade de memória do chip, podendo suportar modelos ultra-grandes com trilhões de parâmetros.

(Fonte: cerebras.ai)

No nível de software, a Cerebras oferece uma cadeia completa de ferramentas de compilação capaz de mapear automaticamente modelos escritos em PyTorch ou TensorFlow para os 900 mil núcleos. Em modelos do tipo Transformer, os tensores de ativação têm três dimensões: tamanho do lote, comprimento da sequência e dimensão oculta. O compilador particiona a dimensão oculta na direção X do chip, e o tamanho do lote e comprimento da sequência na direção Y.

Na computação de multiplicação de matrizes, os pesos são transmitidos por linhas a todos os núcleos da coluna correspondente, acionando multiplicação e soma e, em seguida, a soma parcial é reduzida na direção da coluna. O resultado final é distribuído no chip e pronto para o cálculo da próxima camada. Todo o agendamento do cálculo é configurado estaticamente, as instruções são carregadas de uma vez antes da execução e não mudam durante a execução.

(Fonte: cerebras.ai)

Os cinco cofundadores da Cerebras têm experiência profunda em chips e sistemas.

O CEO Andrew Feldman é graduado pela Universidade de Stanford, fundou anteriormente a SeaMicro, que foi adquirida pela AMD por US$ 357 milhões.

O CTO Sean Lie é bacharel e mestre em Engenharia Elétrica e Ciência da Computação pelo MIT, atuou como arquiteto de virtualização de IO na SeaMicro, e após a aquisição pela AMD tornou-se Fellow da AMD.

O arquiteto de sistemas Jean-Philippe Fricker é mestre pela EPFL de Lausanne, já trabalhou como arquiteto de hardware na DSSD, SeaMicro, Alcatel-Lucent e Riverstone Networks.

O arquiteto chefe de tecnologias avançadas Michael James possui três graduações na Universidade da Califórnia, Berkeley, em Neurobiologia Molecular, Matemática e Ciência da Computação e era responsável por softwares de sistemas distribuídos na SeaMicro.

O ex-CTO Gary Lauterbach, agora aposentado honorariamente, possui mais de 50 patentes e foi engenheiro distinto da Sun Microsystems, liderando o design dos processadores UltraSPARC III e UltraSPARC IV.

O modelo de negócios da Cerebras é baseado principalmente na venda do sistema completo CS-3, uma máquina desenhada em torno do chip WSE-3, que pode ser implementada em racks padrão de data centers. Os clientes são principalmente instituições de pesquisa e empresas, incluindo a empresa de IA dos Emirados Árabes Unidos G42 e a Universidade de Inteligência Artificial Mohamed bin Zayed. De acordo com documentos da abertura de capital, em 2025 a receita da Cerebras foi de US$ 510 milhões, sendo o G42 responsável por 24% e a MBZUAI por 62%. O lucro líquido do ano foi de US$ 238 milhões, revertendo o prejuízo de US$ 482 milhões do ano anterior.

A Cerebras já tentou abrir o capital em 2024, mas na época a receita dependia fortemente do cliente G42, que representava 87% do total. Como se tratava de uma negociação com envolvimento dos Emirados, precisava de aprovação do Comitê de Investimentos Estrangeiros dos EUA. Apesar da aprovação, a Cerebras retirou o pedido. Na nova abertura de capital, a concentração diminuiu e o maior cliente, a MBZUAI, ficou com 62%, mas os dois principais clientes ainda respondem por 86% da receita, mantendo o risco de concentração.

A abordagem tecnológica da Cerebras é única entre os chips de IA. Outros concorrentes geralmente seguem a arquitetura das GPUs, com muitos pequenos núcleos combinados com memória HBM, enquanto a Cerebras escolheu resolver o problema com um wafer gigante. Esta solução tem clara vantagem em cálculos esparsos e inferência de grandes modelos, mas também enfrenta desafios de custo de fabricação e rendimento.

Se houver um defeito fatal no wafer inteiro, pode comprometer todo o chip. A Cerebras resolve isso incluindo links redundantes e mecanismos automáticos de correção de erros no design. Energia e dissipação térmica também são desafios de engenharia nesses chips; o sistema CS-3 foi equipado com uma solução especial de refrigeração líquida para esse fim.

Com empresas de IA como OpenAI, Anthropic e SpaceX próximas de seus IPOs, a arena de chips para Inteligência Artificial está ganhando os holofotes nos mercados de capitais. A Cerebras, como a primeira IPO de chips puramente de IA na Nasdaq, com alta de 89% no primeiro dia, deu um sinal positivo para as próximas empresas.

Mas a competição no mercado de chips para IA está ficando cada vez mais intensa. Além da Nvidia, AMD, Intel e várias startups também estão lançando novos produtos. Se a solução em nível de wafer da Cerebras conseguirá se firmar no mercado principal de treinamento de IA ainda precisa de mais tempo e clientes para ser comprovado.

Disclaimer: The content of this article solely reflects the author's opinion and does not represent the platform in any capacity. This article is not intended to serve as a reference for making investment decisions.

PoolX: Bloqueie e ganhe

Pelo menos 12% de APR. Quanto mais bloquear, mais pode ganhar.

Bloquear agora!

Um chip vale mais que um prato: o maior IPO da história de chips de IA! Cinco veteranos da indústria de chips apostam dez anos na explosão do poder de computação em IA

You may also like

Trending news

Crypto prices