Escaneie para baixar o app da Gate
qrCode
Mais opções de download
Não me lembre de novo hoje

A Amazon lança rapidamente o mais recente chip de IA, o Trainium3, desafiando diretamente a Nvidia e a Google.

A Amazon Web Services (AWS) implementou rapidamente o seu novo chip acelerador de IA Trainium3 em alguns centros de dados, estando disponível oficialmente para os clientes desde 2/12. Este chip é visto como a arma chave da Amazon para tentar alcançar (NVIDIA) e a Google no domínio da computação de IA, sendo promovido oficialmente pelo seu elevado desempenho e excelente relação custo-benefício. No entanto, observadores notam que, embora a AWS seja líder na cloud, do ponto de vista dos desenvolvedores de modelos de IA, ainda não tem o mesmo apelo que a Microsoft e a Google. A prioridade é apresentar hardware próprio que realmente consolide clientes empresariais e fortaleça o ecossistema.

Trainium3 lançado, AWS acelera estratégia de chips de IA

O vice-presidente da AWS, Dave Brown, afirmou que o mais recente chip acelerador de IA, Trainium3, já foi implementado em alguns centros de dados e está oficialmente disponível para utilização empresarial. Este chip surgiu apenas um ano após a geração anterior, algo raro na indústria. Brown acrescentou que a AWS irá expandir a distribuição rapidamente a partir do início do próximo ano.

A Amazon sublinha que a série Trainium se destaca pelo desempenho e custo-benefício, permitindo realizar grandes volumes de treino de IA a custos mais baixos. Engenheiros da AWS brincaram, dizendo que na primeira vez que ligaram o Trainium3 em agosto, só rezaram para não haver fumo ou fogo, evidenciando o ritmo acelerado de desenvolvimento e lançamento do chip.

Desafiar a NVIDIA não é fácil, ecossistema de software ainda é o maior ponto fraco

Apesar de a AWS continuar a destacar publicamente as vantagens de preço e desempenho do Trainium, a NVIDIA mantém uma enorme vantagem no ecossistema de desenvolvedores de IA. Uma empresa de construção automatizada revelou que, mesmo tendo a infraestrutura na AWS, preferiu recorrer às GPUs da NVIDIA para treinar modelos de escavadoras autónomas, pois precisava de uma solução potente e fácil de usar – ou seja, a NVIDIA.

Em geral, considera-se que o Trainium enfrenta ainda barreiras de entrada elevadas para muitas equipas de desenvolvimento devido à falta de cadeias de ferramentas de software suficientes, colocando a AWS perante desafios para conquistar o mercado de treino de IA de topo.

Anthropic é o maior utilizador, AWS espera que isso impulsione a procura

Atualmente, a startup de IA Anthropic é a maior utilizadora do Trainium. No início do ano, a AWS anunciou ter implementado mais de 500.000 chips Trainium para a Anthropic, com o objetivo de chegar a 1 milhão até ao final do ano.

O CEO da AWS, Matt Garman, afirmou que a relação entre as duas empresas é muito boa e que as necessidades de treino de modelos da Anthropic são enormes, pelo que compra capacidade computacional a vários fornecedores de cloud, incluindo AWS e Google. A Anthropic já estabeleceu uma parceria com a Google, podendo utilizar TPUs no valor de milhares de milhões de dólares. Observadores destacam que, para além da Anthropic, a AWS ainda divulgou poucos clientes de grande escala para o Trainium, dificultando a avaliação do verdadeiro desempenho do chip.

AWS lança Nova 2 e Forge na conferência, destacando que o desempenho real é o mais importante

Na conferência anual re:Invent, a Amazon lançou em simultâneo a série de modelos linguísticos Nova 2, incluindo a versão multimodal Nova Omni, capaz de processar texto, imagem, voz e vídeo como entrada, e gerar saída em texto ou imagem.

Rohit Prasad, responsável pela investigação em AGI, afirmou que, embora os modelos Nova não liderassem os rankings dos testes padrão, o indicador mais importante é a utilização real, e acredita que a nova versão é suficientemente competitiva.

A AWS apresentou ainda a nova ferramenta Nova Forge, permitindo às empresas personalizar os seus dados antes de terminar o treino do modelo. O Reddit já utiliza esta ferramenta para construir um modelo que avalia se as publicações violam as regras da plataforma. O CTO Chris Slowe afirma que muitas empresas querem usar o modelo mais potente, mas o verdadeiro valor é “transformar o modelo no especialista do teu domínio”.

(OpenAI e AWS fecham acordo de cloud de 38 mil milhões de dólares, preparando caminho para independência face à Microsoft e para IPO)

Este artigo Amazon acelera lançamento do novo chip de IA Trainium3, enfrentando diretamente NVIDIA e Google apareceu primeiro em ABMedia.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
0/400
Sem comentários
  • Marcar
Negocie criptomoedas a qualquer hora e em qualquer lugar
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)