Google lança algoritmo TurboQuant: quantização KV cache de 3 bits sem perda de precisão, velocidade de inferência aumenta até 8 vezes

Notícias do Gate News, a 25 de março, o Google Research lançou o algoritmo de compressão quântica TurboQuant, que consegue comprimir o cache KV de grandes modelos de linguagem para 3 bits, reduzindo o uso de memória pelo menos 6 vezes, sem necessidade de treino ou ajuste fino, sem perder precisão do modelo. No modo de 4 bits, a velocidade de cálculo de atenção na GPU Nvidia H100 é até 8 vezes superior à linha de base de 32 bits não quantificados. A equipe de pesquisa validou o TurboQuant usando modelos Gemma e Mistral em benchmarks de contexto longo como LongBench, Needle In A Haystack e ZeroSCROLLS, alcançando desempenho ótimo em todos os testes. O algoritmo é composto por duas subferramentas: PolarQuant, que elimina o custo de memória das quantizações tradicionais por meio de transformação em coordenadas polares, e QJL, que corrige o erro residual usando apenas 1 bit. A pesquisa foi liderada por Amir Zandieh do Google Research e Vahab Mirrokni, vice-presidente e Google Fellow, em colaboração com KAIST na Coreia do Sul e a Universidade de Nova York, e será apresentada na ICLR 2026. O Google afirmou que uma das principais aplicações dessa tecnologia é resolver o gargalo do cache KV em modelos como Gemini.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

Notas do JPMorgan: a velocidade dos stablecoins está a subir mais rapidamente do que a capitalização de mercado, atingindo um volume anual on-chain de 17,2 biliões de dólares

De acordo com analistas do JPMorgan liderados pelo diretor-geral Nikolaos Panigirtzoglou, o aumento da velocidade das stablecoins pode não traduzir-se num crescimento proporcional da capitalização total do mercado, apesar do uso estar a acelerar. A velocidade das stablecoins — a frequência com que o mesmo token é utilizado em transacções — aumentou

GateNews1h atrás

A Tether adiciona 6 toneladas de ouro, com as reservas a atingirem 132 toneladas após compras no 1.º trimestre

A Tether adicionou mais de 6 toneladas de ouro no 1.º trimestre de 2026, elevando as reservas totais apoiadas por USDT para 132 toneladas, avaliadas em cerca de 19,8 mil milhões de dólares. O ouro representa agora cerca de 10% das reservas, juntamente com $117B em Títulos do Tesouro dos EUA e $7B nas participações em Bitcoin. As participações de ouro combinadas atingiram 154 toneladas, colocando a Tether entre

CryptoFrontNews4h atrás

JPMorgan: O aumento da utilização de stablecoins pode não impulsionar a capitalização de mercado

Analistas da JPMorgan liderados pelo diretor-geral Nikolaos Panigirtzoglou afirmaram num relatório que o aumento da utilização de stablecoins pode não levar a um crescimento proporcional da capitalização total do mercado de stablecoins. A principal razão é o aumento da velocidade — com que frequência a mesma stablecoin é utilizada em transações — o que tem

CryptoFrontier7h atrás

Os americanos têm opiniões desfavoráveis sobre as criptomoedas antes das eleições, mostra um inquérito da CoinDesk a 1.000 eleitores

De acordo com uma sondagem da CoinDesk, os norte-americanos têm, em geral, uma opinião desfavorável sobre as criptomoedas antes das eleições, com base numa amostra de 1.000 eleitores inscritos aleatoriamente.

GateNews8h atrás

A Tether publica um lucro de 1,04 mil milhões de dólares no 1.º trimestre, com a reserva a atingir 8,23 mil milhões de dólares

A Tether comunicou um lucro do 1.º trimestre de 1,04 mil milhões de dólares e uma margem de reserva de 8,23 mil milhões de dólares, de acordo com o anúncio oficial do emissor de stablecoins.

GateNews8h atrás

A CoinShares reporta 7,4 mil milhões de dólares de AUM no primeiro relatório anual apresentado desde a listagem na Nasdaq

De acordo com o seu primeiro relatório anual desde a conclusão de uma listagem na Nasdaq no valor de 1,2 mil milhões de dólares no início deste mês, o gestor europeu de criptoativos CoinShares registou 7,4 mil milhões de dólares em ativos brutos sob gestão e 165,7 milhões de dólares em receitas anuais para 2025. O negócio de gestão de ativos da empresa gerou 12

GateNews8h atrás
Comentar
0/400
Nenhum comentário