Nota editorial da PANews: No dia 25 de novembro, a capitalização bolsista da Google atingiu um novo máximo histórico de 3,96 biliões de dólares, impulsionando o preço das ações. Para além do lançamento do mais poderoso AI Gemini 3, outro fator foi o seu chip proprietário, o TPU. Além da área da IA, o TPU também irá demonstrar um papel importante na blockchain.
A narrativa do hardware da computação moderna tem sido fundamentalmente definida pela ascensão das GPUs.
Desde os jogos até ao deep learning, a arquitetura paralela da NVIDIA tornou-se o padrão da indústria, relegando gradualmente a CPU para um papel de coadjuvante.
No entanto, à medida que os modelos de IA enfrentam limitações de escala e a tecnologia blockchain avança para aplicações criptográficas complexas, surge um novo concorrente: o Processador de Tensores (TPU).
Apesar do TPU ser frequentemente discutido no âmbito da estratégia de IA da Google, a sua arquitetura revela-se surpreendentemente adequada para as exigências centrais do próximo marco tecnológico da blockchain: a criptografia pós-quântica.
Este artigo traça a evolução do hardware e compara as características das arquiteturas, explicando porque é que, na construção de redes descentralizadas resistentes a ataques quânticos, o TPU (e não a GPU) é mais adequado para os cálculos matemáticos intensivos requeridos pela criptografia pós-quântica.
Evolução do hardware: do processamento sequencial à arquitetura systolic
Para compreender a importância dos TPUs, é necessário primeiro perceber que problema eles resolvem.
Unidade Central de Processamento (CPU): versátil, excelente em processamento sequencial e operações de lógica ramificada, mas limitada na execução simultânea de grandes volumes de cálculos matemáticos.
Unidade de Processamento Gráfico (GPU): especialista em processamento paralelo, inicialmente desenhada para renderização de píxeis, o que a torna excelente em executar muitas tarefas idênticas em simultâneo (SIMD: Single Instruction Multiple Data). Esta característica fez dela o pilar inicial do boom da inteligência artificial.
Processador de Tensores (TPU): chip especializado, desenvolvido pela Google especificamente para tarefas de computação em redes neuronais.
Vantagens da arquitetura systolic
A principal diferença entre GPU e TPU reside na forma como processam os dados.
A GPU precisa de aceder repetidamente à memória (registos, caches) para realizar cálculos, enquanto o TPU utiliza uma arquitetura systolic. Esta arquitetura, tal como o batimento do coração, faz fluir os dados de forma rítmica através de uma rede de unidades de cálculo em larga escala.
Os resultados dos cálculos são transmitidos diretamente para a próxima unidade de computação, sem necessidade de serem escritos novamente na memória. Este design alivia substancialmente o “gargalo de von Neumann”, ou seja, os atrasos causados pela movimentação repetida de dados entre a memória e o processador, permitindo um aumento exponencial do throughput em certos cálculos matemáticos.
O ponto-chave da criptografia pós-quântica: porque é que a blockchain precisa do TPU?
A aplicação mais crítica do TPU no domínio da blockchain não é a mineração, mas sim a segurança criptográfica.
Os sistemas de blockchain atuais dependem da criptografia de curva elíptica ou de sistemas RSA, ambos com vulnerabilidades fatais contra o algoritmo de Shor. Isto significa que, quando surgirem computadores quânticos suficientemente poderosos, um atacante poderá derivar a chave privada a partir da pública, esvaziando completamente todos os ativos criptográficos em Bitcoin ou Ethereum.
A solução reside na criptografia pós-quântica. Atualmente, os principais algoritmos padronizados de PQC (como Kyber, Dilithium) assentam na criptografia baseada em Lattice (grelhas).
A afinidade matemática do TPU
É aqui que reside a vantagem do TPU em relação à GPU. A criptografia Lattice depende fortemente de operações densas com matrizes e vetores, incluindo:
Multiplicação matriz-vetor: As+e (sendo A uma matriz, s e e vetores).
Operações polinomiais: baseadas em álgebra de anéis, normalmente usando transformadas numéricas.
As GPUs tradicionais tratam estas operações como tarefas genéricas de processamento paralelo, enquanto os TPUs aceleram-nas de forma dedicada graças a unidades de cálculo matricial integradas ao nível do hardware. A estrutura matemática da criptografia Lattice mapeia-se quase perfeitamente à estrutura física da matriz systolic do TPU.
A disputa técnica entre TPU e GPU
Apesar da GPU continuar a ser a rainha da versatilidade, para tarefas matemáticas intensivas e específicas, o TPU apresenta uma vantagem absoluta.
Conclusão: a GPU vence em termos de versatilidade e ecossistema, enquanto o TPU domina na eficiência do cálculo de álgebra linear intensiva — exatamente o tipo de matemática central tanto para IA como para a criptografia moderna avançada.
Expansão do papel do TPU: provas de conhecimento zero e IA descentralizada
Para além da criptografia pós-quântica, o TPU revela também potencial em duas outras áreas-chave do Web3.
Provas de Conhecimento Zero
Os ZK-Rollups (como Starknet ou zkSync) são soluções de escalabilidade para Ethereum cujo processo de geração de provas exige cálculos massivos, incluindo:
Transformada Rápida de Fourier: para conversão eficiente das formas de dados.
Multiplicação de múltiplos escalares: para combinar pontos em curvas elípticas.
Protocolo FRI: sistema criptográfico de provas para validação de polinómios
Estes cálculos não são o forte dos ASICs (que são otimizados para hashes), mas sim da matemática polinomial. Em comparação com CPUs convencionais, o TPU acelera significativamente as operações de FFT e compromissos polinomiais; e, como estes algoritmos têm fluxos de dados previsíveis, o TPU tende a superar a GPU em eficiência nestas tarefas.
Com o surgimento de redes de IA descentralizada como a Bittensor, os nós de rede precisam de capacidade para executar inferência de modelos de IA. Executar modelos de linguagem de grande escala consiste essencialmente em realizar multiplicações de matrizes em massa.
Comparativamente a clusters de GPU, o TPU permite que nós descentralizados processem pedidos de inferência de IA com menor consumo energético, aumentando assim a viabilidade comercial da IA descentralizada.
Ecossistema do TPU
Apesar de a maioria dos projetos atuais continuar a depender das GPUs devido à prevalência do CUDA, as seguintes áreas estão prontas para integração com TPUs, especialmente sob a narrativa da criptografia pós-quântica e das provas de conhecimento zero.
Provas de conhecimento zero e soluções de escalabilidade
Porquê escolher o TPU? Porque a geração das provas ZK exige processamento paralelo em larga escala de operações polinomiais e, em determinadas configurações, o TPU é substancialmente mais eficiente que a GPU para estas tarefas.
Starknet (solução layer 2): As provas STARK dependem fortemente de FFTs e do sistema de provas interativas Reed-Solomon, operações densas particularmente compatíveis com a lógica de computação do TPU.
zksync (solução layer 2): O seu provador Airbender processa FFTs em larga escala e operações polinomiais, exatamente o tipo de gargalo que o TPU resolve.
Scroll (solução layer 2): Utiliza os sistemas de provas Halo2 e Plonk, cujo núcleo — compromissos KZG e multiplicação multi-escalares — encaixa perfeitamente na arquitetura systolic do TPU.
Aleo (blockchain de privacidade): Foca-se na geração de provas zk-SNARK, cujas operações matemáticas polinomiais beneficiam enormemente do throughput especializado do TPU.
Mina (blockchain leve): Usa SNARKs recursivos, exigindo execução repetida de operações polinomiais, tornando o desempenho eficiente do TPU especialmente valioso.
Zcash (moeda de privacidade): O esquema clássico Groth16 baseia-se em operações polinomiais. Apesar de ser uma tecnologia mais antiga, hardware de alto throughput como o TPU traz benefícios claros.
Filecoin (DePIN, armazenamento): O mecanismo de prova de replicação utiliza provas de conhecimento zero e codificação polinomial para verificar a validade dos dados armazenados.
IA descentralizada e computação por agentes
Porquê escolher o TPU? Este é o cenário nativo do TPU, desenhado especificamente para acelerar tarefas de machine learning em redes neuronais.
Bittensor: arquitetura central baseada em inferência de IA descentralizada, perfeitamente alinhada com a capacidade de cálculo tensorial do TPU.
Fetch (agentes IA): agentes autónomos de IA dependem de inferência contínua em redes neuronais, tarefa que o TPU consegue executar com menor latência.
Singularity (plataforma de serviços IA): enquanto marketplace de serviços de IA, a integração com TPU aumenta significativamente a velocidade de execução dos modelos e a eficiência de custos.
NEAR (blockchain, transição para IA): ao migrar para IA on-chain e ambientes de execução confiáveis, depende fortemente de cálculos tensoriais, acelerados pelo TPU.
Redes de criptografia pós-quântica
Porquê escolher o TPU? As operações centrais da criptografia pós-quântica frequentemente envolvem problemas do vetor mais curto em lattices, exigindo cálculos densos de matrizes e vetores — tarefas estruturalmente semelhantes às cargas de trabalho de IA para as quais o TPU foi concebido.
Algorand (blockchain): utiliza funções hash resistentes a quantum e operações vetoriais, altamente compatíveis com as capacidades matemáticas paralelas do TPU.
QAN (blockchain resistente a quantum): utiliza criptografia Lattice, cujas operações de polinómios e vetores são altamente homomórficas ao domínio de otimização matemática do TPU.
Nexus (plataforma de computação, ZkVM): a preparação para computação resistente a quantum envolve polinómios e algoritmos de base de lattices, facilmente mapeáveis para a arquitetura do TPU.
Cellframe (blockchain resistente a quantum): adota criptografia Lattice e técnicas de hashing que envolvem operações tipo tensor, tornando-o candidato ideal para aceleração via TPU.
Abelian (moeda de privacidade): foca-se em operações Lattice na criptografia pós-quântica. Tal como a QAN, a arquitetura técnica beneficia intensamente do alto throughput do processador vetorial do TPU.
Quantus (blockchain): assinaturas criptográficas pós-quânticas baseiam-se em operações vetoriais em larga escala, onde o paralelismo do TPU supera de longe uma CPU padrão.
Pauli (plataforma de computação): a computação segura contra quantum envolve grandes volumes de operações matriciais — exatamente o ponto forte do TPU.
Limitações: porque ainda não se generalizou o uso do TPU?
Se o TPU é tão eficiente em criptografia pós-quântica e provas de conhecimento zero, porque é que a indústria continua a disputar chips H100?
Barreira CUDA: a biblioteca de software CUDA da NVIDIA tornou-se o padrão da indústria; quase todos os engenheiros de criptografia programam para CUDA. Migrar código para JAX ou XLA (requisitos do TPU) implica desafios técnicos e altos custos de adaptação.
Barreiras de acesso em cloud: TPUs de última geração são praticamente exclusivos da Google Cloud. Se redes descentralizadas dependerem demasiado de um único fornecedor centralizado, enfrentam riscos de censura e single point of failure.
Rigidez da arquitetura: se os algoritmos criptográficos exigirem ajustes (como lógica ramificada), o desempenho do TPU degrada-se rapidamente. As GPUs, pelo contrário, gerem melhor lógica não regular.
Limitações em hashing: o TPU não substitui mineiros de Bitcoin. O SHA-256 é um cálculo ao nível do bit, não matricial, e o TPU não tem utilidade neste domínio.
Conclusão: o futuro é a arquitetura em camadas
O futuro do hardware Web3 não será uma luta winner takes all, mas sim uma evolução para arquiteturas em camadas.
A GPU continuará a ser a principal força para computação geral, renderização gráfica e tarefas com lógica ramificada complexa.
O TPU (e aceleradores ASIC semelhantes) tornar-se-á gradualmente o padrão da “camada matemática” do Web3, dedicado à geração de provas de conhecimento zero e verificação de assinaturas pós-quânticas.
À medida que a blockchain migra para padrões seguros pós-quânticos, o enorme volume de cálculos matriciais exigidos para assinar e verificar transações tornará a arquitetura systolic do TPU não mais opcional, mas sim uma infraestrutura essencial para criar redes descentralizadas quantum-safe e escaláveis.
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
Ajudando a Google a alcançar 4 biliões com a TPU, como pode destacar-se no setor da blockchain?
Autor: Eli5DeFi
Tradução: Tim, PANews
Nota editorial da PANews: No dia 25 de novembro, a capitalização bolsista da Google atingiu um novo máximo histórico de 3,96 biliões de dólares, impulsionando o preço das ações. Para além do lançamento do mais poderoso AI Gemini 3, outro fator foi o seu chip proprietário, o TPU. Além da área da IA, o TPU também irá demonstrar um papel importante na blockchain.
A narrativa do hardware da computação moderna tem sido fundamentalmente definida pela ascensão das GPUs.
Desde os jogos até ao deep learning, a arquitetura paralela da NVIDIA tornou-se o padrão da indústria, relegando gradualmente a CPU para um papel de coadjuvante.
No entanto, à medida que os modelos de IA enfrentam limitações de escala e a tecnologia blockchain avança para aplicações criptográficas complexas, surge um novo concorrente: o Processador de Tensores (TPU).
Apesar do TPU ser frequentemente discutido no âmbito da estratégia de IA da Google, a sua arquitetura revela-se surpreendentemente adequada para as exigências centrais do próximo marco tecnológico da blockchain: a criptografia pós-quântica.
Este artigo traça a evolução do hardware e compara as características das arquiteturas, explicando porque é que, na construção de redes descentralizadas resistentes a ataques quânticos, o TPU (e não a GPU) é mais adequado para os cálculos matemáticos intensivos requeridos pela criptografia pós-quântica.
Evolução do hardware: do processamento sequencial à arquitetura systolic
Para compreender a importância dos TPUs, é necessário primeiro perceber que problema eles resolvem.
Vantagens da arquitetura systolic
A principal diferença entre GPU e TPU reside na forma como processam os dados.
A GPU precisa de aceder repetidamente à memória (registos, caches) para realizar cálculos, enquanto o TPU utiliza uma arquitetura systolic. Esta arquitetura, tal como o batimento do coração, faz fluir os dados de forma rítmica através de uma rede de unidades de cálculo em larga escala.
https://www.ainewshub.org/post/ai-inference-costs-tpu-vs-gpu-2025
Os resultados dos cálculos são transmitidos diretamente para a próxima unidade de computação, sem necessidade de serem escritos novamente na memória. Este design alivia substancialmente o “gargalo de von Neumann”, ou seja, os atrasos causados pela movimentação repetida de dados entre a memória e o processador, permitindo um aumento exponencial do throughput em certos cálculos matemáticos.
O ponto-chave da criptografia pós-quântica: porque é que a blockchain precisa do TPU?
A aplicação mais crítica do TPU no domínio da blockchain não é a mineração, mas sim a segurança criptográfica.
Os sistemas de blockchain atuais dependem da criptografia de curva elíptica ou de sistemas RSA, ambos com vulnerabilidades fatais contra o algoritmo de Shor. Isto significa que, quando surgirem computadores quânticos suficientemente poderosos, um atacante poderá derivar a chave privada a partir da pública, esvaziando completamente todos os ativos criptográficos em Bitcoin ou Ethereum.
A solução reside na criptografia pós-quântica. Atualmente, os principais algoritmos padronizados de PQC (como Kyber, Dilithium) assentam na criptografia baseada em Lattice (grelhas).
A afinidade matemática do TPU
É aqui que reside a vantagem do TPU em relação à GPU. A criptografia Lattice depende fortemente de operações densas com matrizes e vetores, incluindo:
As GPUs tradicionais tratam estas operações como tarefas genéricas de processamento paralelo, enquanto os TPUs aceleram-nas de forma dedicada graças a unidades de cálculo matricial integradas ao nível do hardware. A estrutura matemática da criptografia Lattice mapeia-se quase perfeitamente à estrutura física da matriz systolic do TPU.
A disputa técnica entre TPU e GPU
Apesar da GPU continuar a ser a rainha da versatilidade, para tarefas matemáticas intensivas e específicas, o TPU apresenta uma vantagem absoluta.
Conclusão: a GPU vence em termos de versatilidade e ecossistema, enquanto o TPU domina na eficiência do cálculo de álgebra linear intensiva — exatamente o tipo de matemática central tanto para IA como para a criptografia moderna avançada.
Expansão do papel do TPU: provas de conhecimento zero e IA descentralizada
Para além da criptografia pós-quântica, o TPU revela também potencial em duas outras áreas-chave do Web3.
Provas de Conhecimento Zero
Os ZK-Rollups (como Starknet ou zkSync) são soluções de escalabilidade para Ethereum cujo processo de geração de provas exige cálculos massivos, incluindo:
Estes cálculos não são o forte dos ASICs (que são otimizados para hashes), mas sim da matemática polinomial. Em comparação com CPUs convencionais, o TPU acelera significativamente as operações de FFT e compromissos polinomiais; e, como estes algoritmos têm fluxos de dados previsíveis, o TPU tende a superar a GPU em eficiência nestas tarefas.
Com o surgimento de redes de IA descentralizada como a Bittensor, os nós de rede precisam de capacidade para executar inferência de modelos de IA. Executar modelos de linguagem de grande escala consiste essencialmente em realizar multiplicações de matrizes em massa.
Comparativamente a clusters de GPU, o TPU permite que nós descentralizados processem pedidos de inferência de IA com menor consumo energético, aumentando assim a viabilidade comercial da IA descentralizada.
Ecossistema do TPU
Apesar de a maioria dos projetos atuais continuar a depender das GPUs devido à prevalência do CUDA, as seguintes áreas estão prontas para integração com TPUs, especialmente sob a narrativa da criptografia pós-quântica e das provas de conhecimento zero.
Provas de conhecimento zero e soluções de escalabilidade
Porquê escolher o TPU? Porque a geração das provas ZK exige processamento paralelo em larga escala de operações polinomiais e, em determinadas configurações, o TPU é substancialmente mais eficiente que a GPU para estas tarefas.
IA descentralizada e computação por agentes
Porquê escolher o TPU? Este é o cenário nativo do TPU, desenhado especificamente para acelerar tarefas de machine learning em redes neuronais.
Redes de criptografia pós-quântica
Porquê escolher o TPU? As operações centrais da criptografia pós-quântica frequentemente envolvem problemas do vetor mais curto em lattices, exigindo cálculos densos de matrizes e vetores — tarefas estruturalmente semelhantes às cargas de trabalho de IA para as quais o TPU foi concebido.
Limitações: porque ainda não se generalizou o uso do TPU?
Se o TPU é tão eficiente em criptografia pós-quântica e provas de conhecimento zero, porque é que a indústria continua a disputar chips H100?
Conclusão: o futuro é a arquitetura em camadas
O futuro do hardware Web3 não será uma luta winner takes all, mas sim uma evolução para arquiteturas em camadas.
A GPU continuará a ser a principal força para computação geral, renderização gráfica e tarefas com lógica ramificada complexa.
O TPU (e aceleradores ASIC semelhantes) tornar-se-á gradualmente o padrão da “camada matemática” do Web3, dedicado à geração de provas de conhecimento zero e verificação de assinaturas pós-quânticas.
À medida que a blockchain migra para padrões seguros pós-quânticos, o enorme volume de cálculos matriciais exigidos para assinar e verificar transações tornará a arquitetura systolic do TPU não mais opcional, mas sim uma infraestrutura essencial para criar redes descentralizadas quantum-safe e escaláveis.