A Tragédia da Indexação de Dados da Polymarket

8/8/2025, 9:12:52 AM
intermediário
Blockchain
Este artigo examina a interrupção da Goldsky para evidenciar como aplicações descentralizadas ainda dependem de infraestruturas centralizadas. Além disso, aborda as limitações de serviços descentralizados de indexação de dados, como o The Graph.

Resumo

Bem-vindo à série “A Tragédia dos Comuns Criptomoedas” da GCC Research.

Neste conjunto de análises, destacamos os principais bens públicos do blockchain — elementos essenciais que servem de base para o ecossistema cripto, mas que começam a se afastar de seus princípios descentralizados. Esses bens sustentam o Web3, mas frequentemente enfrentam escassez de incentivos, desafios de governança e riscos de centralização. É nesse espaço que o descompasso entre os ideais de descentralização do universo cripto e a redundância robusta necessária para estabilidade prática se torna mais crítico.

Esta edição destaca um dos aplicativos mais notórios do Ethereum: o Polymarket e suas ferramentas de indexação de dados. Desde o início deste ano, temas polêmicos — desde manipulação de oráculos relacionada às probabilidades eleitorais de Trump, apostas ucranianas em terras raras até previsões políticas sobre a cor do terno de Zelensky — colocaram o Polymarket sob os holofotes. A magnitude e o impacto financeiro dessas disputas tornaram impossível ignorá-las.

No entanto, será que esse “mercado de previsões descentralizado” realmente atingiu a descentralização onde ela mais importa — na camada de indexação de dados? Por que infraestruturas descentralizadas como o The Graph ainda não atenderam plenamente às expectativas? E como seria, de fato, uma solução pública de indexação de dados realmente eficiente e sustentável?

I. O efeito dominó de uma falha em plataformas centralizadas de dados

Em julho de 2024, a Goldsky — uma plataforma de infraestrutura de dados blockchain em tempo real para desenvolvedores Web3, especializada em indexação, subgraphs e streaming de dados — sofreu uma interrupção de seis horas. Isso paralisou uma grande parcela do ecossistema Ethereum: interfaces de usuário de DeFi deixaram de exibir posições e saldos dos usuários, mercados de previsão como o Polymarket não mostravam dados corretos e, do ponto de vista do usuário, diversas interfaces de projetos tornaram-se inutilizáveis.

Esse tipo de falha é justamente o que aplicações descentralizadas buscam prevenir. A principal motivação do design do blockchain é eliminar pontos únicos de falha. O ocorrido com a Goldsky expôs uma realidade inquietante: embora blockchains sejam projetados para descentralização, a maior parte da infraestrutura de suporte a aplicações on-chain permanece altamente centralizada.

A origem do problema está no fato de que a indexação e a consulta de dados em blockchain são bens públicos digitais — não-excludentes e não-rivais — e os usuários costumar esperar acesso gratuito ou quase gratuito. No entanto, sustentar essa infraestrutura requer investimento constante em hardware, armazenamento, banda larga e engenharia. Sem um modelo de receita viável, o setor tende a concentrar-se em um “vencedor leva tudo”: quando um provedor ganha vantagem em velocidade e capital, os desenvolvedores canalizam todas as consultas para ele, criando um novo ponto de dependência. Gitcoin e outras entidades sem fins lucrativos já alertaram: “infraestrutura de código aberto gera bilhões em valor, mas seus criadores frequentemente não conseguem sequer pagar o aluguel.”

A lição é clara: o universo descentralizado precisa de esforço urgente — seja em financiamento de bens públicos, redistribuição de incentivos ou modelos comunitários — para diversificar a infraestrutura Web3 e evitar novas formas de centralização. É fundamental que desenvolvedores de DApps adotem estratégias “local-first” e que comunidades técnicas projetem DApps resilientes a falhas na recuperação de dados — garantindo que usuários possam seguir utilizando-os mesmo quando indexadores estejam offline.

II. De onde vêm, de fato, os dados do seu DApp?

Para compreender incidentes como a queda da Goldsky, é preciso mergulhar mais fundo na arquitetura dos DApps. A maioria dos usuários reconhece apenas dois componentes: o contrato on-chain e a interface frontend. Consultam o Etherscan para conferir o status das transações, visualizam informações na interface e interagem com contratos pela UI. Mas afinal, de onde o frontend obtém seus dados?

O papel crucial dos serviços de recuperação de dados

Imagine que você está desenvolvendo um protocolo de empréstimos que mostra posições, margem e dívidas dos usuários. Uma implementação simples faria o frontend buscar esses dados diretamente do blockchain. Contudo, a maioria dos contratos não permite consultar todas as posições de um endereço — apenas por ID da posição. Para exibir as posições de um usuário, seria preciso primeiro obter todas as posições abertas e então filtrar as dele — como procurar manualmente entre milhões de registros. Isso é tecnicamente viável, mas extremamente lento e ineficiente, levando até horas para grandes projetos DeFi mesmo em servidores backend.

É aqui que a infraestrutura dedicada se torna indispensável. Provedores como a Goldsky oferecem serviços de indexação de dados que agilizam radicalmente o acesso. O diagrama a seguir mostra os tipos de dados que tais serviços viabilizam para aplicações.

Alguns podem perguntar: O The Graph já não oferece extração descentralizada de dados para Ethereum? Como ele se compara à Goldsky, e por que tantos projetos DeFi optam pela Goldsky em vez do The Graph?

Como The Graph, Goldsky e SubGraph se complementam

Compilando os principais conceitos técnicos:

  • SubGraph é um framework para desenvolvedores, permitindo criar códigos que leem e agregam dados on-chain para exibição no frontend.
  • The Graph é uma plataforma descentralizada líder em extração de dados, que criou o SubGraph em AssemblyScript. Desenvolvedores usam SubGraph para capturar eventos de contrato e gravar em bancos de dados, possibilitando consultas via GraphQL ou SQL.
  • Os provedores que executam SubGraphs são denominados operadores de SubGraph. Tanto The Graph quanto Goldsky atuam como provedores hospedados para projetos SubGraph, já que o código, no fim, precisa rodar em servidores. Veja um exemplo da documentação da Goldsky:

Por que diferentes operadores de SubGraph existem?

Porque o framework define só como extrair dados dos blocos e gravá-los em bancos de dados — não como ocorre o fluxo ou a saída dos dados. Cada operador implementa esses detalhes de forma independente.

Operadores podem incorporar otimizações e modificações proprietárias. Atualmente, o The Graph usa Firehouse para indexação acelerada; já o tempo de execução principal de SubGraph da Goldsky é fechado.

Na prática, o The Graph funciona como um hub descentralizado de operadores SubGraph. Por exemplo, o subgraph Uniswap v3 é mantido por vários operadores, tornando o The Graph um marketplace coletivo onde usuários submetem códigos SubGraph e múltiplos operadores processam as consultas.

Modelo de preços da Goldsky

Como um serviço SaaS centralizado, a Goldsky utiliza o modelo clássico de cobrança por recursos utilizados. Esse padrão já é conhecido da maioria dos engenheiros. Veja abaixo a calculadora de preços da Goldsky:

Modelo de preços do The Graph

O modelo de precificação do The Graph é exclusivo: taxas de consulta e incentivos estão integrados à tokenômica do GRT. Resumidamente:

  • Cada consulta a um SubGraph reparte as taxas: 1% do GRT é queimado; 10% vai para o pool de curadores (geralmente desenvolvedores); cerca de 89% é distribuído entre Indexadores e Delegadores por algoritmo.
  • Indexadores devem apostar no mínimo 100.000 GRT para participar, sofrendo penalidades em caso de resultados errados. Delegadores apostam GRT junto aos Indexadores e partilham o pool de 89% das recompensas.
  • Curadores (frequentemente desenvolvedores) sinalizam interesse apostando GRT em uma curva de ligação (bonding curve) para seus SubGraphs. Quanto mais GRT apostado, mais recursos de Indexadores são atraídos. Recomenda-se na comunidade de 5.000 a 10.000 GRT para garantir indexação constante.

Taxas de Consulta:

O acesso ao The Graph exige cadastro de uma chave de API e pré-pagamento em GRT, com cobrança por requisição feita.

Taxas de Staking de Sinalização:

Para ter SubGraphs indexados, o desenvolvedor deve apostar GRT (“sinalizar”) para atrair operadores. Quando o volume de GRT atinge determinado patamar (exemplo: 10.000), os Indexadores passam a processar aquele SubGraph em produção.

Para testes, é possível implantar SubGraphs gratuitamente no operador de homologação do The Graph. No ambiente produtivo, porém, é necessário publicar o SubGraph na rede, e os Indexadores escolhem quais indexar com base nos sinais apostados.

Por que desenvolvedores (e contadores) rejeitam preços baseados em tokens

Em boa parte dos projetos, o fluxo do The Graph é considerado complexo. Embora a compra de GRT seja trivial para equipes Web3, o processo de curadoria é demorado e incerto. Os principais entraves:

  • Incerteza: desenvolvedores têm dificuldade em saber quanto de GRT apostar ou quanto tempo Indexadores levarão para assumir seu SubGraph.
  • Gestão contábil: precificação baseada em tokenômica dificulta o controle de custos, tornando a categorização de despesas mais complexa para empresas e seus contadores.

“Centralizar é simplesmente mais fácil?”

Para a maioria dos desenvolvedores, a Goldsky é mais simples: o modelo de cobrança é direto, o serviço é imediato após o pagamento, e quase não há incertezas. Isso resultou em forte dependência de um único provedor de indexação no universo Web3.

A tokenômica do The Graph pode ser bem-intencionada, mas sua complexidade afasta usuários e jamais deveria ser repassada ao usuário final — em especial o apostar para curadoria, que deveria ser abstraído por uma interface simples de pagamento.

Não é só uma opinião particular: Paul Razvan Berg, renomado engenheiro de smart contracts e fundador da Sablier, criticou publicamente a experiência de publicação e pagamento via GRT no SubGraph como “extremamente ruim”.

III. Soluções já existentes para quedas de indexadores de dados

Como o ecossistema deveria lidar com pontos únicos de falha em indexação de dados? Como visto, usar o The Graph é possível, mas requer apostar (staking) e curadoria em GRT para liberar o acesso à API.

O ecossistema EVM conta com múltiplas alternativas de indexação de dados. Referências úteis: The State of EVM Indexing da Dune, o panorama de ferramentas de indexação do rindexer e este thread (fio) recente.

Este artigo não investiga a causa técnica específica do incidente da Goldsky; de acordo com seu relatório oficial, as informações detalhadas só foram compartilhadas com clientes corporativos. O relato aponta um problema na escrita dos dados indexados no banco, e o acesso foi restaurado apenas graças ao suporte da AWS.

Veja outras alternativas viáveis:

  • ponder é uma ferramenta de indexação de dados simples, fácil de instalar e amigável para desenvolvedores. Pode ser autogerenciada em infraestrutura própria.
  • local-first é uma filosofia de desenvolvimento que propõe que DApps permaneçam utilizáveis mesmo sem conexão de rede. No universo blockchain, significa garantir experiência de uso enquanto houver conexão com a cadeia, mesmo se indexadores estiverem inoperantes.

Ponder: indexação de dados faça-você-mesmo

Por que recomendar ponder?

  • Independência de fornecedores: criado por desenvolvedor autônomo, requer apenas endpoint RPC Ethereum e banco Postgres — sem dependência de serviços gerenciados.
  • Ótima experiência para quem desenvolve: escrito em TypeScript e baseado na biblioteca Viem, é de fácil utilização (segundo ampla experiência do autor).
  • Desempenho superior.

Há pontos de atenção: o ponder evolui rapidamente, então mudanças podem eventualmente afetar implantações antigas. Para detalhes técnicos e recomendações, acesse a documentação oficial.

Vale citar que ponder iniciou recentemente uma estratégia comercial alinhada à “teoria da separação”, conforme analisado anteriormente.

Em resumo: bens públicos beneficiam todos, mas cobrar por eles reduz o bem-estar coletivo ao excluir usuários marginais (não pareto-ótimo). Precificação diferenciada poderia maximizar o excedente, mas é difícil de implementar. A teoria da separação propõe isolar um subgrupo homogêneo, cobrando apenas dele e mantendo os demais isentos.

Como ponder aplica esse conceito:

  • A implantação exige conhecimentos técnicos — os desenvolvedores precisam configurar dependências externas (endpoint RPC, banco de dados).
  • Há manutenção contínua (por exemplo, uso de proxies para balanceamento de carga e garantia de consulta de dados na linha de execução correta). Para alguns desenvolvedores, pode ser desafiador.
  • Agora ponder disponibiliza implantação automatizada em beta via Marble: basta submeter o código e realizar a implantação com um clique.

Esse modelo “separa” quem busca conveniência — que paga pelo serviço hospedado da Marble — enquanto autogerenciadores seguem usando ponder gratuitamente.

Ponder versus Goldsky:

  • Ferramentas autogerenciadas e permissionless como ponder atraem projetos menores que valorizam autonomia e flexibilidade.
  • Projetos de grande porte com alta demanda de performance costumam optar por serviços gerenciados como Goldsky, que garantem mais disponibilidade e redundância.

Ambos os modelos apresentam riscos. O incidente da Goldsky evidencia a importância de todo desenvolvedor manter um indexador ponder próprio como backup. E ao usar ponder, atenção também à validade das respostas RPC — recentemente, Safe notificou um incidente envolvendo dados RPC inválidos e falha de indexador. Não há prova de que o caso da Goldsky foi causado por isso, mas o risco existe.

O paradigma local-first no desenvolvimento

A abordagem local-first gerou intenso debate nos últimos anos. Essencialmente, ela busca:

  • Disponibilidade offline
  • Colaboração multiusuário entre dispositivos

Grande parte das discussões técnicas local-first menciona CRDTs (Conflict-free Replicated Data Types) — estruturas que resolvem automaticamente conflitos em edições distribuídas. Elas funcionam como protocolos de consenso leves, mantendo a consistência dos dados entre dispositivos.

No desenvolvimento blockchain, esses requisitos são menos rigorosos: o principal objetivo é garantir alguma funcionalidade ao usuário mesmo se backends indexadores estiverem offline, aproveitando a consistência intrínseca do blockchain.

Na prática, DApps local-first podem:

  • Armazenar localmente informações essenciais — saldos, posições — garantindo ao usuário visualizar o último estado conhecido mesmo sem indexador;
  • Degradar de modo inteligente — buscar dados críticos diretamente do RPC caso indexadores estejam fora do ar, permitindo visualização parcial de dados on-chain em tempo real.

Essa estratégia aumenta consideravelmente a resiliência das aplicações. Em um cenário ideal, o DApp local-first permitiria ao usuário rodar um nó local e consultar dados com ferramentas como TrueBlocks. Para saber mais sobre indexação descentralizada e local, consulte o thread (fio) Literally no one cares about decentralized frontends and indexers.

IV. Conclusão

A interrupção de seis horas na Goldsky foi um alerta para todo o ecossistema Web3. Apesar dos blockchains serem desenhados para descentralização e resiliência, a maioria das aplicações ainda depende fortemente de infraestrutura centralizada de dados — expondo todo o ecossistema a novos riscos sistêmicos.

Este artigo detalhou por que o The Graph, embora amplamente reconhecido, encontra barreiras de adoção devido à complexidade do GRT e à experiência desenvolvedor pouco amigável. Também apresentamos estratégias para criar indexação de dados mais robusta — sugerindo a adoção de frameworks autogerenciados como ponder como soluções de backup, destacando o modelo inovador de comercialização do ponder — e exploramos o paradigma local-first, incentivando desenvolvedores de DApps a manterem a usabilidade mesmo na ausência de indexadores.

Com mais frequência, desenvolvedores Web3 reconhecem pontos únicos de falha em indexação de dados como uma vulnerabilidade crítica. A GCC convida a comunidade a priorizar esse desafio fundamental e a experimentar indexadores de dados descentralizados ou arquiteturas que mantenham os frontends dos DApps operacionais mesmo durante quedas de indexadores.

Avisos:

  1. Republicado de TechFlow. Os direitos autorais permanecem com o autor original, shew. Em caso de dúvidas sobre esta republicação, entre em contato com a equipe Gate Learn para solução.
  2. Aviso: As opiniões expressas neste artigo são exclusivamente do autor e não configuram recomendação de investimento.
  3. Traduções feitas pela equipe Gate Learn não podem ser copiadas, distribuídas ou plagiadas sem a devida atribuição ao Gate.com.

Compartilhar

Calendário Cripto

Encontro em Ho Chi Minh
Metis trará sua iniciativa BUIDL Hour para Ho Chi Minh City como parte do ETHVietnam em 9 de agosto.
METIS
-3.22%
2025-08-08
AMA no X
THORChain irá segurar um AMA no X com Vultisig no dia 9 de agosto às 15:00 UTC para examinar os desenvolvimentos em torno da carteira VULT. A discussão deve delinear os objetivos do projeto e seu potencial impacto na funcionalidade das carteiras de criptomoeda.
RUNE
-6.6%
2025-08-08
AMA no Discord
Nibiru fará um AMA no Discord no dia 9 de agosto às 16:00 UTC para demonstrar a navegação dos aplicativos da Festa de Blocos.
NIBI
-1.36%
2025-08-08
AMA no X
O Token UFO realizará um AMA no X no dia 9 de agosto às 14:00 UTC. A sessão examinará o desempenho recente do mercado do projeto e os desenvolvimentos relacionados ao PulseChain.
UFO
-4.37%
2025-08-08
ETH Vietnã em Ho Chi Minh City
A Kadena participará da conferência ETH Vietnam, programada para os dias 9 e 10 de agosto em Ho Chi Minh City. O evento está marcado para reunir desenvolvedores de blockchain e profissionais da indústria para discussões sobre desenvolvimentos tecnológicos dentro do ecossistema Ethereum.
KDA
-4.87%
2025-08-09

Artigos Relacionados

O que é Bitcoin?
iniciantes

O que é Bitcoin?

Bitcoin, a primeira criptomoeda usada com sucesso no mundo, é uma rede descentralizada de pagamento digital peer-to-peer inventada por Satoshi Nakamoto. O Bitcoin permite que os usuários negociem diretamente sem uma instituição financeira ou terceiros.
11/21/2022, 10:12:36 AM
O que é o PolygonScan e como você pode usá-lo? (Atualização 2025)
iniciantes

O que é o PolygonScan e como você pode usá-lo? (Atualização 2025)

PolygonScan é um explorador de blockchain que permite aos usuários acessar detalhes de transações publicamente compartilhados na rede Polygon. Na atualização de 2025, agora processa mais de 5 bilhões de transações com confirmações em milissegundos, apresenta ferramentas de desenvolvedor aprimoradas, integração com Layer 2, análises avançadas, recursos de segurança melhorados e uma experiência móvel redesenhada. A plataforma ajuda os usuários a rastrear transações e obter insights mais profundos sobre o fluxo de ativos no crescente ecossistema da Polygon, que agora abriga 3,2 milhões de endereços ativos diários e $8,7 bilhões em valor total bloqueado.
11/11/2023, 6:20:25 PM
O que é EtherVista, o autoproclamado "Novo Padrão para DEX"?
intermediário

O que é EtherVista, o autoproclamado "Novo Padrão para DEX"?

Este artigo fornece uma análise aprofundada da emergente exchange descentralizada (DEX) EtherVista e seu token de plataforma, VISTA. Explora como a EtherVista visa desafiar o modelo existente de AMM (Automated Market Maker), especialmente o da Uniswap, por meio de seus mecanismos de negociação exclusivos e modelo de distribuição de taxas. O artigo também explora os contratos inteligentes da EtherVista, a tokenomia e como atrai usuários ao oferecer taxas de gás baixas e um inovador sistema de distribuição de receitas.
9/10/2024, 3:49:43 PM
O que é Tronscan e como você pode usá-lo em 2025?
iniciantes

O que é Tronscan e como você pode usá-lo em 2025?

Tronscan é um explorador de blockchain que vai além do básico, oferecendo gerenciamento de carteira, rastreamento de tokens, insights de contratos inteligentes e participação em governança. Até 2025, evoluiu com recursos de segurança aprimorados, análises expandidas, integração entre cadeias e experiência móvel aprimorada. A plataforma agora inclui autenticação biométrica avançada, monitoramento de transações em tempo real e um painel abrangente de DeFi. Os desenvolvedores se beneficiam da análise de contratos inteligentes alimentados por IA e ambientes de teste aprimorados, enquanto os usuários desfrutam de uma visualização unificada de portfólio multi-cadeias e navegação baseada em gestos em dispositivos móveis.
11/22/2023, 6:27:42 PM
O que é Coti? Tudo o que você precisa saber sobre o COTI
iniciantes

O que é Coti? Tudo o que você precisa saber sobre o COTI

Coti (COTI) é uma plataforma descentralizada e escalonável que oferece suporte a pagamentos sem atrito para finanças tradicionais e moedas digitais.
11/2/2023, 9:09:18 AM
O que é Neiro? Tudo o que você precisa saber sobre NEIROETH em 2025
intermediário

O que é Neiro? Tudo o que você precisa saber sobre NEIROETH em 2025

Neiro é um cachorro da raça Shiba Inu que inspirou o lançamento de tokens Neiro em diferentes blockchains. Em 2025, o Neiro Ethereum (NEIROETH) evoluiu para uma das principais moedas meme com um valor de mercado de $215 milhões, mais de 87.000 detentores e listagens em 12 grandes exchanges. O ecossistema agora inclui um DAO para governança comunitária, uma loja oficial de mercadorias e um aplicativo móvel. NEIROETH implementou soluções de camada 2 para melhorar a escalabilidade e consolidou sua posição entre as 10 principais moedas meme temáticas de cachorro por capitalização de mercado, apoiado por uma comunidade vibrante e influenciadores cripto líderes.
9/5/2024, 3:37:06 PM
Comece agora
Inscreva-se e ganhe um cupom de
$100
!