Передайте оригинальный заголовок: Как искусственный интеллект революционизирует Ethereum? "AI+Blockchain" с другой точки зрения
За последний год, с генеративным искусственным интеллектом, неоднократно превзошедшим ожидания, волна революции продуктивности искусственного интеллекта прокатилась через криптовалютное сообщество. Многие проекты на основе концепции искусственного интеллекта привели к мифу о создании богатства на вторичном рынке. В то же время всё больше разработчиков начинают разрабатывать свои собственные проекты "ИИ+Крипто".
Однако при ближайшем рассмотрении можно заметить, что эти проекты демонстрируют сильную взаимозаменяемость, при этом большинство проектов сосредоточены только на улучшении «производственных отношений», таких как организация вычислительных мощностей через децентрализованные сети или создание «децентрализованного обнимающего лица» и так далее. Лишь немногие проекты пытаются по-настоящему интегрировать и внедрять инновации из базовой технологии. Мы считаем, что причина этого явления кроется в «доменном смещении» между сферами искусственного интеллекта и блокчейна. Несмотря на их обширное пересечение, мало кто по-настоящему понимает обе области. Например, разработчикам ИИ сложно понять техническую реализацию и историческое состояние инфраструктуры Ethereum, не говоря уже о том, чтобы предложить углубленные решения по оптимизации.
Возьмем машинное обучение (ML), самое основное направление искусственного интеллекта (AI), в качестве примера. Это технология, позволяющая машинам принимать решения на основе данных без явных программных инструкций. Машинное обучение показало огромный потенциал в анализе данных и распознавании образов и стало обычным явлением в Web 2. Однако из-за его первоначальных ограничений даже во главе инноваций технологии блокчейн, такой как Ethereum, его архитектура, сеть и механизмы управления пока не используют машинное обучение эффективно в качестве инструмента для решения сложных проблем.
«Великие инновации часто возникают из междисциплинарных областей». Цель написания этой статьи - помочь разработчикам искусственного интеллекта лучше понять мир блокчейна и предоставить новые идеи для разработчиков в сообществе Ethereum. В этой статье мы сначала представляем техническую реализацию Ethereum, а затем предлагаем решение применить машинное обучение, фундаментальный алгоритм искусственного интеллекта, к сети Ethereum для повышения ее безопасности, эффективности и масштабируемости. Мы надеемся, что этот случай послужит отправной точкой для представления некоторых различных точек зрения с рынка и стимулирует больше инновационных кросс-комбинаций «ИИ+блокчейн» в экосистеме разработчиков.
Базовая структура данных
Суть блокчейна заключается в цепи блоков, и ключ к различию цепей заключается в конфигурации цепи, являющейся существенной частью любого генезиса блокчейна. Для Ethereum конфигурация цепи используется для различения различных цепей в рамках Ethereum, идентифицируя важные протоколы обновлений и веховые события. Например, DAOForkBlock обозначает высоту хардфорка Ethereum после атаки на DAO, в то время как ConstantinopleBlock обозначает высоту блока для апгрейда Константинополя. Для крупных обновлений, содержащих многочисленные предложения по улучшению, устанавливаются специальные поля для идентификации соответствующих высот блоков. Кроме того, Ethereum включает различные тестовые сети и основную сеть, уникально идентифицируемые по ChainID для обозначения их собственных сетевых экосистем.
Генезис-блок служит нулевым блоком целого блокчейна, на который прямо или косвенно ссылаются другие блоки. Поэтому узлы должны загружать правильную информацию о генезис-блоке при инициализации, без допуска произвольных модификаций. Информация о конфигурации генезис-блока включает в себя вышеперечисленную конфигурацию цепочки, а также дополнительные данные, такие как соответствующие майнинговые награды, временные метки, сложность и газовые лимиты. Следует отметить, что консенсус-механизм Ethereum перешел с майнинга на доказательство доли.
Счета Ethereum делятся на внешние счета и контрактные счета. Внешние счета управляются уникальным закрытым ключом, в то время как контрактные счета не имеют управления закрытым ключом и могут быть оперированы только путем вызова исполнения кода контракта через внешние счета. Каждому счету соответствует листовой узел в мировом состоянии Ethereum, хранящий состояние счета (различная информация о счете и детали кода).
Транзакции: Как децентрализованная платформа в первую очередь для транзакций и контрактов, блоки Ethereum состоят из упакованных транзакций и дополнительной связанной информации. Блок делится на две части: заголовок блока и тело блока. Данные заголовка блока содержат доказательства, связывающие все блоки в цепь, включая хэш предыдущего блока и доказательства всего мирового состояния Ethereum, корень транзакций, корень квитанций и дополнительные данные, такие как сложность и номер. Тело блока хранит список транзакций и список заголовков дядь-блоков (поскольку Ethereum перешел на доказательство доли, ссылки на дядь-блоки больше не существуют).
Квитанции о сделках предоставляют результаты выполнения транзакции и дополнительную информацию, которую нельзя непосредственно получить, изучая саму транзакцию. В частности, они содержат содержимое согласования, информацию о транзакции и информацию о блоке, указывая, была ли успешной обработка транзакции и предоставляя журналы транзакций и детали расхода газа. Анализ информации в квитанциях помогает отлаживать код смарт-контракта и оптимизировать расход газа, обеспечивая при этом подтверждение того, что транзакция была обработана сетью, и позволяя просматривать результаты транзакции и их воздействие.
В Ethereum газовые сборы можно понять просто как комиссию за транзакцию. Когда вы отправляете токены, выполняете смарт-контракты, передаете Эфир или выполняете различные операции на блокчейне в определенном блоке, эти транзакции требуют газовых сборов. Вычислительные ресурсы Ethereum потребляются при обработке этих транзакций, и вам приходится платить газовые сборы, чтобы мотивировать сеть работать на вас. В конечном итоге газовые сборы выплачиваются в качестве комиссии за транзакцию майнерам, и специфическая формула расчета может быть понята как Сбор = Использованный газ * Цена газа, где цена за единицу газа устанавливается инициатором транзакции и часто определяет скорость включения транзакции в блоки. Установка слишком низкой цены за газ может привести к невыполнению транзакций, и также необходимо установить предел газа как верхнюю границу, чтобы избежать неожиданного расхода газа из-за ошибок в смарт-контрактах.
Торговый пул
В Ethereum существует большое количество транзакций, и по сравнению с централизованными системами пропускная способность децентрализованных систем в терминах транзакций в секунду значительно ниже. При входе большого количества транзакций в узлы им необходимо поддерживать пул транзакций для правильного управления ими. Распространение транзакций происходит через коммуникацию точка-точка. Конкретно, узел будет транслировать исполнимые транзакции своим соседним узлам, которые в свою очередь распространят транзакцию на свои соседние узлы, позволяя транзакции распространяться по всей сети Ethereum в пределах 6 секунд.
Транзакции в торговом пуле делятся на исполнимые транзакции и неисполнимые транзакции. Исполнимые транзакции, имеющие более высокий приоритет, выполняются и включаются в блоки, в то время как все транзакции, входящие в пул в начале, являются неисполнимыми и становятся исполнимыми позже. Исполнимые и неисполнимые транзакции записываются соответственно в контейнере ожидающих и контейнере очереди.
Кроме того, пул транзакций поддерживает список локальных транзакций. Локальные транзакции имеют различные преимущества, включая более высокий приоритет, иммунитет к ограничениям объема транзакций и немедленную загрузку обратно в пул транзакций при перезапуске узла. Локальное хранилище локальных транзакций достигается через журнал, обеспечивая сохранение незавершенных локальных транзакций и их периодическое обновление.
Перед тем, как транзакция будет поставлена в очередь, ее действительность проверяется, включая различные типы проверок, такие как предотвращение атак DOS, предотвращение отрицательных транзакций и проверку лимитов газа транзакции. Простое составление пула транзакций можно разделить на очередь + ожидающие (включая все транзакции). После завершения проверки действительности выполняются дополнительные проверки, включая проверку того, достигла ли очередь транзакций своего лимита, и определение, имеют ли удаленные транзакции (не местные транзакции) самую низкую цену в пуле транзакций, заменяя самую дешевую транзакцию в пуле. Для замены выполнимых транзакций разрешается заменить только те транзакции, у которых увеличение комиссии составляет не более 10% по сравнению с теми, которые ожидают выполнения, и замененные транзакции хранятся как невыполнимые транзакции. Кроме того, недействительные и превышающие лимит транзакции удаляются во время процесса обслуживания пула транзакций, а подходящие транзакции заменяются.
Механизм консенсуса
На ранних этапах теория консенсуса Ethereum была основана на методе вычисления хэш-значения сложности. Другими словами, для того чтобы блок считался действительным, необходимо было вычислить хэш-значение блока, соответствующее условию целевого значения сложности. Поскольку алгоритм консенсуса Ethereum перешел от Proof of Work (PoW) к Proof of Stake (PoS), я кратко опишу здесь алгоритм PoS. Ethereum завершил слияние цепочки маяка в сентябре 2022 года, реализовав алгоритм PoS. Конкретно, в основанной на PoS Ethereum стабильное время блока составляет 12 секунд. Пользователи ставят свои Ethereum, чтобы получить право стать валидаторами. Затем среди участвующих стейкеров проводится процесс случайного выбора для выбора набора валидаторов. В каждом раунде, который включает 32 слота, для каждого слота выбирается валидатор в качестве предлагающего, в то время как оставшиеся валидаторы в том же слоте служат комитетом для проверки законности предлагаемого блока и оценки законности блоков из предыдущего раунда. Алгоритм PoS значительно стабилизирует и ускоряет производство блоков, в значительной степени избегая потери вычислительных ресурсов.
Алгоритм подписи
Ethereum принимает тот же стандарт алгоритма подписи, что и Bitcoin, который использует кривую secp256k1. Конкретно, используется алгоритм подписи ECDSA, где подпись рассчитывается на основе хэша исходного сообщения. Подпись состоит из компонентов R+S+V. Каждое вычисление вводит случайное число, и R+S представляет собой исходный вывод ECDSA. Последнее поле V, известное как поле восстановления, указывает количество попыток, необходимых для успешного восстановления открытого ключа из содержимого и подписи, потому что поиск координат, которые удовлетворяют требованиям на основе значения R на эллиптической кривой, может иметь несколько решений.
Весь процесс можно кратко описать следующим образом: данные транзакции и соответствующая информация подписчика хешируются после кодирования с помощью RLP, а окончательная подпись получается подписью с использованием закрытого ключа через ECDSA. Кривая, используемая в ECDSA, - это эллиптическая кривая secp256k1. Наконец, подписанные данные транзакции объединяются с данными транзакции для получения подписанных данных транзакции, которые могут быть переданы в эфир.
Структура данных Ethereum не только зависит от традиционной технологии блокчейна, но также включает в себя дерево Меркля-Патриции (MPT), также известное как Мерклево Сжатое Префиксное Дерево, для эффективного хранения и верификации больших объемов данных. MPT объединяет криптографическую хэш-функцию дерева Меркля и функцию сжатия ключевого пути дерева Патриции, обеспечивая решение, которое гарантирует целостность данных и поддерживает быстрые поиски.
Дерево Меркла-Патриции (MPT)
В Ethereum MPT используется для хранения всех данных о состоянии и транзакциях, гарантируя, что любые изменения данных будут отражены в корневом хеше дерева. Это означает, что, проверив корневой хеш, можно доказать целостность и точность данных без проверки всей базы данных. MPT состоит из четырех типов узлов: листовые узлы, узлы расширения, узлы ветвей и пустые узлы, которые вместе образуют дерево, способное адаптироваться к динамическим изменениям данных. Всякий раз, когда данные обновляются, MPT отражает эти изменения, добавляя, удаляя или изменяя узлы, обновляя корневой хэш дерева. Поскольку каждый узел шифруется с помощью хеш-функции, любые незначительные изменения в данных приведут к значительным изменениям корневого хэша, обеспечивая безопасность и согласованность данных. Кроме того, конструкция MPT поддерживает проверку «легкого клиента», позволяя узлам проверять существование или статус конкретной информации, сохраняя только корневой хэш дерева и необходимые узлы пути, что значительно снижает потребность в хранении и обработке данных.
Через MPT Ethereum не только достигает эффективного управления и быстрого доступа к данным, но и обеспечивает безопасность и децентрализацию сети, поддерживая работу и развитие всей сети Ethereum.
State Machine
Основная архитектура Ethereum включает в себя концепцию конечного автомата, где виртуальная машина Ethereum (EVM) является средой выполнения для выполнения всего кода смарт-контрактов, и сам Ethereum можно рассматривать как глобальную общедоступную систему перехода состояний. Выполнение каждого блока можно рассматривать как процесс перехода состояний, переходящий от одного глобального общедоступного состояния к другому. Этот дизайн обеспечивает согласованность и децентрализацию сети Ethereum, делает результаты выполнения смарт-контрактов предсказуемыми и защищает их от вмешательства.
В Ethereum термин 'state' относится к текущей информации всех счетов, включая баланс каждого счета, хранимые данные и код смарт-контрактов. Каждый раз, когда происходит транзакция, EVM вычисляет и изменяет 'state' на основе содержания транзакции, и этот процесс эффективно и безопасно записывается через MPT. Каждое изменение состояния не только меняет данные счета, но также приводит к обновлению MPT, отраженному в изменении корневого хэша дерева.
Отношения между EVM и MPT критически важны, потому что MPT обеспечивает гарантию целостности данных для переходов состояния Ethereum. Когда EVM выполняет транзакции и изменяет состояния учетных записей, соответствующие узлы MPT обновляются для отражения этих изменений. Поскольку каждый узел MPT связан через хеши, любое изменение состояния вызовет изменение корневого хеша, который затем включается в новый блок, обеспечивая согласованность и безопасность всего состояния Ethereum. Теперь давайте познакомимся с Ethereum Virtual Machine (EVM).
EVM
Виртуальная машина Ethereum (EVM) является фундаментальным компонентом, ответственным за выполнение смарт-контрактов и облегчение переходов состояний в сети Ethereum. Благодаря EVM Ethereum можно представить как мировой компьютер. EVM является полностью универсальной, что означает, что смарт-контракты, развернутые на Ethereum, могут выполнять произвольно сложные логические вычисления. Введение механизма газа в Ethereum предотвращает сценарии, такие как бесконечные циклы в контрактах, обеспечивая стабильность и безопасность сети.
На более техническом уровне EVM - это стековая виртуальная машина, которая выполняет смарт-контракты с использованием специфического для Ethereum байткода. Разработчики обычно пишут смарт-контракты на высокоуровневых языках, таких как Solidity, которые затем компилируются в байткод, понятный EVM для выполнения. EVM - ключевое новшество блокчейна Ethereum, поддерживающее не только выполнение смарт-контрактов, но и обеспечивающее прочную основу для разработки децентрализованных приложений (DApps). Через EVM Ethereum формирует децентрализованное, безопасное и открытое цифровое будущее.
Рисунок 1 Исторический обзор Ethereum
Умные контракты - это компьютерные программы, работающие на блокчейне Ethereum. Они позволяют разработчикам создавать и развертывать различные приложения, включая, но не ограничиваясь, приложениями для кредитования, децентрализованными биржами, страхованием, вторичным финансированием, социальными сетями и NFT. Безопасность умных контрактов является критически важной для этих приложений. Эти приложения напрямую отвечают за обработку и управление криптовалютами, и любые уязвимости или злонамеренные атаки на умные контракты представляют прямую угрозу безопасности средств, что потенциально может привести к значительным экономическим потерям. Например, 26 февраля 2024 года протокол кредитования DeFi Blueberry Protocol подвергся атаке из-за ошибок логики умных контрактов, что привело к потере примерно 1 400 000 долларов.
Уязвимости смарт-контрактов имеют многоаспектный характер, охватывая неразумную бизнес-логику, неправильный контроль доступа, недостаточную проверку данных, атаки повторного входа и атаки DOS (отказ в обслуживании), среди других аспектов. Эти уязвимости могут вызвать проблемы с выполнением контракта, влияя на эффективную работу смарт-контрактов. Возьмем атаки DOS в качестве примера: этот тип атаки потребляет сетевые ресурсы путем отправки большого количества транзакций, что приводит к медленной обработке транзакций, инициированных обычными пользователями, что приводит к снижению пользовательского опыта. Кроме того, это также может привести к увеличению комиссий за газ для транзакций. Когда сетевые ресурсы ограничены, пользователям может потребоваться платить более высокие комиссии, чтобы приоритезировать обработку своих транзакций.
В дополнение к этому, пользователи Ethereum также сталкиваются с инвестиционными рисками, поскольку безопасность их средств находится под угрозой. Например, существуют «коврики», используемые для описания криптовалют, которые, как считается, не имеют практически никакой ценности или долгосрочного потенциала роста. Ковры часто используются в качестве инструментов для мошенничества или для стратегий накачки и сброса для манипулирования ценами. Инвестирование в ковры сопряжено с высокими инвестиционными рисками и может привести к значительным финансовым потерям. Из-за своей низкой цены и рыночной стоимости они уязвимы для манипуляций и волатильности. Эти токены часто используются для схем накачки и сброса и мошенничества с приманками, заманивая инвесторов фальшивыми проектами и крадя их средства. Еще один распространенный риск — когда создатели внезапно удаляют всю ликвидность из проекта, что приводит к резкому падению стоимости токена. Эти мошенничества часто включают в себя маркетинг через фальшивые партнерские отношения и одобрения. Как только цена токена растет, мошенники продают свои токены, исчезают, оставляя инвесторов с бесполезными токенами. Более того, инвестирование в ковры также отвлекает внимание и ресурсы от законных криптовалют с реальной полезностью и потенциалом роста. Помимо ковров, воздушные монеты и монеты финансовых пирамид также являются методами быстрого получения прибыли. Для пользователей, не обладающих профессиональными знаниями и опытом, отличить их от законных криптовалют особенно сложно.
Эффективность
Два очень прямых показателя эффективности Ethereum - скорость транзакций и газовые сборы. Скорость транзакций относится к количеству транзакций, которые сеть Ethereum может обработать за единицу времени. Этот показатель напрямую отражает производительность сети Ethereum; чем быстрее скорость, тем выше эффективность. Для каждой транзакции на Ethereum требуется определенное количество газовых сборов для компенсации майнерам за проверку транзакции. Более низкие газовые сборы указывают на более высокую эффективность в Ethereum.
Уменьшение скорости транзакций может привести к увеличению комиссий за газ. Обычно, когда скорость обработки транзакций снижается из-за ограниченного пространства блока, может возникнуть больше конкуренции за попадание транзакций в следующий блок. Чтобы выделиться в конкуренции, трейдеры обычно увеличивают комиссии за газ, поскольку майнеры часто отдают приоритет транзакциям с более высокими комиссиями за газ для верификации. Следовательно, более высокие комиссии за газ снижают удовлетворенность пользовательским опытом.
Транзакции - это всего лишь базовые действия на Ethereum. В этой экосистеме пользователи также могут заниматься различными видами деятельности, такими как кредитование, стейкинг, инвестирование, страхование и т. д. Это можно сделать через конкретные DApps. Однако, учитывая разнообразие DApps и отсутствие персонализированных рекомендательных сервисов, аналогичных традиционным отраслям, пользователи могут почувствовать себя смущенно при выборе подходящих приложений и продуктов. Эта ситуация может привести к снижению удовлетворенности пользователей, влияя на общую эффективность экосистемы Ethereum.
Возьмем в качестве примера кредитование. Некоторые платформы DeFi используют механизмы сверхзалога для обеспечения безопасности и стабильности своих платформ. Это означает, что заемщики должны предоставить больше активов в качестве залога, которые не могут быть использованы заемщиками для других деятельностей во время срока займа. Это приводит к снижению использования средств заемщика, тем самым уменьшая рыночную ликвидность.
Модели машинного обучения, такие как модель RMF, генеративно-состязательные сети (GAN), модель дерева принятия решений, алгоритм ближайших соседей K-Nearest Neighbors (KNN) и алгоритм кластеризации DBSCAN, играют важную роль в Ethereum. Применение этих моделей машинного обучения в Ethereum может помочь оптимизировать эффективность обработки транзакций, улучшить безопасность смарт-контрактов, достичь сегментации пользователей для предоставления более персонализированных услуг и способствовать поддержанию стабильности сети.
Алгоритмы машинного обучения - это набор инструкций или правил, используемых для анализа данных, изучения закономерностей в данных и принятия прогнозов или решений на основе этого обучения. Они автоматически учатся и улучшаются на основе предоставленных данных без необходимости явных программных инструкций от людей. Модели машинного обучения, такие как модель RMF, генеративно-состязательные сети (GAN), модель дерева решений, алгоритм ближайших соседей (KNN) и алгоритм кластеризации DBSCAN, играют важную роль в Ethereum. Применение этих моделей машинного обучения в Ethereum может помочь оптимизировать эффективность обработки транзакций, улучшить безопасность смарт-контрактов, достичь сегментации пользователей для предоставления более персонализированных услуг и способствовать поддержанию стабильности сети.
Классификатор Байеса эффективен в различных статистических методах классификации, нацеленных на минимизацию вероятности ошибок классификации или минимизацию среднего риска в рамках конкретных стоимостных структур. Его философия проектирования глубоко укоренена в теореме Байеса, что позволяет ему определять вероятность того, что объект принадлежит определенному классу при наличии определенных признаков, и делать решения, вычисляя апостериорную вероятность объекта.
В частности, байесовский классификатор сначала рассматривает априорную вероятность объекта, затем применяет байесовскую формулу для всестороннего рассмотрения наблюдаемых данных, тем самым обновляя убеждения относительно классификации объекта. Среди всех возможных классификаций байесовский классификатор выбирает класс с наивысшей апостериорной вероятностью и относит объект к этому классу. Основным преимуществом этого подхода является его способность естественно обрабатывать неопределенность и неполную информацию, что делает его мощным и гибким инструментом, применимым в широком диапазоне сценариев.
Рисунок 2: Байесовский классификатор
Как показано на рисунке 2, в контролируемом машинном обучении байесовский классификатор использует данные и вероятностную модель, основанную на теореме Байеса, для принятия решений о классификации. Учитывая вероятность, априорные вероятности классов и признаков, байесовский классификатор вычисляет апостериорную вероятность принадлежности точек данных к каждому классу и присваивает точки данных классу с наибольшей апостериорной вероятностью. На разбросном графике справа классификатор пытается найти кривую, разделяющую точки разных цветов, тем самым минимизируя ошибки классификации.
Алгоритм дерева решений часто используется в задачах классификации и регрессии. Он принимает иерархический подход к принятию решений, разделяя деревья на основе признаков с более высокими показателями прироста информации из известных данных, чтобы обучить деревья решений. По сути, весь алгоритм может автономно изучать правила принятия решений из данных для определения значений переменных. При реализации дерево решений может декомпозировать сложные процессы принятия решений на несколько простых подпроцессов, формируя структуру похожую на дерево.
Как показано на рисунке 3, каждый узел представляет собой решение, с критериями для оценки определенных атрибутов, в то время как ветви представляют результаты принятия решения. Каждый листовой узел представляет собой окончательный прогнозируемый результат и категорию. С точки зрения состава алгоритма, модели деревьев решений интуитивны, легко понимаются и обладают сильной интерпретируемостью.
Изображение 3: Модель дерева принятия решений
DBSCAN (Density-Based Spatial Clustering of Applications with Noise) - это алгоритм плотностной пространственной кластеризации, который обрабатывает шум и оказывается особенно эффективным для несвязанных наборов данных. Этот алгоритм может обнаруживать кластеры произвольных форм без необходимости заранее указывать количество кластеров, и он проявляет хорошую устойчивость к выбросам в наборе данных. Кроме того, алгоритм может эффективно идентифицировать выбросы в наборах данных с шумом, где шум или выбросы определяются как точки в областях низкой плотности, как показано на рисунке 4.
Изображение 4: Алгоритм DBSCAN идентифицирует шум
Алгоритм KNN (K-ближайших соседей) можно использовать как для классификационных, так и для регрессионных задач. В задачах классификации алгоритм определяет категорию элемента для классификации на основе механизма голосования, а в задачах регрессии он вычисляет среднее или взвешенное среднее значений k ближайших образцов для прогнозирования.
Как показано на рисунке 5, принцип работы алгоритма KNN в классификации заключается в том, чтобы найти K ближайших соседей новой точки данных, а затем предсказать категорию новой точки данных на основе категорий этих соседей. Если K=1, то новая точка данных просто присваивается категории ее ближайшего соседа. Если K>1, то обычно используется метод голосования для определения категории новой точки данных, что означает, что она будет присвоена категории, к которой принадлежит большинство ее соседей. Когда алгоритм KNN используется для задач регрессии, основная идея та же самая, но результатом является среднее значение выходных значений K ближайших соседей.
Рис. 5: Алгоритм KNN, используемый для классификации
Генеративный ИИ - это технология ИИ, которая может создавать новый контент (такой как текст, изображения, музыка и т. д.) на основе входных требований. Он укоренен в достижениях машинного обучения и глубокого обучения, особенно в областях обработки естественного языка и распознавания изображений. Генеративный ИИ изучает шаблоны и корреляции из большого объема данных, а затем создает совершенно новый вывод на основе этой полученной информации. Ключ к генеративному ИИ заключается в обучении модели, которое требует отличных данных для обучения. Во время этого процесса модель постепенно улучшает свою способность генерировать новый контент, анализируя и понимая структуру, шаблоны и отношения в наборе данных.
Как показано на рисунке 6, введение механизмов многоголового внимания и самовнимания, вместе с остаточными соединениями и полностью связанными нейронными сетями, в сочетании с предыдущими техниками эмбеддинга слов, значительно улучшило производительность генеративных моделей, связанных с обработкой естественного языка.
Фигура 6 Модель трансформатора
Модель RFM - это аналитическая модель, основанная на поведении пользователей при покупках, которая может выявить сегменты пользователей разной ценности путем анализа их транзакционного поведения. Эта модель стратифицирует пользователей на основе их Недавности (R), Частоты (F) и Денежной стоимости (M) покупок. Как показано на рисунке 7, эти три показателя совместно формируют основу модели RFM. Модель оценивает пользователей по этим трем измерениям и ранжирует их по их баллам, чтобы выявить наиболее ценные сегменты пользователей. Более того, модель эффективно сегментирует клиентов на разные группы для достижения функционала стратификации пользователей.
Рисунок 7 Многоуровневая модель RFM
При решении проблем безопасности Ethereum с использованием техник машинного обучения мы провели исследование в четырех основных областях:
Идентификация и фильтрация злонамеренных транзакций на основе байесовского классификатора
Путем построения Байесовского классификатора можно идентифицировать и отфильтровать потенциальные спам-транзакции, включая, но не ограничиваясь, те, которые вызывают атаки DOS через масштабные, частые, мелкие транзакции. Такой подход эффективно поддерживает здоровье сети путем анализа характеристик транзакций, таких как цены на газ и частота транзакций, обеспечивая стабильную работу сети Ethereum.
Генеративно-состязательные сети (GAN) и генеративные сети на основе трансформаторов могут быть использованы для генерации кода смарт-контрактов, который соответствует определенным требованиям и обеспечивает безопасность кода настолько, насколько это возможно. Однако существуют различия в типах данных, на которых они опираются в процессе обучения; первые в основном опираются на небезопасные образцы кода, в то время как последние - наоборот.
Обучая генеративно-состязательные сети (GAN) для изучения существующих безопасных шаблонов контрактов и создания самоадверсарных моделей для генерации потенциально небезопасного кода, а затем изучая эти уязвимости, можно автоматически генерировать высококачественный, более безопасный код умных контрактов. Используя модели генеративных сетей на основе трансформера, путем обучения на большом количестве примеров безопасных контрактов можно генерировать код контрактов, который соответствует конкретным требованиям и оптимизирует расход газа, тем самым значительно повышая эффективность и безопасность разработки умных контрактов.
Анализ рисков смарт-контрактов на основе деревьев решений
Использование деревьев принятия решений для анализа функций смарт-контрактов, таких как частота вызовов функций, стоимость транзакции, сложность исходного кода и т. д., может эффективно выявлять потенциальные уровни риска контрактов. Анализируя шаблоны работы контрактов и структуры кода, можно предсказать возможные уязвимости и точки риска, предоставляя разработчикам и пользователям оценку безопасности. Ожидается, что этот метод значительно улучшит безопасность смарт-контрактов в экосистеме Ethereum, тем самым уменьшив убытки, вызванные уязвимостями или злонамеренным кодом.
Построение модели оценки криптовалют для снижения инвестиционных рисков
Анализируя данные о криптовалютных транзакциях, активности в социальных сетях, рыночную производительность и другую многомерную информацию с использованием алгоритмов машинного обучения, можно построить модель оценки, которая предсказывает вероятность появления мусорных монет. Эта модель может предоставить ценные ссылки для инвесторов, помогая избежать инвестиционных рисков и способствовать здоровому развитию рынка криптовалют.
Кроме того, применение машинного обучения имеет потенциал дополнительно улучшить эффективность Ethereum. Мы можем углубиться в следующие три ключевых измерения:
Оптимизация приложения дерева решений моделей очереди пула транзакций
На основе деревьев принятия решений можно эффективно оптимизировать механизм очередей пулов транзакций Ethereum. Анализируя характеристики транзакций, такие как цены на газ и размеры транзакций, деревья принятия решений могут оптимизировать выбор транзакций и порядок их постановки в очередь. Этот метод может значительно улучшить эффективность обработки транзакций, эффективно снизить сетевую перегрузку и сократить время ожидания пользователей транзакций.
Стратификация пользователей и предоставление персонализированных услуг
Модель RFM (Recency, Frequency, Monetary value), широко используемая в качестве аналитического инструмента в управлении взаимоотношениями с клиентами, может эффективно стратифицировать пользователей, оценивая свежесть последней транзакции пользователя, частоту транзакций и их объем. Применение модели RFM на платформе Ethereum может помочь выявить группы пользователей с высокой ценностью, оптимизировать выделение ресурсов и предоставлять более персонализированные услуги, тем самым повышая удовлетворенность пользователей и общую эффективность платформы.
Алгоритм DBSCAN также может анализировать поведение пользователей при транзакциях, помогая идентифицировать различные группы пользователей на Ethereum и предоставлять более индивидуализированные финансовые услуги различным пользователям. Эта стратегия стратификации пользователей может оптимизировать маркетинговые стратегии и улучшить удовлетворенность клиентов и эффективность обслуживания.
Кредитный скоринг на основе KNN
Алгоритм k-ближайших соседей (KNN) может анализировать историю транзакций пользователей Ethereum и шаблоны поведения для оценки кредитоспособности пользователей, что играет чрезвычайно важную роль в финансовых деятельностях, таких как кредитование. Кредитный скоринг помогает финансовым учреждениям и платформам кредитования более точно оценивать способность заемщиков к возврату и кредитный риск, тем самым делая более точные кредитные решения. Это может избежать перекредитования и улучшить ликвидность рынка.
С точки зрения макроуровня аллокации фондов, Эфириум, как самый большой в мире распределенный компьютер, не может иметь слишком много инвестиций в свой инфраструктурный уровень. Ему необходимо привлекать больше разработчиков из различных сред с целью участия в совместном строительстве. В этой статье, рассматривая технические реализации Эфириума и стоящие перед ним вызовы, мы представляем серию интуитивно понятных потенциальных применений машинного обучения. Мы также с нетерпением ждем, когда разработчики искусственного интеллекта из сообщества воплотят эти видения в конкретную ценность.
По мере увеличения вычислительной мощности on-chain мы можем предвидеть разработку более сложных моделей управления сетью, мониторинга транзакций, проверки безопасности и других аспектов, что в конечном итоге повысит эффективность и безопасность сети Ethereum.
Ещё дальнейшие перспективы, механизмы управления ИИ/агентами также могут стать ключевой точкой инноваций в экосистеме Ethereum. Такие механизмы принесут более эффективные, прозрачные и автоматизированные процессы принятия решений, что приведет к более гибкой и надежной структуре управления для платформы Ethereum. Эти будущие направления будут не только способствовать инновациям в технологии Ethereum, но и обеспечивать пользователям более качественный ончейн-опыт.
Пригласить больше голосов
Передайте оригинальный заголовок: Как искусственный интеллект революционизирует Ethereum? "AI+Blockchain" с другой точки зрения
За последний год, с генеративным искусственным интеллектом, неоднократно превзошедшим ожидания, волна революции продуктивности искусственного интеллекта прокатилась через криптовалютное сообщество. Многие проекты на основе концепции искусственного интеллекта привели к мифу о создании богатства на вторичном рынке. В то же время всё больше разработчиков начинают разрабатывать свои собственные проекты "ИИ+Крипто".
Однако при ближайшем рассмотрении можно заметить, что эти проекты демонстрируют сильную взаимозаменяемость, при этом большинство проектов сосредоточены только на улучшении «производственных отношений», таких как организация вычислительных мощностей через децентрализованные сети или создание «децентрализованного обнимающего лица» и так далее. Лишь немногие проекты пытаются по-настоящему интегрировать и внедрять инновации из базовой технологии. Мы считаем, что причина этого явления кроется в «доменном смещении» между сферами искусственного интеллекта и блокчейна. Несмотря на их обширное пересечение, мало кто по-настоящему понимает обе области. Например, разработчикам ИИ сложно понять техническую реализацию и историческое состояние инфраструктуры Ethereum, не говоря уже о том, чтобы предложить углубленные решения по оптимизации.
Возьмем машинное обучение (ML), самое основное направление искусственного интеллекта (AI), в качестве примера. Это технология, позволяющая машинам принимать решения на основе данных без явных программных инструкций. Машинное обучение показало огромный потенциал в анализе данных и распознавании образов и стало обычным явлением в Web 2. Однако из-за его первоначальных ограничений даже во главе инноваций технологии блокчейн, такой как Ethereum, его архитектура, сеть и механизмы управления пока не используют машинное обучение эффективно в качестве инструмента для решения сложных проблем.
«Великие инновации часто возникают из междисциплинарных областей». Цель написания этой статьи - помочь разработчикам искусственного интеллекта лучше понять мир блокчейна и предоставить новые идеи для разработчиков в сообществе Ethereum. В этой статье мы сначала представляем техническую реализацию Ethereum, а затем предлагаем решение применить машинное обучение, фундаментальный алгоритм искусственного интеллекта, к сети Ethereum для повышения ее безопасности, эффективности и масштабируемости. Мы надеемся, что этот случай послужит отправной точкой для представления некоторых различных точек зрения с рынка и стимулирует больше инновационных кросс-комбинаций «ИИ+блокчейн» в экосистеме разработчиков.
Базовая структура данных
Суть блокчейна заключается в цепи блоков, и ключ к различию цепей заключается в конфигурации цепи, являющейся существенной частью любого генезиса блокчейна. Для Ethereum конфигурация цепи используется для различения различных цепей в рамках Ethereum, идентифицируя важные протоколы обновлений и веховые события. Например, DAOForkBlock обозначает высоту хардфорка Ethereum после атаки на DAO, в то время как ConstantinopleBlock обозначает высоту блока для апгрейда Константинополя. Для крупных обновлений, содержащих многочисленные предложения по улучшению, устанавливаются специальные поля для идентификации соответствующих высот блоков. Кроме того, Ethereum включает различные тестовые сети и основную сеть, уникально идентифицируемые по ChainID для обозначения их собственных сетевых экосистем.
Генезис-блок служит нулевым блоком целого блокчейна, на который прямо или косвенно ссылаются другие блоки. Поэтому узлы должны загружать правильную информацию о генезис-блоке при инициализации, без допуска произвольных модификаций. Информация о конфигурации генезис-блока включает в себя вышеперечисленную конфигурацию цепочки, а также дополнительные данные, такие как соответствующие майнинговые награды, временные метки, сложность и газовые лимиты. Следует отметить, что консенсус-механизм Ethereum перешел с майнинга на доказательство доли.
Счета Ethereum делятся на внешние счета и контрактные счета. Внешние счета управляются уникальным закрытым ключом, в то время как контрактные счета не имеют управления закрытым ключом и могут быть оперированы только путем вызова исполнения кода контракта через внешние счета. Каждому счету соответствует листовой узел в мировом состоянии Ethereum, хранящий состояние счета (различная информация о счете и детали кода).
Транзакции: Как децентрализованная платформа в первую очередь для транзакций и контрактов, блоки Ethereum состоят из упакованных транзакций и дополнительной связанной информации. Блок делится на две части: заголовок блока и тело блока. Данные заголовка блока содержат доказательства, связывающие все блоки в цепь, включая хэш предыдущего блока и доказательства всего мирового состояния Ethereum, корень транзакций, корень квитанций и дополнительные данные, такие как сложность и номер. Тело блока хранит список транзакций и список заголовков дядь-блоков (поскольку Ethereum перешел на доказательство доли, ссылки на дядь-блоки больше не существуют).
Квитанции о сделках предоставляют результаты выполнения транзакции и дополнительную информацию, которую нельзя непосредственно получить, изучая саму транзакцию. В частности, они содержат содержимое согласования, информацию о транзакции и информацию о блоке, указывая, была ли успешной обработка транзакции и предоставляя журналы транзакций и детали расхода газа. Анализ информации в квитанциях помогает отлаживать код смарт-контракта и оптимизировать расход газа, обеспечивая при этом подтверждение того, что транзакция была обработана сетью, и позволяя просматривать результаты транзакции и их воздействие.
В Ethereum газовые сборы можно понять просто как комиссию за транзакцию. Когда вы отправляете токены, выполняете смарт-контракты, передаете Эфир или выполняете различные операции на блокчейне в определенном блоке, эти транзакции требуют газовых сборов. Вычислительные ресурсы Ethereum потребляются при обработке этих транзакций, и вам приходится платить газовые сборы, чтобы мотивировать сеть работать на вас. В конечном итоге газовые сборы выплачиваются в качестве комиссии за транзакцию майнерам, и специфическая формула расчета может быть понята как Сбор = Использованный газ * Цена газа, где цена за единицу газа устанавливается инициатором транзакции и часто определяет скорость включения транзакции в блоки. Установка слишком низкой цены за газ может привести к невыполнению транзакций, и также необходимо установить предел газа как верхнюю границу, чтобы избежать неожиданного расхода газа из-за ошибок в смарт-контрактах.
Торговый пул
В Ethereum существует большое количество транзакций, и по сравнению с централизованными системами пропускная способность децентрализованных систем в терминах транзакций в секунду значительно ниже. При входе большого количества транзакций в узлы им необходимо поддерживать пул транзакций для правильного управления ими. Распространение транзакций происходит через коммуникацию точка-точка. Конкретно, узел будет транслировать исполнимые транзакции своим соседним узлам, которые в свою очередь распространят транзакцию на свои соседние узлы, позволяя транзакции распространяться по всей сети Ethereum в пределах 6 секунд.
Транзакции в торговом пуле делятся на исполнимые транзакции и неисполнимые транзакции. Исполнимые транзакции, имеющие более высокий приоритет, выполняются и включаются в блоки, в то время как все транзакции, входящие в пул в начале, являются неисполнимыми и становятся исполнимыми позже. Исполнимые и неисполнимые транзакции записываются соответственно в контейнере ожидающих и контейнере очереди.
Кроме того, пул транзакций поддерживает список локальных транзакций. Локальные транзакции имеют различные преимущества, включая более высокий приоритет, иммунитет к ограничениям объема транзакций и немедленную загрузку обратно в пул транзакций при перезапуске узла. Локальное хранилище локальных транзакций достигается через журнал, обеспечивая сохранение незавершенных локальных транзакций и их периодическое обновление.
Перед тем, как транзакция будет поставлена в очередь, ее действительность проверяется, включая различные типы проверок, такие как предотвращение атак DOS, предотвращение отрицательных транзакций и проверку лимитов газа транзакции. Простое составление пула транзакций можно разделить на очередь + ожидающие (включая все транзакции). После завершения проверки действительности выполняются дополнительные проверки, включая проверку того, достигла ли очередь транзакций своего лимита, и определение, имеют ли удаленные транзакции (не местные транзакции) самую низкую цену в пуле транзакций, заменяя самую дешевую транзакцию в пуле. Для замены выполнимых транзакций разрешается заменить только те транзакции, у которых увеличение комиссии составляет не более 10% по сравнению с теми, которые ожидают выполнения, и замененные транзакции хранятся как невыполнимые транзакции. Кроме того, недействительные и превышающие лимит транзакции удаляются во время процесса обслуживания пула транзакций, а подходящие транзакции заменяются.
Механизм консенсуса
На ранних этапах теория консенсуса Ethereum была основана на методе вычисления хэш-значения сложности. Другими словами, для того чтобы блок считался действительным, необходимо было вычислить хэш-значение блока, соответствующее условию целевого значения сложности. Поскольку алгоритм консенсуса Ethereum перешел от Proof of Work (PoW) к Proof of Stake (PoS), я кратко опишу здесь алгоритм PoS. Ethereum завершил слияние цепочки маяка в сентябре 2022 года, реализовав алгоритм PoS. Конкретно, в основанной на PoS Ethereum стабильное время блока составляет 12 секунд. Пользователи ставят свои Ethereum, чтобы получить право стать валидаторами. Затем среди участвующих стейкеров проводится процесс случайного выбора для выбора набора валидаторов. В каждом раунде, который включает 32 слота, для каждого слота выбирается валидатор в качестве предлагающего, в то время как оставшиеся валидаторы в том же слоте служат комитетом для проверки законности предлагаемого блока и оценки законности блоков из предыдущего раунда. Алгоритм PoS значительно стабилизирует и ускоряет производство блоков, в значительной степени избегая потери вычислительных ресурсов.
Алгоритм подписи
Ethereum принимает тот же стандарт алгоритма подписи, что и Bitcoin, который использует кривую secp256k1. Конкретно, используется алгоритм подписи ECDSA, где подпись рассчитывается на основе хэша исходного сообщения. Подпись состоит из компонентов R+S+V. Каждое вычисление вводит случайное число, и R+S представляет собой исходный вывод ECDSA. Последнее поле V, известное как поле восстановления, указывает количество попыток, необходимых для успешного восстановления открытого ключа из содержимого и подписи, потому что поиск координат, которые удовлетворяют требованиям на основе значения R на эллиптической кривой, может иметь несколько решений.
Весь процесс можно кратко описать следующим образом: данные транзакции и соответствующая информация подписчика хешируются после кодирования с помощью RLP, а окончательная подпись получается подписью с использованием закрытого ключа через ECDSA. Кривая, используемая в ECDSA, - это эллиптическая кривая secp256k1. Наконец, подписанные данные транзакции объединяются с данными транзакции для получения подписанных данных транзакции, которые могут быть переданы в эфир.
Структура данных Ethereum не только зависит от традиционной технологии блокчейна, но также включает в себя дерево Меркля-Патриции (MPT), также известное как Мерклево Сжатое Префиксное Дерево, для эффективного хранения и верификации больших объемов данных. MPT объединяет криптографическую хэш-функцию дерева Меркля и функцию сжатия ключевого пути дерева Патриции, обеспечивая решение, которое гарантирует целостность данных и поддерживает быстрые поиски.
Дерево Меркла-Патриции (MPT)
В Ethereum MPT используется для хранения всех данных о состоянии и транзакциях, гарантируя, что любые изменения данных будут отражены в корневом хеше дерева. Это означает, что, проверив корневой хеш, можно доказать целостность и точность данных без проверки всей базы данных. MPT состоит из четырех типов узлов: листовые узлы, узлы расширения, узлы ветвей и пустые узлы, которые вместе образуют дерево, способное адаптироваться к динамическим изменениям данных. Всякий раз, когда данные обновляются, MPT отражает эти изменения, добавляя, удаляя или изменяя узлы, обновляя корневой хэш дерева. Поскольку каждый узел шифруется с помощью хеш-функции, любые незначительные изменения в данных приведут к значительным изменениям корневого хэша, обеспечивая безопасность и согласованность данных. Кроме того, конструкция MPT поддерживает проверку «легкого клиента», позволяя узлам проверять существование или статус конкретной информации, сохраняя только корневой хэш дерева и необходимые узлы пути, что значительно снижает потребность в хранении и обработке данных.
Через MPT Ethereum не только достигает эффективного управления и быстрого доступа к данным, но и обеспечивает безопасность и децентрализацию сети, поддерживая работу и развитие всей сети Ethereum.
State Machine
Основная архитектура Ethereum включает в себя концепцию конечного автомата, где виртуальная машина Ethereum (EVM) является средой выполнения для выполнения всего кода смарт-контрактов, и сам Ethereum можно рассматривать как глобальную общедоступную систему перехода состояний. Выполнение каждого блока можно рассматривать как процесс перехода состояний, переходящий от одного глобального общедоступного состояния к другому. Этот дизайн обеспечивает согласованность и децентрализацию сети Ethereum, делает результаты выполнения смарт-контрактов предсказуемыми и защищает их от вмешательства.
В Ethereum термин 'state' относится к текущей информации всех счетов, включая баланс каждого счета, хранимые данные и код смарт-контрактов. Каждый раз, когда происходит транзакция, EVM вычисляет и изменяет 'state' на основе содержания транзакции, и этот процесс эффективно и безопасно записывается через MPT. Каждое изменение состояния не только меняет данные счета, но также приводит к обновлению MPT, отраженному в изменении корневого хэша дерева.
Отношения между EVM и MPT критически важны, потому что MPT обеспечивает гарантию целостности данных для переходов состояния Ethereum. Когда EVM выполняет транзакции и изменяет состояния учетных записей, соответствующие узлы MPT обновляются для отражения этих изменений. Поскольку каждый узел MPT связан через хеши, любое изменение состояния вызовет изменение корневого хеша, который затем включается в новый блок, обеспечивая согласованность и безопасность всего состояния Ethereum. Теперь давайте познакомимся с Ethereum Virtual Machine (EVM).
EVM
Виртуальная машина Ethereum (EVM) является фундаментальным компонентом, ответственным за выполнение смарт-контрактов и облегчение переходов состояний в сети Ethereum. Благодаря EVM Ethereum можно представить как мировой компьютер. EVM является полностью универсальной, что означает, что смарт-контракты, развернутые на Ethereum, могут выполнять произвольно сложные логические вычисления. Введение механизма газа в Ethereum предотвращает сценарии, такие как бесконечные циклы в контрактах, обеспечивая стабильность и безопасность сети.
На более техническом уровне EVM - это стековая виртуальная машина, которая выполняет смарт-контракты с использованием специфического для Ethereum байткода. Разработчики обычно пишут смарт-контракты на высокоуровневых языках, таких как Solidity, которые затем компилируются в байткод, понятный EVM для выполнения. EVM - ключевое новшество блокчейна Ethereum, поддерживающее не только выполнение смарт-контрактов, но и обеспечивающее прочную основу для разработки децентрализованных приложений (DApps). Через EVM Ethereum формирует децентрализованное, безопасное и открытое цифровое будущее.
Рисунок 1 Исторический обзор Ethereum
Умные контракты - это компьютерные программы, работающие на блокчейне Ethereum. Они позволяют разработчикам создавать и развертывать различные приложения, включая, но не ограничиваясь, приложениями для кредитования, децентрализованными биржами, страхованием, вторичным финансированием, социальными сетями и NFT. Безопасность умных контрактов является критически важной для этих приложений. Эти приложения напрямую отвечают за обработку и управление криптовалютами, и любые уязвимости или злонамеренные атаки на умные контракты представляют прямую угрозу безопасности средств, что потенциально может привести к значительным экономическим потерям. Например, 26 февраля 2024 года протокол кредитования DeFi Blueberry Protocol подвергся атаке из-за ошибок логики умных контрактов, что привело к потере примерно 1 400 000 долларов.
Уязвимости смарт-контрактов имеют многоаспектный характер, охватывая неразумную бизнес-логику, неправильный контроль доступа, недостаточную проверку данных, атаки повторного входа и атаки DOS (отказ в обслуживании), среди других аспектов. Эти уязвимости могут вызвать проблемы с выполнением контракта, влияя на эффективную работу смарт-контрактов. Возьмем атаки DOS в качестве примера: этот тип атаки потребляет сетевые ресурсы путем отправки большого количества транзакций, что приводит к медленной обработке транзакций, инициированных обычными пользователями, что приводит к снижению пользовательского опыта. Кроме того, это также может привести к увеличению комиссий за газ для транзакций. Когда сетевые ресурсы ограничены, пользователям может потребоваться платить более высокие комиссии, чтобы приоритезировать обработку своих транзакций.
В дополнение к этому, пользователи Ethereum также сталкиваются с инвестиционными рисками, поскольку безопасность их средств находится под угрозой. Например, существуют «коврики», используемые для описания криптовалют, которые, как считается, не имеют практически никакой ценности или долгосрочного потенциала роста. Ковры часто используются в качестве инструментов для мошенничества или для стратегий накачки и сброса для манипулирования ценами. Инвестирование в ковры сопряжено с высокими инвестиционными рисками и может привести к значительным финансовым потерям. Из-за своей низкой цены и рыночной стоимости они уязвимы для манипуляций и волатильности. Эти токены часто используются для схем накачки и сброса и мошенничества с приманками, заманивая инвесторов фальшивыми проектами и крадя их средства. Еще один распространенный риск — когда создатели внезапно удаляют всю ликвидность из проекта, что приводит к резкому падению стоимости токена. Эти мошенничества часто включают в себя маркетинг через фальшивые партнерские отношения и одобрения. Как только цена токена растет, мошенники продают свои токены, исчезают, оставляя инвесторов с бесполезными токенами. Более того, инвестирование в ковры также отвлекает внимание и ресурсы от законных криптовалют с реальной полезностью и потенциалом роста. Помимо ковров, воздушные монеты и монеты финансовых пирамид также являются методами быстрого получения прибыли. Для пользователей, не обладающих профессиональными знаниями и опытом, отличить их от законных криптовалют особенно сложно.
Эффективность
Два очень прямых показателя эффективности Ethereum - скорость транзакций и газовые сборы. Скорость транзакций относится к количеству транзакций, которые сеть Ethereum может обработать за единицу времени. Этот показатель напрямую отражает производительность сети Ethereum; чем быстрее скорость, тем выше эффективность. Для каждой транзакции на Ethereum требуется определенное количество газовых сборов для компенсации майнерам за проверку транзакции. Более низкие газовые сборы указывают на более высокую эффективность в Ethereum.
Уменьшение скорости транзакций может привести к увеличению комиссий за газ. Обычно, когда скорость обработки транзакций снижается из-за ограниченного пространства блока, может возникнуть больше конкуренции за попадание транзакций в следующий блок. Чтобы выделиться в конкуренции, трейдеры обычно увеличивают комиссии за газ, поскольку майнеры часто отдают приоритет транзакциям с более высокими комиссиями за газ для верификации. Следовательно, более высокие комиссии за газ снижают удовлетворенность пользовательским опытом.
Транзакции - это всего лишь базовые действия на Ethereum. В этой экосистеме пользователи также могут заниматься различными видами деятельности, такими как кредитование, стейкинг, инвестирование, страхование и т. д. Это можно сделать через конкретные DApps. Однако, учитывая разнообразие DApps и отсутствие персонализированных рекомендательных сервисов, аналогичных традиционным отраслям, пользователи могут почувствовать себя смущенно при выборе подходящих приложений и продуктов. Эта ситуация может привести к снижению удовлетворенности пользователей, влияя на общую эффективность экосистемы Ethereum.
Возьмем в качестве примера кредитование. Некоторые платформы DeFi используют механизмы сверхзалога для обеспечения безопасности и стабильности своих платформ. Это означает, что заемщики должны предоставить больше активов в качестве залога, которые не могут быть использованы заемщиками для других деятельностей во время срока займа. Это приводит к снижению использования средств заемщика, тем самым уменьшая рыночную ликвидность.
Модели машинного обучения, такие как модель RMF, генеративно-состязательные сети (GAN), модель дерева принятия решений, алгоритм ближайших соседей K-Nearest Neighbors (KNN) и алгоритм кластеризации DBSCAN, играют важную роль в Ethereum. Применение этих моделей машинного обучения в Ethereum может помочь оптимизировать эффективность обработки транзакций, улучшить безопасность смарт-контрактов, достичь сегментации пользователей для предоставления более персонализированных услуг и способствовать поддержанию стабильности сети.
Алгоритмы машинного обучения - это набор инструкций или правил, используемых для анализа данных, изучения закономерностей в данных и принятия прогнозов или решений на основе этого обучения. Они автоматически учатся и улучшаются на основе предоставленных данных без необходимости явных программных инструкций от людей. Модели машинного обучения, такие как модель RMF, генеративно-состязательные сети (GAN), модель дерева решений, алгоритм ближайших соседей (KNN) и алгоритм кластеризации DBSCAN, играют важную роль в Ethereum. Применение этих моделей машинного обучения в Ethereum может помочь оптимизировать эффективность обработки транзакций, улучшить безопасность смарт-контрактов, достичь сегментации пользователей для предоставления более персонализированных услуг и способствовать поддержанию стабильности сети.
Классификатор Байеса эффективен в различных статистических методах классификации, нацеленных на минимизацию вероятности ошибок классификации или минимизацию среднего риска в рамках конкретных стоимостных структур. Его философия проектирования глубоко укоренена в теореме Байеса, что позволяет ему определять вероятность того, что объект принадлежит определенному классу при наличии определенных признаков, и делать решения, вычисляя апостериорную вероятность объекта.
В частности, байесовский классификатор сначала рассматривает априорную вероятность объекта, затем применяет байесовскую формулу для всестороннего рассмотрения наблюдаемых данных, тем самым обновляя убеждения относительно классификации объекта. Среди всех возможных классификаций байесовский классификатор выбирает класс с наивысшей апостериорной вероятностью и относит объект к этому классу. Основным преимуществом этого подхода является его способность естественно обрабатывать неопределенность и неполную информацию, что делает его мощным и гибким инструментом, применимым в широком диапазоне сценариев.
Рисунок 2: Байесовский классификатор
Как показано на рисунке 2, в контролируемом машинном обучении байесовский классификатор использует данные и вероятностную модель, основанную на теореме Байеса, для принятия решений о классификации. Учитывая вероятность, априорные вероятности классов и признаков, байесовский классификатор вычисляет апостериорную вероятность принадлежности точек данных к каждому классу и присваивает точки данных классу с наибольшей апостериорной вероятностью. На разбросном графике справа классификатор пытается найти кривую, разделяющую точки разных цветов, тем самым минимизируя ошибки классификации.
Алгоритм дерева решений часто используется в задачах классификации и регрессии. Он принимает иерархический подход к принятию решений, разделяя деревья на основе признаков с более высокими показателями прироста информации из известных данных, чтобы обучить деревья решений. По сути, весь алгоритм может автономно изучать правила принятия решений из данных для определения значений переменных. При реализации дерево решений может декомпозировать сложные процессы принятия решений на несколько простых подпроцессов, формируя структуру похожую на дерево.
Как показано на рисунке 3, каждый узел представляет собой решение, с критериями для оценки определенных атрибутов, в то время как ветви представляют результаты принятия решения. Каждый листовой узел представляет собой окончательный прогнозируемый результат и категорию. С точки зрения состава алгоритма, модели деревьев решений интуитивны, легко понимаются и обладают сильной интерпретируемостью.
Изображение 3: Модель дерева принятия решений
DBSCAN (Density-Based Spatial Clustering of Applications with Noise) - это алгоритм плотностной пространственной кластеризации, который обрабатывает шум и оказывается особенно эффективным для несвязанных наборов данных. Этот алгоритм может обнаруживать кластеры произвольных форм без необходимости заранее указывать количество кластеров, и он проявляет хорошую устойчивость к выбросам в наборе данных. Кроме того, алгоритм может эффективно идентифицировать выбросы в наборах данных с шумом, где шум или выбросы определяются как точки в областях низкой плотности, как показано на рисунке 4.
Изображение 4: Алгоритм DBSCAN идентифицирует шум
Алгоритм KNN (K-ближайших соседей) можно использовать как для классификационных, так и для регрессионных задач. В задачах классификации алгоритм определяет категорию элемента для классификации на основе механизма голосования, а в задачах регрессии он вычисляет среднее или взвешенное среднее значений k ближайших образцов для прогнозирования.
Как показано на рисунке 5, принцип работы алгоритма KNN в классификации заключается в том, чтобы найти K ближайших соседей новой точки данных, а затем предсказать категорию новой точки данных на основе категорий этих соседей. Если K=1, то новая точка данных просто присваивается категории ее ближайшего соседа. Если K>1, то обычно используется метод голосования для определения категории новой точки данных, что означает, что она будет присвоена категории, к которой принадлежит большинство ее соседей. Когда алгоритм KNN используется для задач регрессии, основная идея та же самая, но результатом является среднее значение выходных значений K ближайших соседей.
Рис. 5: Алгоритм KNN, используемый для классификации
Генеративный ИИ - это технология ИИ, которая может создавать новый контент (такой как текст, изображения, музыка и т. д.) на основе входных требований. Он укоренен в достижениях машинного обучения и глубокого обучения, особенно в областях обработки естественного языка и распознавания изображений. Генеративный ИИ изучает шаблоны и корреляции из большого объема данных, а затем создает совершенно новый вывод на основе этой полученной информации. Ключ к генеративному ИИ заключается в обучении модели, которое требует отличных данных для обучения. Во время этого процесса модель постепенно улучшает свою способность генерировать новый контент, анализируя и понимая структуру, шаблоны и отношения в наборе данных.
Как показано на рисунке 6, введение механизмов многоголового внимания и самовнимания, вместе с остаточными соединениями и полностью связанными нейронными сетями, в сочетании с предыдущими техниками эмбеддинга слов, значительно улучшило производительность генеративных моделей, связанных с обработкой естественного языка.
Фигура 6 Модель трансформатора
Модель RFM - это аналитическая модель, основанная на поведении пользователей при покупках, которая может выявить сегменты пользователей разной ценности путем анализа их транзакционного поведения. Эта модель стратифицирует пользователей на основе их Недавности (R), Частоты (F) и Денежной стоимости (M) покупок. Как показано на рисунке 7, эти три показателя совместно формируют основу модели RFM. Модель оценивает пользователей по этим трем измерениям и ранжирует их по их баллам, чтобы выявить наиболее ценные сегменты пользователей. Более того, модель эффективно сегментирует клиентов на разные группы для достижения функционала стратификации пользователей.
Рисунок 7 Многоуровневая модель RFM
При решении проблем безопасности Ethereum с использованием техник машинного обучения мы провели исследование в четырех основных областях:
Идентификация и фильтрация злонамеренных транзакций на основе байесовского классификатора
Путем построения Байесовского классификатора можно идентифицировать и отфильтровать потенциальные спам-транзакции, включая, но не ограничиваясь, те, которые вызывают атаки DOS через масштабные, частые, мелкие транзакции. Такой подход эффективно поддерживает здоровье сети путем анализа характеристик транзакций, таких как цены на газ и частота транзакций, обеспечивая стабильную работу сети Ethereum.
Генеративно-состязательные сети (GAN) и генеративные сети на основе трансформаторов могут быть использованы для генерации кода смарт-контрактов, который соответствует определенным требованиям и обеспечивает безопасность кода настолько, насколько это возможно. Однако существуют различия в типах данных, на которых они опираются в процессе обучения; первые в основном опираются на небезопасные образцы кода, в то время как последние - наоборот.
Обучая генеративно-состязательные сети (GAN) для изучения существующих безопасных шаблонов контрактов и создания самоадверсарных моделей для генерации потенциально небезопасного кода, а затем изучая эти уязвимости, можно автоматически генерировать высококачественный, более безопасный код умных контрактов. Используя модели генеративных сетей на основе трансформера, путем обучения на большом количестве примеров безопасных контрактов можно генерировать код контрактов, который соответствует конкретным требованиям и оптимизирует расход газа, тем самым значительно повышая эффективность и безопасность разработки умных контрактов.
Анализ рисков смарт-контрактов на основе деревьев решений
Использование деревьев принятия решений для анализа функций смарт-контрактов, таких как частота вызовов функций, стоимость транзакции, сложность исходного кода и т. д., может эффективно выявлять потенциальные уровни риска контрактов. Анализируя шаблоны работы контрактов и структуры кода, можно предсказать возможные уязвимости и точки риска, предоставляя разработчикам и пользователям оценку безопасности. Ожидается, что этот метод значительно улучшит безопасность смарт-контрактов в экосистеме Ethereum, тем самым уменьшив убытки, вызванные уязвимостями или злонамеренным кодом.
Построение модели оценки криптовалют для снижения инвестиционных рисков
Анализируя данные о криптовалютных транзакциях, активности в социальных сетях, рыночную производительность и другую многомерную информацию с использованием алгоритмов машинного обучения, можно построить модель оценки, которая предсказывает вероятность появления мусорных монет. Эта модель может предоставить ценные ссылки для инвесторов, помогая избежать инвестиционных рисков и способствовать здоровому развитию рынка криптовалют.
Кроме того, применение машинного обучения имеет потенциал дополнительно улучшить эффективность Ethereum. Мы можем углубиться в следующие три ключевых измерения:
Оптимизация приложения дерева решений моделей очереди пула транзакций
На основе деревьев принятия решений можно эффективно оптимизировать механизм очередей пулов транзакций Ethereum. Анализируя характеристики транзакций, такие как цены на газ и размеры транзакций, деревья принятия решений могут оптимизировать выбор транзакций и порядок их постановки в очередь. Этот метод может значительно улучшить эффективность обработки транзакций, эффективно снизить сетевую перегрузку и сократить время ожидания пользователей транзакций.
Стратификация пользователей и предоставление персонализированных услуг
Модель RFM (Recency, Frequency, Monetary value), широко используемая в качестве аналитического инструмента в управлении взаимоотношениями с клиентами, может эффективно стратифицировать пользователей, оценивая свежесть последней транзакции пользователя, частоту транзакций и их объем. Применение модели RFM на платформе Ethereum может помочь выявить группы пользователей с высокой ценностью, оптимизировать выделение ресурсов и предоставлять более персонализированные услуги, тем самым повышая удовлетворенность пользователей и общую эффективность платформы.
Алгоритм DBSCAN также может анализировать поведение пользователей при транзакциях, помогая идентифицировать различные группы пользователей на Ethereum и предоставлять более индивидуализированные финансовые услуги различным пользователям. Эта стратегия стратификации пользователей может оптимизировать маркетинговые стратегии и улучшить удовлетворенность клиентов и эффективность обслуживания.
Кредитный скоринг на основе KNN
Алгоритм k-ближайших соседей (KNN) может анализировать историю транзакций пользователей Ethereum и шаблоны поведения для оценки кредитоспособности пользователей, что играет чрезвычайно важную роль в финансовых деятельностях, таких как кредитование. Кредитный скоринг помогает финансовым учреждениям и платформам кредитования более точно оценивать способность заемщиков к возврату и кредитный риск, тем самым делая более точные кредитные решения. Это может избежать перекредитования и улучшить ликвидность рынка.
С точки зрения макроуровня аллокации фондов, Эфириум, как самый большой в мире распределенный компьютер, не может иметь слишком много инвестиций в свой инфраструктурный уровень. Ему необходимо привлекать больше разработчиков из различных сред с целью участия в совместном строительстве. В этой статье, рассматривая технические реализации Эфириума и стоящие перед ним вызовы, мы представляем серию интуитивно понятных потенциальных применений машинного обучения. Мы также с нетерпением ждем, когда разработчики искусственного интеллекта из сообщества воплотят эти видения в конкретную ценность.
По мере увеличения вычислительной мощности on-chain мы можем предвидеть разработку более сложных моделей управления сетью, мониторинга транзакций, проверки безопасности и других аспектов, что в конечном итоге повысит эффективность и безопасность сети Ethereum.
Ещё дальнейшие перспективы, механизмы управления ИИ/агентами также могут стать ключевой точкой инноваций в экосистеме Ethereum. Такие механизмы принесут более эффективные, прозрачные и автоматизированные процессы принятия решений, что приведет к более гибкой и надежной структуре управления для платформы Ethereum. Эти будущие направления будут не только способствовать инновациям в технологии Ethereum, но и обеспечивать пользователям более качественный ончейн-опыт.