В настоящее время обучение ИИ сталкивается с ключевой проблемой: источники данных наполнены низкокачественным контентом — большим количеством скопированных и вставленных мнений, а также мусорной информацией, которая называется «дешевыми данными» и постепенно усиливает шум в процессе обучения.



На этом фоне стоит обратить внимание на идею проекта в виртуальной экосистеме: они пытаются создать сеть данных для обучения ИИ, основанную на механизмах принудительного соблюдения конфиденциальности. Этот подход довольно интересен — с помощью уровня защиты конфиденциальности можно отбирать и оптимизировать качество данных, что, возможно, поможет решить текущие проблемы с данными для обучения ИИ.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 4
  • Репост
  • Поделиться
комментарий
0/400
SatoshiSherpavip
· 12ч назад
Искусственный интеллект, созданный на основе мусорных данных, так себе. Только сейчас понял, что проблема есть, а уже поздно. Механизм конфиденциальности + фильтрация данных — эта идея в целом неплохая, но трудно сказать, сможет ли она действительно остановить жадность капитала при реализации. Эти два вопроса по сути противоречат друг другу: и защита конфиденциальности, и масштабное обучение... В хороших выражениях это называется оптимизацией, а в плохих — просто перерасход денег и повторный запуск. Может ли идея биткоина решить эту проблему? Есть сомнения. Но всё равно лучше, чем нынешний хаос, по крайней мере, кто-то пытается
Посмотреть ОригиналОтветить0
GasFeeWhisperervip
· 12ч назад
垃圾进垃圾出,这事儿早该有人管管了 --- 隐私层筛数据?听起来像是在垃圾堆里淘金,不过值得看看 --- 又是一个解决数据噪音的方案,咋感觉每个月都有人吹这个概念 --- 真正的问题不在隐私,在于没人想为高质量数据付钱 --- 所以就是加密版的数据清洗?行吧我看看白皮书再说 --- 这思路行不行得通关键还是能不能吸引优质创作者,否则还是一堆复制粘贴 --- web3做数据治理听着不错,就怕又成了炒作题材
Ответить0
LiquidityOraclevip
· 12ч назад
Данные мусорной свалки действительно становятся все более мощными, неудивительно, что сейчас вывод AI тоже все более заторможен... Идея использовать слой приватности для фильтрации данных действительно стоит обдумать --- И приватность, и качество данных — звучит очень хорошо, только боюсь, что в итоге все останется старым добрым старым вином в новой бутылке --- Много болтовни, главное — сможет ли эта система действительно отсеять те мусорные копипасты, вот в чем вопрос --- Э? Использовать защиту приватности для оптимизации данных? Наоборот, это увеличит затраты, стоит ли экономия того, чтобы это было оправдано --- Этот подход немного интересен, но кажется, многие проекты говорят, что могут решить проблему данных, а на деле --- Мусорные данные кормят AI, AI превращается в мусор... Это судьба? --- Подождите, почему кажется, что защита приватности и оптимизация данных как будто конфликтуют друг с другом? --- Давно известно, что данные — это узкое место, остается только посмотреть, кто действительно сможет решить эту проблему
Посмотреть ОригиналОтветить0
Degen4Breakfastvip
· 12ч назад
嗯就是爆料垃圾数据喂AI这事儿啊...早该有人管管了,现在到处都是复制粘贴的屎 隐私层来把关?这思路可以,就看真的能不能挡住那些低质量玩意儿 说白了还是数据质量差,再聪明的模型也救不了啊 好奇这项目具体咋操作的,如果真能提纯数据质量那可有搞头 ai训练就这么个死循环,garbage in garbage out,得有人站出来改这局面 这套机制能work吗?感觉听起来容易实现难啊... 说得对啊,现在的AI就是被喂太多废料了,隐私机制当过滤网?有意思
Ответить0
  • Закрепить