В настоящее время обучение ИИ сталкивается с ключевой проблемой: источники данных наполнены низкокачественным контентом — большим количеством скопированных и вставленных мнений, а также мусорной информацией, которая называется «дешевыми данными» и постепенно усиливает шум в процессе обучения.
На этом фоне стоит обратить внимание на идею проекта в виртуальной экосистеме: они пытаются создать сеть данных для обучения ИИ, основанную на механизмах принудительного соблюдения конфиденциальности. Этот подход довольно интересен — с помощью уровня защиты конфиденциальности можно отбирать и оптимизировать качество данных, что, возможно, поможет решить текущие проблемы с данными для обучения ИИ.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
13 Лайков
Награда
13
4
Репост
Поделиться
комментарий
0/400
SatoshiSherpa
· 12ч назад
Искусственный интеллект, созданный на основе мусорных данных, так себе. Только сейчас понял, что проблема есть, а уже поздно.
Механизм конфиденциальности + фильтрация данных — эта идея в целом неплохая, но трудно сказать, сможет ли она действительно остановить жадность капитала при реализации.
Эти два вопроса по сути противоречат друг другу: и защита конфиденциальности, и масштабное обучение...
В хороших выражениях это называется оптимизацией, а в плохих — просто перерасход денег и повторный запуск.
Может ли идея биткоина решить эту проблему? Есть сомнения.
Но всё равно лучше, чем нынешний хаос, по крайней мере, кто-то пытается
Данные мусорной свалки действительно становятся все более мощными, неудивительно, что сейчас вывод AI тоже все более заторможен... Идея использовать слой приватности для фильтрации данных действительно стоит обдумать
---
И приватность, и качество данных — звучит очень хорошо, только боюсь, что в итоге все останется старым добрым старым вином в новой бутылке
---
Много болтовни, главное — сможет ли эта система действительно отсеять те мусорные копипасты, вот в чем вопрос
---
Э? Использовать защиту приватности для оптимизации данных? Наоборот, это увеличит затраты, стоит ли экономия того, чтобы это было оправдано
---
Этот подход немного интересен, но кажется, многие проекты говорят, что могут решить проблему данных, а на деле
---
Мусорные данные кормят AI, AI превращается в мусор... Это судьба?
---
Подождите, почему кажется, что защита приватности и оптимизация данных как будто конфликтуют друг с другом?
---
Давно известно, что данные — это узкое место, остается только посмотреть, кто действительно сможет решить эту проблему
Посмотреть ОригиналОтветить0
Degen4Breakfast
· 12ч назад
嗯就是爆料垃圾数据喂AI这事儿啊...早该有人管管了,现在到处都是复制粘贴的屎
隐私层来把关?这思路可以,就看真的能不能挡住那些低质量玩意儿
说白了还是数据质量差,再聪明的模型也救不了啊
好奇这项目具体咋操作的,如果真能提纯数据质量那可有搞头
ai训练就这么个死循环,garbage in garbage out,得有人站出来改这局面
这套机制能work吗?感觉听起来容易实现难啊...
说得对啊,现在的AI就是被喂太多废料了,隐私机制当过滤网?有意思
В настоящее время обучение ИИ сталкивается с ключевой проблемой: источники данных наполнены низкокачественным контентом — большим количеством скопированных и вставленных мнений, а также мусорной информацией, которая называется «дешевыми данными» и постепенно усиливает шум в процессе обучения.
На этом фоне стоит обратить внимание на идею проекта в виртуальной экосистеме: они пытаются создать сеть данных для обучения ИИ, основанную на механизмах принудительного соблюдения конфиденциальности. Этот подход довольно интересен — с помощью уровня защиты конфиденциальности можно отбирать и оптимизировать качество данных, что, возможно, поможет решить текущие проблемы с данными для обучения ИИ.