Бенчмаркинг по сути сводится к тому, что ценности превращаются в код.



Все наши ожидания и страхи относительно ИИ жестко встраиваются в те вещи, которые могут выставлять оценки — что считать прогрессом, чему стоит бояться, что нужно оптимизировать, — и в конце концов приходится притворяться, что эти вещи действительно можно точно измерить. Проблема в том, что некоторые вещи изначально измерить невозможно. За выбранными показателями часто скрываются предположения разработчиков. То, какие показатели вы выбрали, равно как и определение того, каким должен быть ИИ, — это и есть ваше представление о его будущем. А наоборот, то, что не было выбрано, возможно, и есть самое важное.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 9
  • Репост
  • Поделиться
комментарий
0/400
Rekt_Recoveryvip
· 5ч назад
нет, это ощущается по-другому... напоминает мне тот момент, когда меня ликвидировали из-за погоні за метрикой, которая выглядела хорошо на бумаге. оказывается, оптимизация под неправильный сигнал — это как взорваться. 🚨
Посмотреть ОригиналОтветить0
SignatureLiquidatorvip
· 22ч назад
Индикаторы — это всего лишь уловки, выбираешь что видишь, а то, что скрыто, — вот что действительно страшно
Посмотреть ОригиналОтветить0
EternalMinervip
· 23ч назад
Говоря правильно, показатели — это именно власть
Посмотреть ОригиналОтветить0
PanicSellervip
· 23ч назад
Базовая — это игра в власть и дискурс, кто устанавливает показатели, тот и побеждает
Посмотреть ОригиналОтветить0
GateUser-7b078580vip
· 23ч назад
Данные показывают, что сама система оценки несправедлива, хотя, конечно, кто определил выбранные показатели? Майнеры получают слишком много, и бенчмарки тоже.
Посмотреть ОригиналОтветить0
ChainBrainvip
· 01-12 08:45
Черт, вот почему все эти рейтинги — полная ерунда
Посмотреть ОригиналОтветить0
MetaMiseryvip
· 01-12 08:35
Это и есть правда, тот, кто устанавливает показатели, тот и контролирует речь.
Посмотреть ОригиналОтветить0
TokenTherapistvip
· 01-12 08:30
嗯…基准测试就是把谁的价值观给代码化了,这才是问题所在吧 --- 真的,那些没被选进指标的东西才恐怖 --- 所以说白了就是设计者在用数字玩权力游戏 --- 量化本身就是一种筛选,说得太绝了哈哈 --- 指标一旦定下来就变成了自我实现的预言 --- 每次看benchmark我都想问:谁说这些东西该被量的 --- 最离谱的就是假装精确量化能解决价值观问题
Ответить0
TopBuyerBottomSellervip
· 01-12 08:28
Вот почему эти рейтинги — полная чепуха, если правильно выбрать показатели, игра выиграна
Посмотреть ОригиналОтветить0
Подробнее
  • Закрепить