2026-01-12 08:28:13

Бенчмаркинг по сути сводится к тому, что ценности превращаются в код.

Все наши ожидания и страхи относительно ИИ жестко встраиваются в те вещи, которые могут выставлять оценки — что считать прогрессом, чему стоит бояться, что нужно оптимизировать, — и в конце концов приходится притворяться, что эти вещи действительно можно точно измерить. Проблема в том, что некоторые вещи изначально измерить невозможно. За выбранными показателями часто скрываются предположения разработчиков. То, какие показатели вы выбрали, равно как и определение того, каким должен быть ИИ, — это и есть ваше представление о его будущем. А наоборот, то, что не было выбрано, возможно, и есть самое важное.

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .

11 Лайков

Награда
11
9
Репост
Поделиться

комментарий

0/400

Rekt_Recovery

· 5ч назад

нет, это ощущается по-другому... напоминает мне тот момент, когда меня ликвидировали из-за погоні за метрикой, которая выглядела хорошо на бумаге. оказывается, оптимизация под неправильный сигнал — это как взорваться. 🚨

Посмотреть ОригиналОтветить0

SignatureLiquidator

· 22ч назад

Индикаторы — это всего лишь уловки, выбираешь что видишь, а то, что скрыто, — вот что действительно страшно

Посмотреть ОригиналОтветить0

EternalMiner

· 23ч назад

Говоря правильно, показатели — это именно власть

Посмотреть ОригиналОтветить0

PanicSeller

· 23ч назад

Базовая — это игра в власть и дискурс, кто устанавливает показатели, тот и побеждает

Посмотреть ОригиналОтветить0

GateUser-7b078580

· 23ч назад

Данные показывают, что сама система оценки несправедлива, хотя, конечно, кто определил выбранные показатели? Майнеры получают слишком много, и бенчмарки тоже.

Посмотреть ОригиналОтветить0

ChainBrain

· 01-12 08:45

Черт, вот почему все эти рейтинги — полная ерунда

Посмотреть ОригиналОтветить0

MetaMisery

· 01-12 08:35

Это и есть правда, тот, кто устанавливает показатели, тот и контролирует речь.

Посмотреть ОригиналОтветить0

TokenTherapist

· 01-12 08:30

嗯…基准测试就是把谁的价值观给代码化了，这才是问题所在吧 --- 真的，那些没被选进指标的东西才恐怖 --- 所以说白了就是设计者在用数字玩权力游戏 --- 量化本身就是一种筛选，说得太绝了哈哈 --- 指标一旦定下来就变成了自我实现的预言 --- 每次看benchmark我都想问：谁说这些东西该被量的 --- 最离谱的就是假装精确量化能解决价值观问题

Ответить0

TopBuyerBottomSeller