2026-01-03 00:22:31

Два дослідження, з різних точок зору, спрямовані до однієї й тієї ж проблеми — що таке concept?

Уявімо, що мова існує у двовимірній системі координат. Вісь X — це часовий вимір, слова організовуються у речення, рухаючись у часі. Вісь Y — це смисловий вимір, і саме через нього ми обираємо одне слово замість іншого, керуючись значенням.

Останні результати серії досліджень SAEs дуже цікаві: вони розкривають, як працює нейронна мережа по осі Y — модель навчається витягувати та виражати концептуальні ознаки з чітким смислом. Іншими словами, у процесі обчислень у моделі існують певні "вузли", які не є випадковими нейронними активаціями, а мають конкретне значення — концептуальне вираження. Це означає, що значення у внутрішній структурі глибокої навчальної моделі можна розкладати і спостерігати.

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

14 лайків

Нагородити
14
4
Репост
Поділіться

Прокоментувати

0/400

NotFinancialAdviser

· 6год тому

哎呀，SAE ця штука справді збила мене з пантелику, здається, нарешті хтось розкрив чорний ящик Значення можна спостерігати? Якщо так, то наше розуміння AI одразу підвищується у рівні Концепція "вузлів" всередині моделі... звучить трохи так, ніби зробили МРТ-сканування нейронної мережі, досить фантастично Нарешті хтось серйозно досліджує сутність концепту, раніше всі гадали на кавовій гущі Порівняння з двовимірною координатою класне, але чи не занадто спрощено, здається, реальна ситуація набагато складніша Якщо вузли можна розкладати і спостерігати, то що робити, якщо з’являться зловмисні вузли, потрібно вирішити проблему прозорості всієї системи

Переглянути оригіналвідповісти на0

SocialFiQueen

· 6год тому

哇靠，SAE ця система дійсно починає розкривати чорний ящик? Значення можна розбити і спостерігати... Це просто накладає пояснювальну структуру на AI.

Переглянути оригіналвідповісти на0

LuckyBlindCat

· 6год тому

哇靠，SAE ця штука дійсно поступово розкриває чорний ящик моделі, концепти навіть можна розкласти і спостерігати... Це ж наче встановлює для ШІ "мікроскоп" для значень.

Переглянути оригіналвідповісти на0

DaoTherapy

· 6год тому

О, ця тема SAE стає дедалі цікавішою, і я відчуваю, що нарешті досяг межі розуміння значення ШІ Чи справді існує концептуальний вузол у нейронній мережі? Отже, чи варто нам переосмислити шлях до AGI? Аналогія з оссю Y хороша, але мені все одно цікаво, чи ці вузли справді стабільні? Чи може це бути ілюзією? Чекаючи на більше експериментальних даних, я відчуваю, що зможу перевернути багато когнітивних функцій Тепер ви можете точніше маніпулювати поведінкою моделі, що одночасно захоплює і трохи моторошно

Переглянути оригіналвідповісти на0