Два дослідження, з різних точок зору, спрямовані до однієї й тієї ж проблеми — що таке concept?
Уявімо, що мова існує у двовимірній системі координат. Вісь X — це часовий вимір, слова організовуються у речення, рухаючись у часі. Вісь Y — це смисловий вимір, і саме через нього ми обираємо одне слово замість іншого, керуючись значенням.
Останні результати серії досліджень SAEs дуже цікаві: вони розкривають, як працює нейронна мережа по осі Y — модель навчається витягувати та виражати концептуальні ознаки з чітким смислом. Іншими словами, у процесі обчислень у моделі існують певні "вузли", які не є випадковими нейронними активаціями, а мають конкретне значення — концептуальне вираження. Це означає, що значення у внутрішній структурі глибокої навчальної моделі можна розкладати і спостерігати.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
14 лайків
Нагородити
14
4
Репост
Поділіться
Прокоментувати
0/400
NotFinancialAdviser
· 6год тому
哎呀,SAE ця штука справді збила мене з пантелику, здається, нарешті хтось розкрив чорний ящик
Значення можна спостерігати? Якщо так, то наше розуміння AI одразу підвищується у рівні
Концепція "вузлів" всередині моделі... звучить трохи так, ніби зробили МРТ-сканування нейронної мережі, досить фантастично
Нарешті хтось серйозно досліджує сутність концепту, раніше всі гадали на кавовій гущі
Порівняння з двовимірною координатою класне, але чи не занадто спрощено, здається, реальна ситуація набагато складніша
Якщо вузли можна розкладати і спостерігати, то що робити, якщо з’являться зловмисні вузли, потрібно вирішити проблему прозорості всієї системи
Переглянути оригіналвідповісти на0
SocialFiQueen
· 6год тому
哇靠,SAE ця система дійсно починає розкривати чорний ящик? Значення можна розбити і спостерігати... Це просто накладає пояснювальну структуру на AI.
Переглянути оригіналвідповісти на0
LuckyBlindCat
· 6год тому
哇靠,SAE ця штука дійсно поступово розкриває чорний ящик моделі, концепти навіть можна розкласти і спостерігати... Це ж наче встановлює для ШІ "мікроскоп" для значень.
Переглянути оригіналвідповісти на0
DaoTherapy
· 6год тому
О, ця тема SAE стає дедалі цікавішою, і я відчуваю, що нарешті досяг межі розуміння значення ШІ
Чи справді існує концептуальний вузол у нейронній мережі? Отже, чи варто нам переосмислити шлях до AGI?
Аналогія з оссю Y хороша, але мені все одно цікаво, чи ці вузли справді стабільні? Чи може це бути ілюзією?
Чекаючи на більше експериментальних даних, я відчуваю, що зможу перевернути багато когнітивних функцій
Тепер ви можете точніше маніпулювати поведінкою моделі, що одночасно захоплює і трохи моторошно
Два дослідження, з різних точок зору, спрямовані до однієї й тієї ж проблеми — що таке concept?
Уявімо, що мова існує у двовимірній системі координат. Вісь X — це часовий вимір, слова організовуються у речення, рухаючись у часі. Вісь Y — це смисловий вимір, і саме через нього ми обираємо одне слово замість іншого, керуючись значенням.
Останні результати серії досліджень SAEs дуже цікаві: вони розкривають, як працює нейронна мережа по осі Y — модель навчається витягувати та виражати концептуальні ознаки з чітким смислом. Іншими словами, у процесі обчислень у моделі існують певні "вузли", які не є випадковими нейронними активаціями, а мають конкретне значення — концептуальне вираження. Це означає, що значення у внутрішній структурі глибокої навчальної моделі можна розкладати і спостерігати.