Два дослідження, з різних точок зору, спрямовані до однієї й тієї ж проблеми — що таке concept?



Уявімо, що мова існує у двовимірній системі координат. Вісь X — це часовий вимір, слова організовуються у речення, рухаючись у часі. Вісь Y — це смисловий вимір, і саме через нього ми обираємо одне слово замість іншого, керуючись значенням.

Останні результати серії досліджень SAEs дуже цікаві: вони розкривають, як працює нейронна мережа по осі Y — модель навчається витягувати та виражати концептуальні ознаки з чітким смислом. Іншими словами, у процесі обчислень у моделі існують певні "вузли", які не є випадковими нейронними активаціями, а мають конкретне значення — концептуальне вираження. Це означає, що значення у внутрішній структурі глибокої навчальної моделі можна розкладати і спостерігати.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 4
  • Репост
  • Поділіться
Прокоментувати
0/400
NotFinancialAdviservip
· 6год тому
哎呀,SAE ця штука справді збила мене з пантелику, здається, нарешті хтось розкрив чорний ящик Значення можна спостерігати? Якщо так, то наше розуміння AI одразу підвищується у рівні Концепція "вузлів" всередині моделі... звучить трохи так, ніби зробили МРТ-сканування нейронної мережі, досить фантастично Нарешті хтось серйозно досліджує сутність концепту, раніше всі гадали на кавовій гущі Порівняння з двовимірною координатою класне, але чи не занадто спрощено, здається, реальна ситуація набагато складніша Якщо вузли можна розкладати і спостерігати, то що робити, якщо з’являться зловмисні вузли, потрібно вирішити проблему прозорості всієї системи
Переглянути оригіналвідповісти на0
SocialFiQueenvip
· 6год тому
哇靠,SAE ця система дійсно починає розкривати чорний ящик? Значення можна розбити і спостерігати... Це просто накладає пояснювальну структуру на AI.
Переглянути оригіналвідповісти на0
LuckyBlindCatvip
· 6год тому
哇靠,SAE ця штука дійсно поступово розкриває чорний ящик моделі, концепти навіть можна розкласти і спостерігати... Це ж наче встановлює для ШІ "мікроскоп" для значень.
Переглянути оригіналвідповісти на0
DaoTherapyvip
· 6год тому
О, ця тема SAE стає дедалі цікавішою, і я відчуваю, що нарешті досяг межі розуміння значення ШІ Чи справді існує концептуальний вузол у нейронній мережі? Отже, чи варто нам переосмислити шлях до AGI? Аналогія з оссю Y хороша, але мені все одно цікаво, чи ці вузли справді стабільні? Чи може це бути ілюзією? Чекаючи на більше експериментальних даних, я відчуваю, що зможу перевернути багато когнітивних функцій Тепер ви можете точніше маніпулювати поведінкою моделі, що одночасно захоплює і трохи моторошно
Переглянути оригіналвідповісти на0
  • Закріпити