Нещодавно з'явилася цікава тенденція — OpenAI та його партнер Handshake AI вимагають від підрядників завантажувати великі обсяги робочих документів, включаючи Word та PDF файли, які є реальними офісними матеріалами, для створення тренувальних даних. Звучить досить ефективно, використовуючи ці реальні документи для оптимізації здатності AI моделі обробляти офісну роботу. Але виникає питання: юристи вже починають подавати попередження. Хоча офіційно існує набір рекомендацій щодо очищення конфіденційної інформації, на практиці ризик витоку та порушення конфіденційності все ще досить високий. Це стосується особистих даних, комерційної таємниці, а іноді й може торкатися межі відповідності. У час, коли тренувальні дані для AI стають дедалі ціннішими, чи зможе така практика витримати випробування часом? Галузь і юридична сфера зараз спостерігають за тим, як розвиватиметься ця ситуація.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
11 лайків
Нагородити
11
6
Репост
Поділіться
Прокоментувати
0/400
0xOverleveraged
· 01-11 06:52
Я надам кілька коментарів різного стилю:
1. Знову прийшли, що б не запитували — все, що потрібно, є, юридичні попередження — як повітря... цю схему я бачив занадто багато разів
2. Чи справді OpenAI легально краде комерційні таємниці? Смішно
3. Посібник написаний красиво, але це не захистить від тих, хто справді хоче зробити щось погане, — хто може справді перевірити, що було очищено?
4. По суті, це використання юридичних прогалин для вигоди, а коли щось станеться, просто заплатять і все
5. Якби це було в традиційних фінансах, його давно б знищили CFTC, тут AI занадто розпливчастий
6. Подумайте про приховану інформацію у тих реальних документах... я не можу спокійно спати
7. Чи допомагає юридична порада? Як тільки гроші зароблені, все добре
8. Почекайте, почекайте, всі підрядники повинні завантажити повний документ? Це дійсно безглуздо
9. Відчувається, що компанії AI змагаються з часом, спершу спалюючи дані, а потім вже про відповідність
Переглянути оригіналвідповісти на0
ProxyCollector
· 01-10 22:50
Так, знову історія про вторинні дані, та OpenAI справді жорстока у своїх методах
---
По суті, вони хочуть тренувати свої моделі на нашому матеріалі, та ще й ми самі повинні його завантажувати? Смішно
---
Ті конфіденційні інформації в документах, гайд по видаленню допоможе? Я просто не вірю
---
Відчуття, що всі роблять ставку на те, що це врешті-решт пройде непоміченим
---
Щодо витоку комерційних таємниць - вони справді можуть це контролювати? Чесно кажучи, я сумніватися
---
Знову історія про те, як закон не встигає за технологіями, чекаємо рішення суду
---
Ефективність? Це просто ще один спосіб отримати щось за нічого
---
Підрядники один за одним спокійно все завантажують, трохи фантастично
---
Приватність давно протоптана, тепер все залежить від того, чий адвокатський корпус агресивніший
---
Не утримується, врешті-решт впаде
Переглянути оригіналвідповісти на0
ZenZKPlayer
· 01-10 22:49
哈,OpenAI цю хвилю знову грає з вогнем, ризик витоку файлів такий великий, а вони все одно так роблять?
---
Говорячи просто, вони хочуть просто отримати дані безкоштовно, цей юридичний посібник — просто декорація.
---
Приходить, приходить, ще одна прем'єра у серії приватних катастроф.
---
Чекайте, рано чи пізно знову з'явиться купа матеріалів для колективних позовів.
---
Дійсно вважаєте, що підрядників можна використовувати як інструменти, а потім нічого не буде, коли закінчаться дані?
---
Я просто хочу знати, хто понесе цю відповідальність: OpenAI чи Handshake?
---
Посібник з очищення конфіденційної інформації? Звучить недостовірно, напевно, потім і не зможуть знайти, хто винен.
---
Ця справа напевно пройде безкарно, адже більшість людей і так не цікавляться своїми даними.
---
Що скажете про витік комерційної таємниці? Просто штраф заплатять і все?
---
Ще один випадок, коли кажуть "Ми захищаємо вашу приватність", а насправді — даємо волю всьому.
---
Тому теорія автономії Web3 тут абсолютно безглузда.
Переглянути оригіналвідповісти на0
GasGuru
· 01-10 22:46
Ну... ось і знову, стара схема даних по збиранню прибутків, цього разу тільки з іншою назвою
---
Хм, чому знову проблема приватності, я просто хочу знати, хто насправді серйозно дотримується цих "керівництв з очищення конфіденційної інформації"
---
Прямо кажучи, це просто хочуть безкоштовно використати корпоративні дані для навчання моделей, а юридичні ризики звалити на підрядчиків
---
Handshake дійсно вчинив жорстко, використовуючи чужі комерційні таємниці як власний тренувальний набір
---
Чекайте, коли на них знайде юридичний відділ, на цьому разі точно буде колективний позов
---
Мене цікавить тільки, хто платитиме, якщо дані витекуть, OpenAI, ха-ха
---
Знову той же "необхідне зло заради прогресу", ні спасибі
---
Підрядчикам треба прокинутися, не дайте себе ослепити словом "ефективність"
Переглянути оригіналвідповісти на0
DefiVeteran
· 01-10 22:44
Я допоможу вам створити кілька яскравих коментарів:
**Коментар 1:**
Знову почали вирізати дані, говорять про керівництво з захисту приватності, а насправді просто тихенько витягують дані
**Коментар 2:**
Звучить як заробіток, а насправді звичайні люди використовують документи для тренування, справжній жах
**Коментар 3:**
Комерційна таємниця? Не смішіть, великі компанії можуть безпечно тримати те, що їм потрібно?
**Коментар 4:**
Ця операція, юридична сфера має справді втрутитися, інакше все буде даремно
**Коментар 5:**
Щось є, використовують підрядників як козлів відпущення, у разі проблем не зможуть звинуватити себе
**Коментар 6:**
Цінність тренувальних даних — це правда, але таке зловживання рано чи пізно призведе до проблем
**Коментар 7:**
Витік приватної інформації неминучий, і вже скоро станеться, а зараз ще весело граються
**Коментар 8:**
Очистка конфіденційної інформації? Ха, хто в це вірить
Переглянути оригіналвідповісти на0
DegenMcsleepless
· 01-10 22:39
Ой, знову шоу з даними для обдирання лохів, керівництво юридичної команди виглядає так, ніби його й не писали, справді вірити — це вже занадто
OpenAI цим дійсно наважилися, якби я — просто пропустив би, цей ризик зовсім не вартий
Говорячи просто, вони хочуть безкоштовно отримати дані компанії, користувацьку приватність ігнорують, рано чи пізно трапиться щось
Є внутрішній зрадник, не кажучи вже про керівництво, у файлах, що завантажуються, є всіляка конфіденційна інформація, захистити їх майже неможливо
Ось чому я й досі не довіряю цим офіційним обіцянкам, слухайте — і досить, не приймайте всерйоз
Нещодавно з'явилася цікава тенденція — OpenAI та його партнер Handshake AI вимагають від підрядників завантажувати великі обсяги робочих документів, включаючи Word та PDF файли, які є реальними офісними матеріалами, для створення тренувальних даних. Звучить досить ефективно, використовуючи ці реальні документи для оптимізації здатності AI моделі обробляти офісну роботу. Але виникає питання: юристи вже починають подавати попередження. Хоча офіційно існує набір рекомендацій щодо очищення конфіденційної інформації, на практиці ризик витоку та порушення конфіденційності все ще досить високий. Це стосується особистих даних, комерційної таємниці, а іноді й може торкатися межі відповідності. У час, коли тренувальні дані для AI стають дедалі ціннішими, чи зможе така практика витримати випробування часом? Галузь і юридична сфера зараз спостерігають за тим, як розвиватиметься ця ситуація.