Anthropic після публікації вихідного коду зробила понад 8000 запитів на скасування авторських прав, образ «Безпека понад усе» зазнав найскладнішого тижня

2026-04-02 06:57:59

Автор: глибокий прибій TechFlow

Anthropic через одну помилку в налаштуваннях під час випуску пакета npm випадково оприлюднила весь вихідний код свого найбільш прибуткового продукту Claude Code. Близько 512 000 рядків коду TypeScript за лічені години були віддзеркалені десятками тисяч розробників, розібрані та за допомогою AI переписані у версії на Python і Rust. Невдовзі після цього Anthropic надіслала на GitHub запит про видалення за DMCA, що зачепив близько 8100 репозиторіїв із кодом, але через те, що постраждало багато великої кількості не пов’язаних проєктів, у спільноті виник різкий спротив. У підсумку компанія була змушена відкликати більшість запитів, залишивши відкликання лише щодо 1 репозиторію та 96 форків. Це другий масштабний інцидент витоку за тиждень для Anthropic; до витоку інформації з моделі Mythos минуло лише 5 днів.

Anthropic, яка зробила «AI-безпеку» ключовим елементом бренду, переживає найприкріший тиждень із часу заснування.

За повідомленням The Wall Street Journal від 1 квітня, Anthropic під час звичайного оновлення від 31 березня через помилку людської операції в процесі збирання опублікувала повний вихідний код Claude Code разом із npm-пакетом. Розробник з безпекових досліджень Chaofan Shou о 4:23 ранку за східним часом США вивів у відкритий доступ посилання для завантаження на платформі X, і перегляди публікації швидко перевищили 21 000 000. За кілька годин код віддзеркалили на GitHub і він отримав десятки тисяч зірок; один корейський розробник Sigrid Jin навіть до світанку переписав увесь репозиторій за допомогою інструментів AI у версію на Python. Цей проєкт за дві години зібрав 50 000 зірок GitHub і, ймовірно, встановив рекорд найшвидшого зростання в історії платформи.

Представник Anthropic підтвердив факт витоку у розмові з CNBC, заявивши: «Це проблема пакування випуску, спричинена людською помилкою, а не вразливістю безпеки. Жодні або будь-які чутливі дані чи облікові дані клієнтів не були задіяні або розкриті».

Відсутній пункт конфігурації розкрив 512 000 рядків ключового коду

Технічна причина витоку була не надто складною. Claude Code створюється на основі Bun (JavaScript-інструмент часу виконання, який Anthropic викупила наприкінці 2025 року); Bun за замовчуванням генерує файли дебагування source map. Команда релізу під час завантаження npm-пакета не виключила цей файл у налаштуваннях .npmignore, через що файл source map обсягом 59.8MB з’явився разом із версією Claude Code 2.1.88. Цей файл містить повний вміст приблизно 1900 TypeScript-файлів, загалом близько 512 000 рядків коду; він читабельний, із коментарями та без будь-якого обфускування.

Керівник Claude Code Борис Черні (Boris Cherny) визнав: «У нашому процесі розгортання є кілька ручних кроків, і один із них не було виконано правильно». Він також додав, що команда вже виправила проблему та працює над додаванням додаткових автоматизованих перевірок, водночас підкресливши, що такі помилки вказують на проблеми процесу або інфраструктури, а не на провину якоїсь конкретної людини.

Це не відбувається вперше. У лютому 2025 року майже ідентичний витік source map уже розкрив вихідний код ранньої версії Claude Code. Подібні інциденти повторилися протягом 13 місяців, що змусило зовнішніх спостерігачів поставити під сумнів операційну зрілість компанії з оцінкою приблизно 3800 млрд доларів, яка готується до IPO.

Що розробники знайшли в коді, що витік

Витікований кодовий репозиторій фактично є продуктово-роудмапом, який Anthropic ніколи не планувала публікувати. За аналізом VentureBeat і кількох розробників, у коді міститься 44 перемикачі функцій (feature flag), причому понад 20 з них — це функції, які вже розроблені, але ще не випущені.

Серед найбільш привертаючих увагу — зокрема: автономний режим охоронного процесу під назвою «KAIROS», який дозволяє Claude Code, коли користувачю без дій, працювати у фоновому режимі як агент, здатний автономно виконувати завдання, періодично виправляти помилки та відправляти користувачеві push-повідомлення; набір трирівневої архітектури «самовідновлюваної пам’яті», де процес інтеграції пам’яті під назвою «dreaming» у фоновому режимі об’єднує розрізнені результати спостережень і усуває логічні суперечності; а також повна система координації багатьох агентів, яка перетворює Claude Code із одного агента на координатора, здатного паралельно генерувати, командувати та керувати кількома робочими агентами.

Найсуперечливішим відкриттям став файл під назвою undercover.ts. Як повідомляє The Hacker News, цей файл містить близько 90 рядків коду; коли співробітники Anthropic використовують Claude Code для подання коду в open source проєкти, він буде інжектувати системні підказки, які вказують Claude ніколи не розкривати, що він є AI, і вилучати всі позначки атрибуції Co-Authored-By. У коді написано: «Ти виконуєш підпільну місію в публічному/open-source кодовому репозиторії. Твоє повідомлення про коміт, заголовок PR і текст PR не мають містити жодної внутрішньої інформації Anthropic. Не розкривай свою ідентичність».

Крім того, у коді міститься мітка ANTI_DISTILLATION_CC, яка вбудовує підроблені визначення інструментів у запити до API, щоб забруднити тренувальні дані, які потенційно може перехопити конкурент. Також у коді з’являються внутрішні коди моделей Anthropic: Capybara відповідає новому рівню моделі, який ще не було випущено, а Fennec відповідає наявному Opus 4.6. Це узгоджується з витоком інформації про модель Mythos, який Anthropic спричинила лише п’ять днів тому через помилку в конфігурації CMS.

Засновник компанії з кібербезпеки Code Wall Пол Прайс (Paul Price) у коментарі для Business Insider сказав, що цей витік «скоріше викликає незручність, ніж спричиняє реальну шкоду. По-справжньому цінне ядро — це внутрішні ваги моделей, і їх не розкрили». Але він також зазначив, що Claude Code — це «одна з найкраще спроєктованих архітектур агентних інструментів на поточний момент; тепер ми бачимо, як вони вирішують ті складні проблеми», і для конкурентів це має очевидну інформаційну цінність.

8100 репозиторіїв помилково підпалила DMCA: «провал» із відкликанням спричинив ще сильніший спротив

Після поширення коду Anthropic швидко подала на GitHub запит про видалення за авторськими правами відповідно до американського Закону про авторські права в цифрову епоху (DMCA). Згідно з публічно доступними записами GitHub, спочатку цей запит стосувався приблизно 8100 репозиторіїв. Проблема ж у тому, що репозиторії, яких стосувалося відкликання, містили не лише дзеркала розкритого коду, а й законні форки офіційних репозиторіїв Claude Code, які Anthropic опублікувала сама.

Багато розробників висловили гнів у X. Розробник Danila Poyarkov повідомив, що він отримав сповіщення про видалення лише за те, що зробив форк опублікованого репозиторію Anthropic. Інший користувач, Daniel San, отримав лист від GitHub: показувалося, що репозиторій, якому заборонили, містив лише приклади навичок і документацію та не мав жодного відношення до коду витоку. Один із розробників прямо сказав: «Юристи Anthropic щойно прокинулися й уже видаляють мій репозиторій».

На тлі спротиву спільноти Anthropic 1 квітня частково відкликала запити. Згідно з записами про відкликання на GitHub, Anthropic звузила сферу видалень до 1 репозиторію (nirholas/claude-code) і 96 URL форків, які були окремо вказані в оригінальному повідомленні. Решту приблизно 8000 репозиторіїв GitHub уже відновив у доступі.

Представник Anthropic заявив TechCrunch: «Репозиторії, зазначені в повідомленні, належать до мережі форків, з’єднаних із нашим публічним репозиторієм Claude Code, тому сповіщення зачепило репозиторії понад очікування. Ми відкликали всі повідомлення, окрім одного репозиторію; GitHub відновив доступ до постраждалих форків».

Код уже назавжди заархівований на децентралізованій платформі: чинність DMCA обмежена

Ситуація з діями Anthropic щодо авторських прав стикається з фундаментальною дилемою: код уже незворотно поширився.

Згідно з повідомленням Decrypt, децентралізована Git-платформа Gitlawb віддзеркалила повний оригінальний код, додавши примітку: «Його ніколи не буде видалено». DMCA працює для централізованих платформ (таких як GitHub), тому що ті повинні виконувати закон, але неможливо накласти юрисдикцію на децентралізовану інфраструктуру. Вже за кілька годин після витоку код фактично став постійно доступним завдяки достатній кількості дзеркал і різним типам інфраструктури.

Ще більш іронічно те, що корейський розробник Sigrid Jin за допомогою інструмента оркестрації AI oh-my-codex переписав весь кодовий репозиторій із TypeScript у Python, а назва проєкту — claw-code. Засновник The Pragmatic Engineer Гергей Орош (Gergely Orosz) вказав у X, що це «перепис у чистій кімнаті» (clean-room rewrite), який є незалежним твором, і за задумом не може бути задіяний DMCA. Якщо Anthropic стверджуватиме, що код, переписаний AI, усе ще порушує авторські права, це навпаки послабить ключову лінію захисту AI-компаній у позовах щодо авторських прав на тренувальні дані — тобто аргумент, що вихідні дані, згенеровані AI з захищених авторським правом вхідних даних, є розумним використанням.

Незручність позиції щодо авторських прав: себе ж підривають чи так і треба за законом?

Найбільш обговорювана в спільноті напруга в цій історії полягає в суперечливості позицій щодо авторських прав. У 2025 році в вересні суд зобов’язав Anthropic виплатити 1.5 млрд доларів компенсації за використання піратських книг і тренування Claude з використанням Shadow Libraries. У 2025 році в червні Reddit подала позов проти Anthropic за несанкціоноване вилучення контенту, створеного користувачами, для тренування моделей. Компанія, яка через авторські права на тренувальні дані опинилася в низці судових спорів, у відповідь використовує закон про авторські права, щоб захистити власний код — реакція спільноти цілком передбачувана.

Під високо оціненим коментарем на Slashdot це підсумували прямо: «“Те, що ми оприлюднили й заробляємо на вкраденому, — як ви смієте це красти!” — це ж позиція». Інший користувач вважає, що з погляду правової стратегії дії DMCA не позбавлені сенсу: «Якщо Anthropic у майбутньому захоче притягнути інші компанії до відповідальності за використання їхнього коду, а вони навіть не намагалися домогтися вилучення від поширювачів, то в суді це буде нерозумно».

У цій суперечці також фігурує передове правове питання: належність авторських прав на код, згенерований AI. За попередніми публічними розкриттями від Gartner та Anthropic, код Claude Code приблизно на 90% створений AI. У березні 2025 року федеральний суд США ухвалив, що роботи, згенеровані AI, не користуються захистом авторських прав через відсутність ідентифікації людини-автора; а у березні 2026 року Верховний суд відмовився прийняти апеляцію. Якщо ж більшість коду Claude Code справді написана самим Claude, то правове обґрунтування авторських вимог Anthropic має значну невизначеність.

Два витоки за тиждень: операційні попередження перед IPO

Витік цього разу стався лише за п’ять днів після попереднього інциденту витоку в Anthropic. 26 березня журнал Fortune повідомив, що Anthropic через помилку в конфігурації системи керування контентом допустила розкриття майже 3000 невипущених внутрішніх документів у публічному індексованому кеші даних; серед них була докладна інформація про модель Claude Mythos, яку планували випустити. Обидва інциденти були списані на «людську помилку».

Ці часові рамки є чутливими. У лютому 2026 року Anthropic завершила раунд G на 30 млрд доларів із оцінкою в 3800 млрд доларів і, як повідомляється, готується до IPO щонайраніше в жовтні 2026 року; передбачається, що обсяг фінансування може перевищити 600 млрд доларів. Goldman Sachs, JPMorgan Chase та Morgan Stanley вже контактували на ранньому етапі. Річний дохід від Claude Code вже перевищив 2.5 млрд доларів — це один із найважливіших драйверів доходу компанії. TechCrunch зазначає, що для компаній, які готуються вийти на біржу, витік вихідного коду означає майже неминучу готовність до позовів з боку акціонерів.

У своєму аналізі події VentureBeat поставив ще гостріше питання: у березні Anthropic мала понад десяток інцидентів, але оприлюднила лише один післяфактум-звіт. При цьому третя сторона, яка відстежувала системи, виявила збій на 15–30 хвилин раніше, ніж Anthropic власна сторінка статусу. Компанія, що прямує на публічні ринки з оцінкою 3800 млрд доларів, має відповідати рівню прозорості й зрілості своїх операцій; інвесторам доведеться робити власні висновки.

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.