Microsoft оказалась в центре спора из-за рекомендаций обучать ИИ на книгах о Гарри Поттере

AlexT
22-фев-2026, 09:00
0 комментариев
78 просмотров

Компания Microsoft удалила публикацию из своего блога, вызвавшую волну критики. В материале, размещённом ещё в ноябре 2024 года, фактически предлагалось использовать тексты серии Гарри Поттер для обучения моделей искусственного интеллекта — несмотря на возможные нарушения авторских прав.

В чём суть ситуации

Автором публикации выступила менеджер по продукту Пуджа Камат. В тексте она рассматривала популярную книжную серию как удобный пример для демонстрации возможностей генеративного ИИ.

Пользователям предлагалось:

обучать языковые модели на текстах книг;
создавать системы вопросов и ответов по вселенной;
генерировать фанфики и альтернативные сюжетные линии.

В качестве инструментария упоминались Azure SQL Database, LangChain и другие сервисы Microsoft, упрощающие внедрение ИИ в приложения.

Проблемный источник данных

К публикации прилагалась ссылка на датасет, размещённый на платформе Kaggle. Он содержал тексты всех семи книг и был ошибочно помечен как находящийся в общественном достоянии.

Фактически речь шла о несанкционированном распространении произведений, принадлежащих Джоан Роулинг.

Долгое время набор данных оставался вне внимания — число загрузок не превышало 10 тысяч. Однако после роста интереса к теме ИИ он был оперативно удалён.

Почему это вызвало резонанс

Публикация появилась в период, когда крупные технологические компании уже сталкивались с судебными исками из-за обучения ИИ на защищённых авторским правом материалах.

Критики отмечают несколько спорных моментов:

рекомендация использовать нелегальный контент;
отсутствие чёткого указания на правовые ограничения;
демонстрация примеров, потенциально нарушающих авторские права.

В частности, в блоге приводились сценарии, где модель извлекает фрагменты из книги «Гарри Поттер и философский камень» и использует их для генерации новых текстов.

Коммерческий подтекст

Отдельное внимание привлекло использование фанфиков в качестве демонстрации технологий Microsoft.

В одном из примеров ИИ генерировал историю, где герой встречает нового персонажа, рассказывающего о возможностях технологий компании. Таким образом художественный контент фактически использовался для продвижения продуктов.

Юридическая оценка

Эксперты отмечают, что подобные кейсы находятся в «серой зоне».

С одной стороны, использование материалов могло рассматриваться как образовательное. С другой — длительное существование публикации и её практическая направленность могут быть интерпретированы как содействие нарушению авторских прав.

Если подобные действия станут предметом судебного разбирательства, аргумент о добросовестном использовании может оказаться недостаточным.

Итог

История подчёркивает растущее напряжение между развитием ИИ и защитой интеллектуальной собственности. Даже крупные технологические компании сталкиваются с рисками, когда речь идёт об использовании популярных культурных произведений для обучения моделей.