Microsoft оказалась в центре спора из-за рекомендаций обучать ИИ на книгах о Гарри Поттере
А вы знали?

Microsoft оказалась в центре спора из-за рекомендаций обучать ИИ на книгах о Гарри Поттере

  • AlexT
  • 22-фев-2026, 09:00
  • 0 комментариев
  • 36 просмотров

Компания Microsoft удалила публикацию из своего блога, вызвавшую волну критики. В материале, размещённом ещё в ноябре 2024 года, фактически предлагалось использовать тексты серии Гарри Поттер для обучения моделей искусственного интеллекта — несмотря на возможные нарушения авторских прав.


В чём суть ситуации

Автором публикации выступила менеджер по продукту Пуджа Камат. В тексте она рассматривала популярную книжную серию как удобный пример для демонстрации возможностей генеративного ИИ.

Пользователям предлагалось:

  • обучать языковые модели на текстах книг;

  • создавать системы вопросов и ответов по вселенной;

  • генерировать фанфики и альтернативные сюжетные линии.

В качестве инструментария упоминались Azure SQL Database, LangChain и другие сервисы Microsoft, упрощающие внедрение ИИ в приложения.


Проблемный источник данных

К публикации прилагалась ссылка на датасет, размещённый на платформе Kaggle. Он содержал тексты всех семи книг и был ошибочно помечен как находящийся в общественном достоянии.

Фактически речь шла о несанкционированном распространении произведений, принадлежащих Джоан Роулинг.

Долгое время набор данных оставался вне внимания — число загрузок не превышало 10 тысяч. Однако после роста интереса к теме ИИ он был оперативно удалён.


Почему это вызвало резонанс

Публикация появилась в период, когда крупные технологические компании уже сталкивались с судебными исками из-за обучения ИИ на защищённых авторским правом материалах.

Критики отмечают несколько спорных моментов:

  • рекомендация использовать нелегальный контент;

  • отсутствие чёткого указания на правовые ограничения;

  • демонстрация примеров, потенциально нарушающих авторские права.

В частности, в блоге приводились сценарии, где модель извлекает фрагменты из книги «Гарри Поттер и философский камень» и использует их для генерации новых текстов.


Коммерческий подтекст

Отдельное внимание привлекло использование фанфиков в качестве демонстрации технологий Microsoft.

В одном из примеров ИИ генерировал историю, где герой встречает нового персонажа, рассказывающего о возможностях технологий компании. Таким образом художественный контент фактически использовался для продвижения продуктов.


Юридическая оценка

Эксперты отмечают, что подобные кейсы находятся в «серой зоне».

С одной стороны, использование материалов могло рассматриваться как образовательное. С другой — длительное существование публикации и её практическая направленность могут быть интерпретированы как содействие нарушению авторских прав.

Если подобные действия станут предметом судебного разбирательства, аргумент о добросовестном использовании может оказаться недостаточным.


Итог

История подчёркивает растущее напряжение между развитием ИИ и защитой интеллектуальной собственности. Даже крупные технологические компании сталкиваются с рисками, когда речь идёт об использовании популярных культурных произведений для обучения моделей.

img
Привет, я Айтишка!

Самый настоящий сургутский лисенок. Я аватар компании ИТ-Телеком и тут я хочу делиться с вами интересными новостями.

Категории сайта
Календарь
«    Апрель 2026    »
ПнВтСрЧтПтСбВс
 12345
6789101112
13141516171819
20212223242526
27282930 
Лучший поисковик кто?