Microsoft оказалась в центре спора из-за рекомендаций обучать ИИ на книгах о Гарри Поттере
- AlexT
- 22-фев-2026, 09:00
- 0 комментариев
- 4 просмотров

Компания Microsoft удалила публикацию из своего блога, вызвавшую волну критики. В материале, размещённом ещё в ноябре 2024 года, фактически предлагалось использовать тексты серии Гарри Поттер для обучения моделей искусственного интеллекта — несмотря на возможные нарушения авторских прав.
Автором публикации выступила менеджер по продукту Пуджа Камат. В тексте она рассматривала популярную книжную серию как удобный пример для демонстрации возможностей генеративного ИИ.
Пользователям предлагалось:
обучать языковые модели на текстах книг;
создавать системы вопросов и ответов по вселенной;
генерировать фанфики и альтернативные сюжетные линии.
В качестве инструментария упоминались Azure SQL Database, LangChain и другие сервисы Microsoft, упрощающие внедрение ИИ в приложения.
К публикации прилагалась ссылка на датасет, размещённый на платформе Kaggle. Он содержал тексты всех семи книг и был ошибочно помечен как находящийся в общественном достоянии.
Фактически речь шла о несанкционированном распространении произведений, принадлежащих Джоан Роулинг.
Долгое время набор данных оставался вне внимания — число загрузок не превышало 10 тысяч. Однако после роста интереса к теме ИИ он был оперативно удалён.
Публикация появилась в период, когда крупные технологические компании уже сталкивались с судебными исками из-за обучения ИИ на защищённых авторским правом материалах.
Критики отмечают несколько спорных моментов:
рекомендация использовать нелегальный контент;
отсутствие чёткого указания на правовые ограничения;
демонстрация примеров, потенциально нарушающих авторские права.
В частности, в блоге приводились сценарии, где модель извлекает фрагменты из книги «Гарри Поттер и философский камень» и использует их для генерации новых текстов.
Отдельное внимание привлекло использование фанфиков в качестве демонстрации технологий Microsoft.
В одном из примеров ИИ генерировал историю, где герой встречает нового персонажа, рассказывающего о возможностях технологий компании. Таким образом художественный контент фактически использовался для продвижения продуктов.
Эксперты отмечают, что подобные кейсы находятся в «серой зоне».
С одной стороны, использование материалов могло рассматриваться как образовательное. С другой — длительное существование публикации и её практическая направленность могут быть интерпретированы как содействие нарушению авторских прав.
Если подобные действия станут предметом судебного разбирательства, аргумент о добросовестном использовании может оказаться недостаточным.
История подчёркивает растущее напряжение между развитием ИИ и защитой интеллектуальной собственности. Даже крупные технологические компании сталкиваются с рисками, когда речь идёт об использовании популярных культурных произведений для обучения моделей.