Почему чат GPT почти никогда не говорит о гоблинах: интересное объяснение

В глубоких настройках архитектуры ChatGPT появилось странное и безапелляционное правило, которое строго запрещает текстовому роботу без прямой необходимости упоминать гоблинов, гремлинов, троллей, огров и даже голубей. Эта необычная внутренняя инструкция возникла не случайно, а стала следствием длительного лингвистического курьеза, который массово замечали пользователи платформы.
Как пишет IFLScience, ранее нейросеть без всякого текстового контекста внезапно начинала называть людей "гоблинами фитнеса" за большое количество пройденных шагов или характеризовать собственные алгоритмы как "код-гоблин".
Желание разработчиков развлечь аудиторию и придать чат-боту уникальные черты характера в конце концов превратилось в навязчивый цифровой тик, который пришлось искоренять на уровне базового кода. Подобная аномалия продемонстрировала специалистам, насколько сложно контролировать поведение нейросетей, когда определенные речевые привычки закрепляются в процессе машинного обучения.
Феномен "бота-заучки" и сбой в системе наград
Источники этой забавной проблемы кроются в предыдущих версиях платформы, где разработчики тестировали функцию индивидуальных настроек персонализированного стиля общения. Среди стандартных вариантов поведения – таких как профессиональный, циничный или дружественный – существовал и так называемый Nerdy (ботанический или гиковский) психотип. По замыслу OpenAI, этот режим должен был делать ответы искусственного интеллекта игривыми, несколько специфическими, но в то же время мудрыми.
Во время тренировки алгоритмов по методу подкрепления система получала особые "баллы вознаграждения" за генерацию удачных ответов, что стимулировало ее повторять успешные речевые конструкции в будущем. Однако авторы ИИ не заметили, как случайно выставили слишком высокие оценки за использование метафор с вымышленными существами.
В результате получив высокую награду за первые случайные фразы, нейросеть начала массово продуцировать аналогичные метафоры, а специфический языковой дефект быстро вышел за пределы своего тестового режима и распространился на другие инструменты системы.
Обновление алгоритмов и скрытая угроза для индустрии ИИ
Для окончательного решения этой проблемы разработчики внесли радикальные изменения в архитектуру системы. В марте 2026 года с выходом обновленной версии GPT-5.4 "гиковский" режим общения вместе с ложной шкалой наград был полностью ликвидирован, а для предотвращения рецидивов программисты прописали упомянутый жесткий запрет. Хотя компания OpenAI категорически отрицает теории о том, что этот инцидент был маркетинговым ходом, независимые эксперты видят в "гоблинском вопросе" серьезный предупредительный сигнал для всего технологического сектора.
Главная опасность заключается в том, что по подобному принципу крупные языковые модели могут незаметно для создателей закреплять гораздо более опасные паттерны поведения. Поскольку крупные корпорации находятся в условиях жесткой гонки вооружений в сфере искусственного интеллекта, из-за ограниченных ресурсов и сложности тестирования они часто спешат с релизами. Поэтому невинный сбой с забавными мифическими существами завтра может обернуться автоматическим распространением языка вражды, рецептов химического оружия или деструктивных советов. Специфические алгоритмические ошибки могут годами тайно прятаться внутри сложной структуры кода, ожидая специфического запроса пользователя, что требует от разработчиков совершенно новых подходов к цифровой безопасности.
OBOZ.UA предлагает узнать о запрещенных запросах к ChatGPT.
Подписывайтесь на каналы OBOZ.UA в Telegram и Viber, чтобы быть в курсе последних событий.
