Разработчики платформы для управления политикой использования нейросетей в учебных заведениях рассказали в блоге, что новые модели OpenAI оставляют в сгенерированном тексте водяные знаки. Популярные редакторы документов не показывают их.
Разработчики заметили, что языковые модели GPT o4-mini, o4-mini-high и o3 оставляют в тексте коды неразрывного пробела в формате Unicode. Важно отметить, что символы находятся в случайных местах текста. В окне браузера, популярных онлайн-редакторах документов и Microsoft Word эти символы по умолчанию не видно. Символы можно увидеть в редакторах Sumblime Text и VS Code.
Также исследователи отмечают, что невидимые символы пробелов появляются только в длинных сгенерированных текстах. Если ответ нейросети умещается в пару предложений, то подвоха не будет. Это, по мнению разработчиков, намекает на то, что OpenAI начала тестировать водяные знаки для проверки студенческих работ. Это объясняется тем, что компания предоставила бесплатный пробный период для студентов, который продлится до конца учебного года.
Также разработчики считают, что невидимые метки в тексте позволят какое-то время легко распознавать сгенерированный текст, но продлится этот период недолго. Сами же студент могут быстро написать утилиту, которая будет удалять скрытые символы в коде.
Источник новости: habr.com