Генеративная «уловка-22», или Почему ИИ плохо отличает сгенерированные тексты от написанных человеком Хабр

Skov McKnight

Apr 16, 2025 • 3 min read

Она, правда, уточнила, https://semiwiki.com/category/artificial-intelligence/ что ChatGPT является «автором» примерно 5% текста книги, а в основном она прибегает к искусственному интеллекту для «высвобождения творческой энергии». https://satoil.kz/author/foresttrout5/ При всех этих сомнениях у ИИ есть и позитивная сторона, которую легко применять писателям. Например, при творческом кризисе или просто общей усталости нейросеть может просто подсказать отличную идею. Необязательно генерировать весь текст с помощью нее, но порой небольшая подсказка нужна даже профессионалам. Хотя эксперты уверены, что к этому решению стоит прибегать только опытным авторам. Повторение фразы “купить одежду онлайн” делает текст однообразным и скучным.

Работает ли инструмент со всеми типами контента, созданного ИИ?

Тексты, написанные нейросетями, довольно последовательны по структуре предложений, их состав и длина практически не меняются.
Анализируя шаблоны, структуру и формулировки, он выявляет перефразированный текст, созданный искусственным интеллектом, и гарантирует, что ваша работа сохранит подлинность.
Вместо того чтобы сосредоточиться на главной идее или аргументе, читатель вынужден постоянно сталкиваться с повторяющимися фразами, что отвлекает и раздражает.

ИИ обучается на текстах, которые были созданы людьми, и использует эти данные для генерации новых текстов. Однако он не способен к оригинальному мышлению или творческому осмыслению информации. Вместо этого ИИ комбинирует и воспроизводит уже существующие идеи и формулировки, что приводит к созданию текстов, которые могут казаться банальными и однообразными. Тексты, написанные ИИ, часто страдают от недостатка глубины и оригинальности. Это приводит к созданию поверхностных и предсказуемых текстов, лишенных уникальных взглядов и глубокого анализа. Дополнительно, ИИ может повторять определенные стилистические приемы, такие как одинаковая длина предложений или использование однотипных слов и выражений. Если вы хотите быть уверены в качестве контента, всегда проверяйте текст и при необходимости дорабатывайте его самостоятельно. Это не единственный случай, когда авторы контента жалуются на неправомерное использование их произведений для обучения модели. Против подхода разработчиков ИИ, использующих их работы уже выступали иллюстраторы манги в Японии, музыканты в Индии и сценаристы в США. https://365d24h60m.com/forums/users/tunawood8/ В сентябре 2023 года https://aitracker.substack.com группа американских авторов, в числе которых лауреат Пулитцеровской премии Майкл Шейбон, подала иск против OpenAI. Она обвиняет компанию в том, что та скопировала произведения авторов без разрешения, чтобы с их помощью обучить ChatGPT. Понимание этих признаков важно для различных сфер, включая журналистику, образование и цифровую грамотность.

Так много экспертов и так мало реальных результатов, почему тексты, написанные человеком в зоне риска

Результаты, полученные профессором Зоу, показали, что более половины эссе были ошибочно классифицированы как написанные ИИ, тогда как образцы, написанные носителями английского языка, были детектированы практически идеально. В большинстве случаев использование данных для обучения моделей ИИ скорее попадает под добросовестное использование. Но создание контента с помощью такой нейросети уже может нарушать авторские права. Если ее обучили на миллионе изображений, а потом попросили нарисовать цветочек или корову на лугу, то маловероятно, что такой контент нарушает чьи-то авторские права. Но если обучить модель на картинках Пабло Пикассо, а потом заставить рисовать в его стиле, то у семьи Пикассо могут появиться обоснованные претензии. «Антиплагиат», наиболее известная в России система подобных проверок, весной получила функцию определения сгенерированных текстов. Мы добавили весь текст до предыдущего абзаца включительно и получили оригинальность в 100 %. Но потом обнаружили, что проверка на «человечность» входит только в платную версию. Попробуйте детектор AI-текстов GigaCheck — он бесплатно проверит студенческую работу, пост в соцсети или статью от копирайтера. Искусственный интеллект стремится «угодить» максимально широкой аудитории, поэтому избегает конкретных деталей и фактов. Часто добавляет в тексты длинные предложения, которые не несут смысловой нагрузки. Ее задача — помочь нам сделать доступным то, с чем мы уже знакомы», — говорила Ада Лавлейс, создательница первой в мире компьютерной программы. Ее слова все еще актуальны, так как генеративный ИИ — это алгоритмы, обучившиеся на огромном количестве данных. OpenAI обучала ChatGPT на миллионах документов, найденных в интернете — на той же информации, на которой мы и сами учимся писать. Вместе с этим, конечно же, появилась потребность определять тексты, написанные ИИ, а не человеком. Дошло до того, что некоторые учителя не засчитывают сочинения всему классу, хотя большинство работ действительно было написано учениками. Их тексты просто вызвали ошибочное срабатывание системы — ложноположительное (false positive).

Работает ли инструмент со всеми типами контента, созданного ИИ?

Так много экспертов и так мало реальных результатов, почему тексты, написанные человеком в зоне риска

Sign up for more like this.