Лайфхакер
Лайфхакер
Лучшее
Рубрики
Рецепты
Подкасты
Сервисы
Колонки
Лучшее
Рубрики
Рецепты
Подкасты
Сервисы
Колонки
🧡 Осень в радость
Новости
Здоровье
Спорт и фитнес
Покупки
Технологии
Отношения
Кино
Реклама
Технологии
3 сентября

ChatGPT оставляет невидимые маркеры в тексте — как их найти и убрать

Эти символы выдают, что текст написал ИИ.
Фото автора Дарья Громова
Дарья Громова

Автор Лайфхакера

ChatGPT оставляет невидимые маркеры в тексте — как их найти и убрать

Что случилось

С обновлением модели ChatGPT до GPT‑5 во многих каналах про нейронки и технологии начали обсуждать так называемые невидимые маркеры, или водяные знаки, в сгенерированных текстах. Речь о непечатаемых символах Unicode, которые отображаются только в редакторах с определёнными настройками, а в самом ChatGPT и после вставки на какой-нибудь сайт не выводятся. 

На самом деле эту проблему заметили давно: ещё в начале года пользователь Reddit жаловался, что стал часто находить в текстах непечатаемый символ U+2019, которым нейронка решила заменить обычный апостроф (‘). 

Тогда никакой реакции обществености не было, но из каждого утюга об этом заговорили уже в апреле — с релизом GPT-o3 и GPT-o4 mini. В блоге платформы для интеграции ИИ Rumi опубликовали статью о том, что в текстах от новых моделей полно неразрывных пробелов Unicode U+A0 (они же <0xa0>) и узких неразрывных пробелов U+202F.

Символы Unicode, спрятанные в сгенерированном ИИ тексте
Сверху — как текст выглядит в обычном редакторе, снизу — в редакторе с поддержкой непечатаемых символов. Скриншот: Rumi

Эти символы могли появляться в любом месте текста вне зависимости от того, есть ли рядом цифры или аббревиатуры. И в теории по ним можно было определить, что текст сгенерирован ИИ. Это вызвало беспокойство: вдруг OpenAI решила стрелять себе в ногу и маркировать нейросетевые тексты?

Оказалось, нет: уже спустя три дня OpenAI исправила проблему и все успокоились. 

Вот только с релизом GPT‑5 в августе, похоже, узкие неразрывные пробелы вернулись — и паранойя заиграла новыми красками. Но даже если сообщения об этом правдивы, подтвердить это нельзя, потому что OpenAI, видимо, опять всё починила. 2 сентября мы не смогли заставить бота выдать неразрывные пробелы ни на русском, ни на английском. Зато получилось найти кое-что другое: оказалось, что некоторые символы вроде $ и ~ чат-бот пишет как \$ и \~. Только в интерфейсе и обычных редакторах \ не отображается и всё выглядит нормально. 

Экранирование символов в тексте ChatGPT
Скриншот: Лайфхакер

Нечитаемый обратный слеш с Unicode уже не связан — дело в экранировании символов. Поскольку ~ и $ имеют специальное значение в языках программирования и разметке, \ перед ними ставится, чтобы дать машине понять: печатай символ как есть, ничего другого не выполняй. А вот это уже звоночек для каждого, кто посмотрит на текст внимательно. Ежу понятно: если текст писал человек, то экранировать он ничего не будет.

В общем, даже если какие-то дыры OpenAI латает, найти косяки машинного текста можно, даже не имея особых знаний и хитрых инструментов. Скорее всего, внимательным взглядом поймать ИИ на особенностях форматирования получится в любой версии модели, но это не означает, что нужно перепечатывать каждую букву вручную, боясь скрытых символов.

Как искать непечатаемые символы в текстах ChatGPT

Для этого есть удобный онлайн-инструмент от SoSci Survey. Работает он максимально просто: вставьте текст в большое поле сверху и нажмите Show me the characters. Непечатаемые Unicode-символы подсветятся фиолетовым, в том числе — неразрывные пробелы, о которых все беспокоились.

Невидимые символы ChatGPT, подсвеченные SoSci Survey
Скриншот: Лайфхакер

Если текст писал человек, который не использовал Unicode-символы намеренно, фиолетовой подсветки быть не должно.

Также непечатаемые символы отображаются в редакторах кода вроде VS Code и Sublime Text. Но учтите, что в обоих случаях не подсвечивается символ экранирования, поэтому \~ останется незамеченным. Придётся искать по странице: нажмите Ctrl + F или Cmd + F, далее введите нужную комбинацию в окошке поиска.

Как избавиться от непечатаемых символов

Если вы заметили всего пару лишних символов, их проще удалить прямо в редакторе или заменить на нужный знак с клавиатуры. А вот большие тексты с кучей непечатаемых символов вручную вычищать неудобно. Глаз замыливается, и риск что-то пропустить или удалить нужное увеличивается. В таком случае есть несколько вариантов:

  • Скопируйте текст из ChatGPT и вставьте в новый Google-документ. Затем скопируйте из документа и снова проверьте на непечатаемые знаки. Если что-то осталось, вставьте скопированный текст в тот же документ или другой редактор через Ctrl + Shift + V (Windows) или Cmd + Shift + V (Mac). Это уберёт форматирование вместе с непечатаемыми символами.
  • Используйте бесплатный веб-сервиc Humanize AI. Вставьте текст в поле слева, и очищенный вариант отобразится справа и сразу скопируется в буфер обмена. В настройках можно отключить Transform dashes и Transform quotes, чтобы сохранить длинные тире и кавычки-ёлочки соответственно.
  • Воспользуйтесь инструментом замены в текстовом редакторе: через поиск найдите, какие символы появились в тексте, и по одному настройте правила для их замены. Например, выберите ~ вместо \~. Это вариант для тех, кто хочет максимально сохранить форматирование или боится что-то упустить с другими методами. 
  • В редакторе кода выделите нужную комбинацию символов и нажмите Alt + F3. Это подсветит все точные совпадения в пределах файла. Нажмите Del, чтобы удалить сразу все. Повторите это действие с другими символами, если нужно.

Это самые простые методы, не требующие особых знаний. Но если вы хоть немного разбираетесь в программировании, то можете воспользоваться скриптами для удаления всех символов, кроме печатных. Такой скрипт вам спокойно предложит тот же ChatGPT, а варианты для нетипичных сценариев (например, требующих убрать только часть непечатаемых символов) можно поискать на Stack Overflow. Хотя это уже ближе к стрельбе из пушки по воробьям.

Прокачиваемся в нейронках
✨
Как распознать нейросетевые фейки: 17 полезных методов
Как писать промпты для нейросети: подробная инструкция
Как писать промпты для нейросети: подробная инструкция
Распознавание фото в ChatGPT: 17 примеров, когда это чертовски удобно
Обложка: limpreom / shutterstock / Лайфхакер
Если нашли ошибку, выделите текст и нажмите Ctrl + Enter

Лучшие предложения

Nahodki AliExpress: samye poleznye i interesnye tovary nedeli

Находки AliExpress: самые полезные и интересные товары недели

Что умеет фен от Dreame: разбор умной новинки в премиальном стиле

Что умеет фен от Dreame: разбор умной новинки в премиальном стиле

10 muzhskih krossovok ot populyarnyh brendov so skidkami do 59%

10 мужских кроссовок от популярных брендов со скидками до 59%

Это нам надо: популярная сыворотка с ретинолом и микроиглами со скидкой 20%

Это нам надо: популярная сыворотка с ретинолом и микроиглами со скидкой 20%

Надо брать: ударная дрель от Heimerdinger со скидкой 70%

Надо брать: ударная дрель от Heimerdinger со скидкой 70%

18 nadyozhnyh smesitelej, kotorye chasto pokupayut na marketplejsah

18 надёжных смесителей, которые часто покупают на маркетплейсах

10 вещей популярных брендов со скидками до&nbsp;65%

10 вещей популярных брендов со скидками до 65%

Надо брать: робот-пылесос Roborock S8 со скидкой 69%

Надо брать: робот-пылесос Roborock S8 со скидкой 69%

Это интересно
Пазл жизни: что нужно знать о донорстве костного мозга

Пазл жизни: что нужно знать о донорстве костного мозга

Учителя, которых мы запомнили на всю жизнь: истории редакции

Учителя, которых мы запомнили на всю жизнь: истории редакции

«Мне всего 30, откуда у меня высокое давление?» Почему гипертония молодеет и что с этим делать

«Мне всего 30, откуда у меня высокое давление?» Почему гипертония молодеет и что с этим делать

Правительство сохранит льготный НДС 10% на социально значимые товары

Правительство сохранит льготный НДС 10% на социально значимые товары

Комментарии
Ярослав Паламарчук
04.09.25 16:39
Боже, сколько можно положить безграмотность, вы же вроде бы просветительское издание. Никто нейронки специально "защитные" символы не вставляет, просто нейронки знают ГОСТы и ISO, в отличие от их пользователей. В любом дипломе, курсаче, научной статье или даже статье на Википедии после года, при названиях рейсов самолётов, при обозначениях типа 100 г., 1000 р. обязан ставиться неразрывный пробел. То же самое с длинным, коротким тире и дефисом.
Дарья Громова
05.09.25 12:30
Фишка в том, что есть примеры неразрывных пробелов в местах, где их человек бы не поставил, это уже не списать на соответствие правилам. Как и символы экранирования - или они тоже в ГОСТе есть?
Олег Макаров
04.09.25 18:29
Авторы вообще не знают разницы между словами "непечатный" и "непечатаемый" в русском языке. А на редакторах лайфхакер экономит.
Наталья Мурахтанова
05.09.25 09:57
Спасибо за внимательность, исправили.
Что вы могли пропустить
Как открыть файл ISO: простые способы для Windows, macOS, Linux и Android
Как открыть файл ISO: простые способы для Windows, macOS, Linux и Android
0
11:00
Ликбез
Технологии
12 игр для Android, в которые можно играть вдвоём на одном смартфоне
12 игр для Android, в которые можно играть вдвоём на одном смартфоне
0
Вчера
Android
Android
Какой принтер лучше — струйный или лазерный
Какой принтер лучше — струйный или лазерный
0
17 октября
Ликбез
Устройства
ZTE представила игровые смартфоны Red Magic 11 Pro — впервые с жидкостным охлаждением
ZTE представила игровые смартфоны Red Magic 11 Pro — впервые с жидкостным охлаждением
0
17 октября
Новости
Устройства
Репетитор, повар, стилист: 20 кастомных чат-ботов для ChatGPT на все случаи жизни
Репетитор, повар, стилист: 20 кастомных чат-ботов для ChatGPT на все случаи жизни
0
17 октября
Технологии
Технологии
Apple планирует выпустить складной iPhone с широким экраном, похожий на Huawei Pura X
Apple планирует выпустить складной iPhone с широким экраном, похожий на Huawei Pura X
0
17 октября
Новости
Устройства
Microsoft перепишет всю операционную систему Windows «вокруг ИИ»
Microsoft перепишет всю операционную систему Windows «вокруг ИИ»
0
16 октября
Windows
Новости
10 лёгких и функциональных альтернатив встроенным приложениям Windows
10 лёгких и функциональных альтернатив встроенным приложениям Windows
0
16 октября
Windows
Windows
Honor показала Robot Phone — это смартфон с камерой на подвесе, который сам познаёт мир
Honor показала Robot Phone — это смартфон с камерой на подвесе, который сам познаёт мир
0
16 октября
Новости
Устройства
Honor показала флагманы Magic 8 и Magic 8 Pro — оба стали компактнее предшественников
Honor показала флагманы Magic 8 и Magic 8 Pro — оба стали компактнее предшественников
0
15 октября
Новости
Устройства
Apple представила новые iPad Pro и MacBook Pro с процессорами М5
Apple представила новые iPad Pro и MacBook Pro с процессорами М5
0
15 октября
Новости
Устройства
5 типичных ошибок при выборе смартфона, которые заставляют зря тратить деньги
5 типичных ошибок при выборе смартфона, которые заставляют зря тратить деньги
0
15 октября
Устройства
Устройства
ИИ-редактор изображений Nano Banana появится в Google-поиске и «Google Фото» 
ИИ-редактор изображений Nano Banana появится в Google-поиске и «Google Фото» 
0
15 октября
Новости
Технологии
Ролевые игры с ИИ: OpenAI разрешит ChatGPT вести эротические беседы
Ролевые игры с ИИ: OpenAI разрешит ChatGPT вести эротические беседы
0
15 октября
Новости
Технологии
Объясняем за минуту: можно ли открывать окно при включённом увлажнителе воздуха
Объясняем за минуту: можно ли открывать окно при включённом увлажнителе воздуха
0
14 октября
Технологии
Технологии

Новые комментарии

Аватар автора комментария
Дарья Чередникова25 минут назад

0 / 0

Просто описали человека с высокофункциональным аутизмом.
Кто такие отроверты и стоит ли себя к ним причислять
Аватар автора комментария
Andrey Menshikov1 час назад

0 / 0

Есть, конечно, но они обычно значительно ниже
Правда ли женщинам проще найти секс, чем мужчинам
Аватар автора комментария
Irina Teptyaeva1 час назад

0 / 0

Щляпа!!!Щляпа!!!
Типы лица для мужчин: подбираем аксессуары, причёску и форму бороды
Аватар автора комментария
Thor Steinar2 часа назад

0 / 0

Сделаем еще небольшое дополнение. Как смонтировать ISO в linux и macos из командной строки. Для Linux: %sudo mount -o loop имяфайла.iso /mnt/iso Тут у нас: sudo для монтирования нужны права суперпользователя. mount - непосредственно команда монтирования. "имяфайла.iso" - название файла который мы хотим смонтировать. /mnt/iso - путь по которому он будет доступен. Иногда на дисках нестандартная файловая система: тогда ее тип мы задаем через ключ -t (например -t iso9660). Для macOS: %hdiutil mount имяфайла.iso После этого файл будем смонтирован, и доступен как HDD (в read only понятное дело режиме), в /Volumes
Как открыть файл ISO: простые способы для Windows, macOS, Linux и Android
О чём стоит знать до рождения ребёнка? Рассказывают опытные родители

О чём стоит знать до рождения ребёнка? Рассказывают опытные родители

Лайфхакер
Информация
О проектеРубрикиРекламаРедакцияВакансииДля начинающих авторов
Подписка
TelegramВКонтактеTwitterViberYouTubeИнициалRSS
Правила
Пользовательское соглашениеПолитика обработки персональных данныхПравила применения рекомендательных технологийПравила сообществаСогласие на обработку персональных данныхСогласие для рекламных рассылокСогласие для информационной программы
18+Копирование материалов запрещено.
Издание может получать комиссию от покупки товаров, представленных в публикациях