Нові браузери на базі штучного інтелекту від OpenAI та Perplexity виявилися здатними обходити системи платного доступу на новинних сайтах, фактично викрадаючи контент, призначений лише для передплатників.

Про це повідомляє Columbia Journalism Review за результатами власного розслідування, передає ITC.ua.

Під час тестування ШІ-браузери Atlas (від OpenAI) та Comet (від Perplexity) без жодних труднощів представили повний текст ексклюзивної статті MIT Technology Review обсягом 9 тисяч слів, доступної лише за платною підпискою.

При цьому стандартні версії ChatGPT та Perplexity чесно відповіли, що не можуть отримати доступ до матеріалу, оскільки їхні сканери заблоковані сайтом.

Секрет у тому, що для веб-сайтів Atlas та Comet виглядають як звичайні відвідувачі, що використовують браузер Chrome. На відміну від традиційних автоматизованих систем – краулерів і парсерів, які ідентифікують себе спеціальним цифровим маркером, ШІ-браузери не залишають жодних слідів своєї справжньої природи.

Звичайні боти проявляють себе через ідентифікатор, який повідомляє сайту про програмне забезпечення та мету запиту. Видавці можуть блокувати такі сканери за допомогою протоколу виключення ботів (Robots Exclusion Protocol).

"Оскільки браузери зі штучним інтелектом відображаються в журналах сайту як звичайні сеанси Chrome, їх блокування також може перешкодити легітимним користувачам отримати доступ до сайту. Це значно ускладнює для видавців виявлення, блокування або моніторинг цих агентів штучного інтелекту", – пояснюють автори дослідження.

Дослідники виявили принципову різницю між типами платних бар'єрів:

"Клієнтський пейвол" (використовує MIT Technology Review):
- Текст завантажується на сторінку, але прихований за банером з пропозицією підписатися
- Контент невидимий для людей, але доступний для ШІ-браузерів
- Atlas та Comet легко його читають

"Серверний пейвол" (використовують Wall Street Journal та Bloomberg):
- Повний текст відображається лише після входу та оплати
- ШІ-браузери не можуть отримати доступ без авторизації
- Надійніший захист

Цікаве відкриття: Atlas уникає прямого читання текстів медіакомпаній, які подали до суду на OpenAI за порушення авторських прав.

Коли журналісти попросили Atlas підсумувати статтю з PCMag (материнська компанія Ziff Davis судиться з OpenAI), браузер створив узагальнення, використовуючи: твіти про статтю, цитати в інших виданнях, згадки в соцмережах.

Експерт з онлайн-досліджень Хенк ван Есс назвав це методом "цифрових крихт" – агенти ШІ фактично проводять зворотний інжиніринг статті, збираючи інформацію з непрямих джерел.

Популярні новини зараз

Штрафи посипалися: українських водіїв попередили про нові пастки на дорогах

Застійний порядок і кінець висхідних держав

Ідентифікація пенсіонерів у "Дія": українцям пояснили, що робити з помилкою банку

"Путін знищить Україну": Трамп поставив жорсткий ультиматум Зеленському

Показати ще

Подібна ситуація склалася з New York Times, яка також судиться з OpenAI. Замість прямого доступу до статті Atlas створив короткий виклад на основі матеріалів чотирьох альтернативних видань: The Guardian, Washington Post, Reuters, Associated Press.

Показово, що три з цих чотирьох видань мають ліцензійні угоди з OpenAI.

Для порівняння, браузер Comet від Perplexity подібної "етичної" поведінки не демонструє і читає контент усіх видань без винятків.

Поява ШІ-браузерів, здатних обходити системи монетизації, створює серйозну загрозу для бізнес-моделі новинних видань, які покладаються на доходи від передплатників. Видавці опинилися в ситуації, коли традиційні методи захисту контенту виявляються неефективними проти нового покоління ШІ-інструментів.