Термін «відбиток браузера» розуміє набір даних, що описують пристрій, з якого користувач переглядає сторінки в мережі. При цьому варто зазначити, що в більшості випадків інформації, що передається на сервер сайту, достатньо для того, щоб зловмисник зміг отримати відомості, необхідні для здійснення протиправних дій. Зокрема, йдеться про ОС, часовий пояс, мови, підключені плагіни, використовувані шрифти, параметри використовуваного обладнання тощо.
Подивитися, як виглядає “слід” вашого браузера (цифровий відбиток браузера), можна через спеціальні сервіси. І незважаючи на здається «типовість», кожен відбиток є унікальним набором даних. Іншими словами, ймовірність повного збігу інформації дорівнює 1 до 28677, що робить його одним з кращих ідентифікаторів фактичного користувача, що стоїть за використанням оглядача.

Більше того, всупереч існуючій помилці, ні проксі, ні служби VPN, ні режим інкогніто не дозволяють досягти повної анонімності. При чому відмовитися від такого «стеження» теж неможливо. З іншого боку, fingerprint вводився на благо рядового користувача, т.к. з появою цієї технології «захоплення» акаунту стало практично неможливим. Крім того, при грамотній обробці даних, система безпеки сайту може отримувати максимально точну маркетингову аналітику, а також фіксувати явно нелюдський трафік.
Проте, головна проблема впровадження технології відбитка браузера – можливість ідентифікації органічного трафіку. У парі із системами WebRTC та WASM, сайти зможуть визначати реальних користувачів за рахунок гіперперсоналізації. Більше того, експерти схиляються до того, що за технологією персоналізації стоїть майбутнього інтернету.
Персоналізація – що це?
У сфері електронної комерції, під персоналізацією мають на увазі збір та подальше використання інформації з кількох джерел для налаштування персональної видачі кожному покупцеві, що дозволить підвищити коефіцієнт конверсії і відбитися на рівні продажів навіть інтернет-магазинів, що «починають».
При цьому варто зазначити, що:
- Дані можуть збиратися як ззовні (пошукові системи, соцмережі, форуми), так і всередині сайту (переглянуті товари, додані до кошика тощо);
- Зібрана інформація може бути як явною (пости, лайки, репости і т.д.), так і неявною (час, проведений на сайті, вчинені дії і т.д.).
- Персоналізація може бути приписувальною (інформація збирається в обов’язковому порядку) або адаптивною (система фіксує частину дій користувача).
Додамо до цього аналіз поведінкових факторів і отримуємо максимально «витончений», але ненав’язливий спосіб «фільтрації» трафіку для пошуку ботів.
Чи позначиться це на парсингу?
Найімовірніше, цифровий відбиток браузера буде покладено в основу захисту від парсерів. Адже далеко не всі власники сайтів готові ділитися інформацією з конкурентами (навіть з урахуванням того, що вона є відкритою). Ідентифікація через персоналізацію створить серйозну перешкоду на шляху ботів-парсерів, які «витягують» загальнодоступні дані. Найімовірніше, розробникам таких сервісів доведеться «адаптуватися» під нові умови, а також врахувати всі помилки, які допускаються під час імітації звичайної поведінки користувача під час налаштування бота.
На даний момент, єдино можливий спосіб «обходу» такого захисту – створення скрипту, що повністю керується, здатного вести себе максимально органічно. Домогтися цього можна вже сьогодні, за допомогою нейромереж, що сканують поведінку користувачів, а також їх логіку прийняття рішень при звичайному серфінгу або переході на сайті з метою здійснення будь-якої покупки.
При цьому варто відзначити, що грамотне налаштування нейромережі дозволить імітувати відбиток браузера на основі даних, зібраних від мільйонів користувачів із тисяч різних сайтів за допомогою того ж парсингу. Іншими словами, майбутнє інструменту масового збору даних полягає в тому, щоб почати займатися цим прямо зараз.