GeoIP
Майже кожен веб-сайт і програма персоналізує місцеположення, і майже жоден із них не запитує ваш GPS для цього. Вони шукають вашу IP-адресу в базі даних GeoIP і визначають, де ви знаходитесь. Розуміння того, як побудований цей пошук — і чому він так часто помиляється, — багато пояснює, чому Інтернет виглядає по-різному в різних місцях.
Повний текст статті подано англійською мовою нижче.
GeoIP — це загальний термін для перекладу IP-адреси на припущення щодо фізичного розташування користувача. Результатом пошуку GeoIP зазвичай є країна, часто місто, іноді пара широта/довгота із заявленим радіусом точності. Він забезпечує все: від геообмеження вмісту до виявлення шахрайства та мовних налаштувань на сторінці, яку ви читаєте.
Звідки надходять дані
Бази даних GeoIP створюються з кількох джерел, об’єднаних разом:
- Розподіл регіонального Інтернет-реєстру (RIR). ARIN (півн. Америка), RIPE NCC (Європа), APNIC (Азіатсько-Тихоокеанський регіон), LACNIC (Латинська Америка) і AFRINIC (Африка) публікують, які блоки вони призначили яким операторам мережі. Це дає приблизну карту на рівні країни безкоштовно.
- WHOIS дані. Кожен оператор мережі оголошує географічний регіон, де використовується блок. Часто точні на рівні країни, часто дуже неправильні на рівні міста.
- BGP маршрутизаційні оголошення. Звідки маршрутизується блок, дає чіткі підказки про те, де він насправді використовується.
- Активне дослідження. Постачальники баз даних проводять вимірювання затримки з багатьох точок огляду; обмеження швидкості світла на час подорожі туди й назад обмежує географічну відстань.
- Дані, надані користувачем. Деякі бази даних купують або приймають відбитки пальців від програм, які також мають GPS, відображаючи IP → справжні координати. власний розподіл безпосередньо.
Чому GeoIP часто помиляється
Фундаментальна проблема: IP-адреси є маркерами маршрутизації, а не географічними маркерами. Немає вимоги, щоб суміжні IP-адреси знаходилися в суміжних місцях. Кілька механізмів знижують точність:
- CGNAT. Оператори мобільного зв’язку та деякі стаціонарні Інтернет-провайдери спільно використовують одну публічну IP-адресу для тисяч користувачів, іноді в різних містах. Див. нашу статтю CGNAT.
- Корпоративні шлюзи. Багатонаціональна компанія з єдиною точкою виходу у Франкфурті відображається як німець, навіть якщо працівник перебуває в Сінгапурі.
- IP-адреси виходу з VPN. За задумом пункт призначення бачить Розташування VPN, а не користувача. Перерозподіл блоків
- IP. Мережі купують, продають і змінюють призначення блоків; блок, який раніше був бангалорським інтернет-провайдером, сьогодні може бути центром обробки даних у Франкфурті. Бази даних відстають від реальності на тижні або місяці.
Точність на рівні міста є приблизною. Точність на рівні країни зазвичай становить близько 95–99%; субкраїна (штат/регіон) падає до 50–80%; на рівні міста падає далі, особливо за межами Північної Америки та Європи.
Як постачальники конкурують
Кілька комерційних постачальників продають бази даних GeoIP — IP2Location, ipinfo.io, DB-IP, Digital Element та інші. Вони розрізняються за частотою оновлення, гарантією точності, додатковими полями (ISP, ASN, тип підключення, виявлення анонімайзера) і ціною. Багато хто публікує як безкоштовний «спрощений» рівень із даними на рівні країни, так і платні рівні з містом, поштовим індексом і радіусом точності.
Відкриті джерела даних включають безкоштовні публікації RIR, серію GeoLite від MaxMind (з вимогами до атрибуції) та HTTP-заголовок Cloudflare cf-ipcountry для всього, що надсилається через проксі їх.
Поза межами розташування: дані GeoIP+
Сучасні служби «GeoIP» повертають більше, ніж координати. Більш багаті поля:
- ASN — номер автономної системи (оператор мережі), часто більш корисний, ніж розташування для виявлення шахрайства. Дивіться наш каталог ASN.
- Тип підключення — домашнє, мобільне, бізнес, центр обробки даних, освіта. IP-адреси центру обробки даних майже завжди означають сервер, а не людину.
- Прапорці анонімайзера — «ця IP-адреса є відомим виходом VPN» або «ця IP-адреса є відомим виходом Tor». Використовується потоковими службами та групами шахраїв.
- Дані про загрози — джерело останніх атак, джерело спаму, учасник ботнету.
Для чого використовується GeoIP
Три основні сімейства:
- Персоналізація вмісту. Мова за замовчуванням, валюта, часовий пояс, нормативні банери, географічно обмежений вміст. Зазвичай користувач може змінити.
- Geo-restriction. Служби потокового передавання перевіряють очевидну країну користувача на відповідність ліцензіям на вміст. Сайти азартних онлайн-ігор і аптек однаково забезпечують дотримання нормативних обмежень.
- Виявлення шахрайства та зловживань. Покупка від домашньої IP-адреси в країні, де покупець стверджує, що живе, цілком допустима; та сама покупка, спрямована через IP-адресу центру обробки даних на півдорозі світу, є підозрілою.
Що вона не може зробити надійно
Визначити місцезнаходження окремого користувача з точністю до рівня вулиці. GeoIP повідомляє вам регіон, іноді місто; він не прикріпить вас до будівлі, якщо ви також не передасте GPS-координати через свій браузер. Навіть точне націлювання реклами Google відбувається завдяки поєднанню географічної IP-адреси з історією входу в обліковий запис і відбитками пальців браузера, а не лише IP-адресою. Користувачі, які піклуються про конфіденційність і не хочуть, щоб їхнє місто було видимим, повинні використовувати VPN — явне IP-адреса виходу стає їхнім.
Часті запитання
- Наскільки точний GeoIP на рівні міста?
- Дуже мінлива. У густонаселених районах Північної Америки та Європи, часто в межах кількох миль. У сільській місцевості або в країнах із консолідованими інтернет-провайдерами база даних може вказувати на місто за замовчуванням для всієї країни. Завжди сприймайте GeoIP на рівні міста як підказку, а не факт.
- Чи можна знайти мене за моїм IP-адресою, якщо я використовую VPN?
- Географічний пошук IP повертає місцезнаходження виходу VPN, а не ваше. Якщо пункт призначення співвідноситься з іншими сигналами — відбитком пальця в браузері, програмою з GPS, історією входу в обліковий запис — вони все одно можуть знати, хто ви. Будь-який сучасний VPN переможе саму географічну адресу IP.
- Чи всі бази даних GeoIP погоджуються?
- Ні. Дві бази даних часто не узгоджуються на рівні міста, а іноді й на рівні країни для крайніх випадків (чим незрозуміліша мережа, тим більше розбіжностей). Для прийняття серйозних рішень служби часто звертаються до кількох баз даних і використовують відповідь більшості.
- Як часто оновлюються бази даних GeoIP?
- Комерційні постачальники оновлюються щотижня або щодня; безкоштовні рівні зазвичай щомісяця. Нові розподіли IP-блоків і перепрофілювання зазвичай з’являються в основних базах даних протягом тижня, але екзотичні переміщення (блок, що продається з одного континенту на інший) можуть зайняти більше часу.
- Чи можу я заблокувати свій сигнал GeoIP від веб-сайту?
- Не напряму — кожне TCP-з’єднання має IP-адресу джерела, і адресат завжди може її знайти. Спосіб змінити результат GeoIP – це змінити вихідний IP, що робить VPN. Приватні режими браузера не впливають на GeoIP, оскільки вони не змінюють підключення до мережі.