GeoIP
Hầu hết mọi trang web và ứng dụng đều cá nhân hóa theo vị trí và hầu như không ai trong số họ yêu cầu GPS của bạn làm điều đó. Họ tra cứu địa chỉ IP của bạn trong cơ sở dữ liệu GeoIP và suy ra bạn đang ở đâu. Việc hiểu cách xây dựng tra cứu đó — và tại sao nó thường xuyên xảy ra lỗi — giải thích rất nhiều về lý do tại sao Internet lại có cảm giác khác biệt ở những nơi khác nhau.
Toàn bộ nội dung bài viết được cung cấp bằng tiếng Anh bên dưới.
GeoIP là thuật ngữ chung để dịch địa chỉ IP thành dự đoán về vị trí thực tế của người dùng. Đầu ra của tra cứu GeoIP thường là một quốc gia, thường là thành phố, đôi khi là một cặp vĩ độ/kinh độ với bán kính chính xác đã nêu. Nó cung cấp mọi thứ từ giới hạn địa lý nội dung đến phát hiện gian lận cho đến cài đặt ngôn ngữ trên trang bạn đang đọc.
Nơi dữ liệu đến từ
GeoIP Cơ sở dữ liệu được xây dựng từ nhiều nguồn hợp nhất với nhau:
- Phân bổ Cơ quan đăng ký Internet khu vực (RIR). ARIN (Bắc Mỹ), RIPE NCC (Châu Âu), APNIC (Châu Á-Thái Bình Dương), LACNIC (Châu Mỹ Latinh) và AFRINIC (Châu Phi) công bố các khối mà họ đã chỉ định cho nhà khai thác mạng nào. Điều này cung cấp bản đồ thô cấp quốc gia miễn phí. Dữ liệu
- WHOIS. Mỗi nhà khai thác mạng khai báo khu vực địa lý nơi một khối được sử dụng. Thường chính xác ở cấp quốc gia, thường cực kỳ sai ở cấp thành phố.Thông báo định tuyến
- BGP. Vị trí một khối được định tuyến sẽ đưa ra gợi ý rõ ràng về nơi nó thực sự được sử dụng.
- Hoạt động thăm dò. Các nhà cung cấp cơ sở dữ liệu chạy các phép đo độ trễ từ nhiều điểm thuận lợi; giới hạn tốc độ ánh sáng trong thời gian khứ hồi giới hạn khoảng cách địa lý.
- Dữ liệu do người dùng đóng góp. Một số cơ sở dữ liệu mua hoặc chấp nhận dấu vân tay từ các ứng dụng cũng có GPS, ánh xạ IP → tọa độ thực. Nguồn cấp dữ liệu
- ISP. Các ISP lớn đôi khi xuất bản bản đồ địa lý cho phân bổ của riêng họ trực tiếp.
Tại sao GeoIP thường sai
Vấn đề cơ bản: Địa chỉ IP là mã thông báo định tuyến, không phải mã thông báo địa lý. Không có yêu cầu các IP liền kề phải ở những nơi liền kề. Một số cơ chế làm giảm độ chính xác:
- CGNAT. Nhà cung cấp dịch vụ di động và một số ISP cố định chia sẻ một IP công cộng cho hàng nghìn người dùng, đôi khi ở các thành phố khác nhau. Xem bài viết CGNAT của chúng tôi.
- Cổng công ty. Một công ty đa quốc gia có một điểm đầu ra duy nhất ở Frankfurt hiển thị là người Đức ngay cả khi nhân viên ở Singapore.
- VPN IP thoát. Theo thiết kế, điểm đến sẽ nhìn thấy vị trí của VPN chứ không phải địa chỉ IP user's.
- IP phân bổ lại khối. Mạng mua, bán và tái sử dụng các khối; khối từng là ISP của Bangalore ngày nay có thể là trung tâm dữ liệu Frankfurt. Cơ sở dữ liệu có độ trễ so với thực tế hàng tuần đến hàng tháng. Do đó, độ chính xác ở cấp độ Thành phố của
Chỉ mang tính tương đối. Độ chính xác ở cấp quốc gia thường vào khoảng 95–99%; tiểu quốc gia (tiểu bang/khu vực) giảm xuống còn 50–80%; cấp thành phố giảm hơn nữa, đặc biệt là bên ngoài Bắc Mỹ và Châu Âu.
Cách các nhà cung cấp cạnh tranh
Một số nhà cung cấp thương mại bán cơ sở dữ liệu GeoIP — IP2Location, ipinfo.io, DB-IP, Digital Element và các nhà cung cấp khác. Chúng phân biệt về tần suất cập nhật, đảm bảo độ chính xác, các trường bổ sung (ISP, ASN, loại kết nối, phát hiện ẩn danh) và giá cả. Nhiều người xuất bản cả cấp "lite" miễn phí với dữ liệu cấp quốc gia và cấp trả phí với thành phố, mã bưu chính và bán kính chính xác.
Các nguồn dữ liệu mở bao gồm các ấn phẩm miễn phí của RIR, loạt GeoLite của MaxMind (có yêu cầu ghi công) và tiêu đề HTTP cf-ipcountry của Cloudflare cho mọi thứ được ủy quyền thông qua chúng.
Beyond location: Dữ liệu GeoIP+
Các dịch vụ "GeoIP" hiện đại trả về nhiều hơn tọa độ. Các trường phong phú hơn:
- ASN — số hệ thống tự trị (nhà điều hành mạng), thường hữu ích hơn vị trí để phát hiện gian lận. Xem thư mục ASN của chúng tôi.
- Loại kết nối — dân cư, di động, doanh nghiệp, trung tâm dữ liệu, giáo dục. IP của trung tâm dữ liệu hầu như luôn có nghĩa là một máy chủ chứ không phải con người.
- Cờ ẩn danh — "IP này là một lối ra VPN đã biết" hoặc "IP này là một lối thoát Tor đã biết". Được sử dụng bởi các dịch vụ phát trực tuyến và các nhóm lừa đảo.
- Thông tin về mối đe dọa — nguồn tấn công gần đây, nguồn thư rác, thành viên botnet.
GeoIP được sử dụng cho
Ba nhóm chính:
- Cá nhân hóa nội dung. Ngôn ngữ mặc định, tiền tệ, múi giờ, biểu ngữ quy định, nội dung bị giới hạn địa lý. Thông thường, người dùng có thể ghi đè.
- Geo-restriction. Dịch vụ phát trực tuyến kiểm tra quốc gia rõ ràng của người dùng đối với giấy phép nội dung. Các trang web cờ bạc và hiệu thuốc trực tuyến thực thi các ranh giới quy định theo cách tương tự.
- Phát hiện gian lận và lạm dụng. Giao dịch mua từ IP dân cư ở quốc gia nơi người mua tuyên bố sinh sống là được; nghi ngờ là cùng một giao dịch mua được định tuyến qua một IP của trung tâm dữ liệu cách đó nửa vòng trái đất.
Định vị người dùng cá nhân theo độ chính xác ở mức đường phố. GeoIP cho bạn biết một khu vực, đôi khi là một thành phố; nó không ghim bạn vào một tòa nhà trừ khi bạn cũng rò rỉ tọa độ GPS thông qua trình duyệt của mình. Ngay cả việc nhắm mục tiêu quảng cáo chính xác của Google cũng đến từ việc kết hợp địa lý IP với lịch sử tài khoản đăng nhập và dấu vân tay của trình duyệt, chứ không chỉ từ IP. Những người dùng quan tâm đến quyền riêng tư không muốn thành phố của mình bị hiển thị nên sử dụng VPN — vị trí rõ ràng của IP thoát sẽ trở thành của họ.
Câu hỏi thường gặp
- GeoIP chính xác đến mức nào ở cấp thành phố?
- Rất biến đổi. Ở các khu đô thị đông đúc ở Bắc Mỹ và Châu Âu, thường trong phạm vi vài dặm. Ở các vùng nông thôn hoặc ở các quốc gia có ISP hợp nhất, cơ sở dữ liệu có thể trỏ đến một thành phố mặc định cho cả nước. Luôn coi GeoIP cấp thành phố là một gợi ý chứ không phải sự thật.
- Tôi có thể định vị được địa chỉ IP của mình nếu tôi sử dụng VPN không?
- Tra cứu địa lý IP trả về vị trí của lối ra VPN chứ không phải vị trí của bạn. Nếu điểm đến tương quan với các tín hiệu khác - dấu vân tay của trình duyệt, ứng dụng được trang bị GPS, lịch sử tài khoản đã đăng nhập - thì họ vẫn có thể biết bạn là ai. Chỉ riêng địa lý IP đã bị đánh bại bởi bất kỳ VPN hiện đại nào.
- Tất cả các cơ sở dữ liệu GeoIP có đồng ý không?
- Không. Hai cơ sở dữ liệu thường không thống nhất ở cấp thành phố và đôi khi ở cấp quốc gia đối với các trường hợp biên (mạng càng khó hiểu thì càng khác nhau). Đối với các quyết định mang tính rủi ro cao, các dịch vụ thường tham khảo nhiều cơ sở dữ liệu và sử dụng câu trả lời theo đa số.
- Cơ sở dữ liệu GeoIP cập nhật bao lâu một lần?
- Các nhà cung cấp thương mại cập nhật hàng tuần hoặc hàng ngày; bậc miễn phí thường là hàng tháng. Việc phân bổ và tái sử dụng khối IP mới thường xuất hiện trong các cơ sở dữ liệu lớn trong vòng một tuần, nhưng những động thái kỳ lạ (một khối được bán từ lục địa này sang lục địa khác) có thể mất nhiều thời gian hơn.
- Tôi có thể chặn tín hiệu GeoIP của mình khỏi một trang web không?
- Không trực tiếp - mọi kết nối TCP đều có IP nguồn và đích luôn có thể tra cứu nó. Cách thay đổi kết quả GeoIP là thay đổi IP nguồn, đó là điều mà VPN thực hiện. Chế độ riêng tư của trình duyệt không ảnh hưởng đến GeoIP vì chúng không thay đổi kết nối mạng cơ bản.