Gen 1cookiesGen 2fingerprintingGen 3first-party CNAMEGen 4server-side tagsGen 5identifier graphseach generation responds to defenses against the prior one

Theo dõi trang web

11 đọc tối thiểuSự riêng tư

Theo dõi web đã phát triển qua nhiều thế hệ kỹ thuật. Cookies là bản gốc. Dấu vân tay của trình duyệt đã lấp đầy khoảng trống khi cookie bị hạn chế. Tính năng theo dõi phía máy chủ xoay quanh các trình chặn. Hệ sinh thái theo dõi ngày nay kết hợp tất cả các biểu đồ nhận dạng cộng với này để liên kết các thiết bị của bạn trong các ngữ cảnh. Hiểu được bức tranh toàn cảnh sẽ làm rõ lý do tại sao "duyệt web riêng tư" không mang lại nhiều hiệu quả.

Toàn bộ nội dung bài viết được cung cấp bằng tiếng Anh bên dưới.

Theo dõi web là danh mục kỹ thuật rộng rãi được sử dụng để xác định người dùng trên các lượt truy cập, trang web và thiết bị nhằm mục đích quảng cáo, phân tích, phát hiện gian lận và các mục đích khác. Thể loại này đã phát triển qua nhiều thời đại; hiểu các lớp cho thấy lý do tại sao trình chặn quảng cáo và trình duyệt bảo mật giúp ích nhưng không loại bỏ được vấn đề.

Generation 1: Cookies

The classic. Cookie của bên thứ ba đã cho phép theo dõi nhiều trang web trong nhiều thập kỷ. Xem bài viết cookie của chúng tôi. Safari đã chặn cookie của bên thứ ba theo mặc định vào năm 2017; Firefox năm 2019; Chrome bắt đầu hạn chế vào năm 2024. Kỷ nguyên cookie đang mờ dần nhưng vẫn tồn tại trên nhiều trang web.

Thế hệ 2: Lấy dấu vân tay của trình duyệt

Khi cookie bị hạn chế, trình theo dõi chuyển sang lấy dấu vân tay — nhận dạng người dùng bằng cách kết hợp cài đặt trình duyệt, GPU, phông chữ, kích thước màn hình, ngăn xếp âm thanh và các tín hiệu tương tự. Xem bài viết fingerprinting của chúng tôi. Ưu điểm dành cho trình theo dõi: nó hoạt động mà không lưu trữ bất cứ thứ gì trên thiết bị của người dùng, đánh bại các biện pháp phòng vệ dựa trên cookie.

Generation 3: Phân phát của bên thứ nhất và che giấu CNAME

Trackers phản hồi việc chặn cookie của bên thứ ba bằng cách phân phát từ miền riêng của trang web. Một trang web như example.com có ​​thể có bản ghi CNAME (analytics.example.com → Tracker.tracker-company.com) để các yêu cầu theo dõi xuất hiện bên thứ nhất đối với trình duyệt. Cookie được đặt trên Analytics.example.com là cookie của bên thứ nhất và tồn tại sau khi bị bên thứ ba chặn.

Các nhà cung cấp trình duyệt cũng đã phản hồi bằng cách hạn chế các cookie của bên thứ nhất khớp với các mẫu trình theo dõi đã biết. Trò mèo vờn chuột vẫn tiếp tục.

Generation 4: Theo dõi phía máy chủ

Thay vì chạy JS trên trình duyệt của người dùng, trang web sẽ gửi dữ liệu đến phía máy chủ của trình theo dõi sau khi người dùng truy cập. Thường có thẻ phía máy chủ của bên thứ nhất (Phía máy chủ Trình quản lý thẻ của Google, API chuyển đổi trên Facebook). Trình duyệt của người dùng chỉ nhìn thấy các yêu cầu thông thường của trang web; quá trình theo dõi diễn ra giữa máy chủ và trình theo dõi.

Điều này khó chặn phía máy khách vì trình duyệt không thấy hoạt động theo dõi đang diễn ra. Biện pháp bảo vệ nằm ở lớp chính sách và pháp lý chứ không phải kỹ thuật.

Thế hệ 5: Biểu đồ định danh

Theo dõi phức tạp nhất tổng hợp các số nhận dạng trên các nguồn:

  • Địa chỉ email → được băm vào các biểu đồ LiveRamp, Acxiom, Experian Marketing Services
  • Số điện thoại → được băm tương tự tra cứu
  • ID thiết bị → đã tham gia vào email/điện thoại thông qua sự kiện đăng nhập
  • Wi-Fi MAC, Bluetooth → đã tham gia vào dữ liệu hiện diện vật lý
  • Thẻ thanh toán → đã tham gia qua nền tảng phân tích giao dịch

Kết quả: một biểu đồ nhận dạng liên kết các thiết bị, email, điện thoại, thành viên gia đình, hộ gia đình, địa điểm bạn đến, những thứ bạn mua. Biểu đồ được cập nhật liên tục từ nhiều nguồn cấp dữ liệu; các thương hiệu truy vấn nó để tìm "cùng một người" trong các bối cảnh.

Các danh mục theo dõi chính

  • Mạng quảng cáo — Google, Meta, Microsoft, Amazon, TradeDesk. Cá nhân hóa quảng cáo.
  • Dịch vụ phân tích — Google Analytics, Adobe Analytics, Mixpanel, Amplitude. Phân tích việc sử dụng trang web.
  • Trình quản lý thẻ — Trình quản lý thẻ của Google, Tealium. Hệ thống vùng chứa dành cho trình theo dõi.
  • Social pixels — Facebook Pixel, Twitter Pixel, LinkedIn Insight. Phân bổ đa ngữ cảnh.
  • Thư viện vân tay — Vân tayJS, ThreatMetrix, Iovation. Phát hiện gian lận kiêm theo dõi.
  • Mạng liên kết — Skimlinks, RewardStyle, Impact. Mua ghi công.
  • HCông cụ sơ đồ bản đồ — FullStory, Hotjar, LogRocket. Phát lại phiên UX chi tiết.
  • Nhà môi giới dữ liệu — LiveRamp, Acxiom, Oracle Data Cloud. Độ phân giải nhận dạng đa ngữ cảnh.

Các biện pháp phòng vệ nào thực sự hoạt động

  • Trình duyệt bảo vệ theo dõi — Brave, Mullvad Browser, Tor Browser, Firefox với ETP nghiêm ngặt. Chặn các miền theo dõi đã biết và chống lấy dấu vân tay.
  • uBlock Origin với danh sách bộ lọc mặc định — chặn phần lớn trình theo dõi dựa trên cookie và JS.
  • DNS chặn cấp độ — Pi-hole, NextDNS, AdGuard DNS. Chặn ở lớp mạng cho tất cả các thiết bị.
  • Duyệt web được chứa trong — Bộ chứa nhiều tài khoản của Firefox, cách ly Safari trên mỗi trang web. Giới hạn việc sử dụng lại cookie trên nhiều trang web.
  • LGiới hạn đăng nhập tài khoản — luôn đăng xuất nếu có thể. Người dùng đã đăng nhập cung cấp cho trình theo dõi một mã định danh xác định.
  • iOS Tính minh bạch theo dõi ứng dụng từ chối IDFA. Hiệu quả cho việc theo dõi ứng dụng di động.
  • Ẩn danh mạng — VPN để đánh bại hoạt động theo dõi dựa trên IP, Tor để ẩn danh mạnh mẽ hơn.

  • Theo dõi phía máy chủ khi trang đích hợp tác với theo dõi
  • Độ phân giải biểu đồ danh tính dựa trên dữ liệu bạn đã chia sẻ (email của bạn ở 100 địa điểm)
  • Theo dõi thông qua các tài khoản hợp pháp mà bạn vẫn đăng nhập vào
  • OS đo từ xa cấp độ được gắn với tài khoản hệ điều hành

Để bảo vệ toàn diện, tất cả các lớp đều quan trọng. Trình duyệt bảo mật không có VPN vẫn rò rỉ dữ liệu cấp mạng; VPN không có trình duyệt bảo mật vẫn rò rỉ dấu vân tay của trình duyệt; cả hai không có tài khoản riêng vẫn bị rò rỉ danh tính. Sự kết hợp chính là điều mang lại hiệu quả.

Câu hỏi thường gặp

Theo dõi có vi phạm pháp luật không?
Hầu hết là không, với những cảnh báo đáng kể. GDPR yêu cầu sự đồng ý để theo dõi dữ liệu cá nhân của cư dân EU; CCPA yêu cầu quyền từ chối ở California. Nhiều khu vực pháp lý không có luật theo dõi toàn diện. Việc thực thi các luật hiện hành chưa đồng đều. Theo dõi là mặc định; ràng buộc là ngoại lệ.
Duyệt web riêng tư có ngừng theo dõi không?
Tại địa phương có, bên ngoài không. Duyệt web riêng tư ngăn trình duyệt của bạn lưu trữ trạng thái theo dõi. Nó không ngăn trình theo dõi nhận dạng bạn trong phiên đó thông qua dấu vân tay hoặc các kỹ thuật khác.
Trình duyệt nào tốt nhất để bảo vệ theo dõi?
Theo cài đặt mặc định: Brave là mạnh nhất, có sẵn lá chắn. Firefox với cấu hình user.js ETP và arkenfox nghiêm ngặt có thể so sánh được. Tor Browser có khả năng chống chịu cao nhất nhưng lại phá vỡ khả năng sử dụng đối với một số trang web. Safari hoạt động tốt trên iOS/macOS. Chrome không có tiện ích mở rộng là tệ nhất.
Trình chặn quảng cáo có đủ không?
Bước chính nhưng chưa hoàn thành. Trình chặn quảng cáo bắt các miền theo dõi đã biết thông qua danh sách bộ lọc; họ bỏ lỡ tính năng theo dõi phía máy chủ, theo dõi của bên thứ nhất và lấy dấu vân tay. Kết hợp với trình duyệt tập trung vào quyền riêng tư và VPN để bảo vệ theo lớp.
Việc khai tử cookie của bên thứ ba có khắc phục được việc theo dõi không?
Giảm một số lớp nhất định; theo dõi sẽ chuyển sang các kỹ thuật khác. Hộp cát về quyền riêng tư của Google đề xuất các lựa chọn thay thế cookie có mục đích tôn trọng quyền riêng tư; các nhà phê bình đặt câu hỏi về việc họ thực sự tôn trọng quyền riêng tư như thế nào. Động lực kinh tế cho việc theo dõi là rất lớn; mong đợi sự tiến hóa tiếp tục.
Giải thích về theo dõi trang web: Nhiều cách trang web nhận dạng bạn