การรั่วไหลของข้อมูลเมตา
การเข้ารหัสช่วยปกป้องเนื้อหาในการสื่อสารของคุณ ข้อมูลเมตา — คนที่คุณพูดคุยด้วย เมื่อใด นานแค่ไหน บ่อยแค่ไหน — มักจะปรากฏให้ใครก็ตามที่อยู่ในเส้นทางมองเห็นได้ ชุมชนข่าวกรองมีชื่อเสียงจากการพูดว่า "เราฆ่าผู้คนตามข้อมูลเมตา" และเหตุผลก็คือข้อมูลเมตามักจะเปิดเผยเกี่ยวกับคุณมากกว่าข้อความจริง
เนื้อหาบทความฉบับเต็มมีให้เป็นภาษาอังกฤษด้านล่าง
Metadata เป็นข้อมูลเกี่ยวกับข้อมูล ไม่ใช่เนื้อหาของการสื่อสาร แต่เป็นบริบทโดยรอบ สำหรับอีเมล ข้อมูลเมตาคือผู้ส่ง ผู้รับ หัวเรื่อง (บ่อยครั้ง) การประทับเวลา ขนาด และเส้นทางเส้นทาง สำหรับการโทร ใครโทรหาใคร เมื่อไร นานแค่ไหน สำหรับการท่องเว็บ เว็บไซต์ที่คุณเยี่ยมชม และระยะเวลาที่คุณอยู่ การเข้ารหัสจากต้นทางถึงปลายทางช่วยปกป้องเนื้อหา ข้อมูลเมตามักไม่มีการป้องกันหรือมีการป้องกันเพียงบางส่วนเท่านั้น
เหตุใดข้อมูลเมตาจึงเปิดเผยมาก
A ตัวอย่างที่มีชื่อเสียง: ลองจินตนาการว่าคุณไม่สามารถอ่านอีเมลของใครบางคนได้ แต่คุณสามารถเห็นส่วนหัวได้ คุณเห็นพวกเขา:
- ส่งอีเมลถึงทนายความด้านการหย่าร้าง
- ส่งอีเมลถึงตัวแทนอสังหาริมทรัพย์
- ส่งอีเมลถึงบริษัทรับขนย้าย
- ส่งอีเมลถึงนักสืบเอกชนในวันถัดไป
คุณไม่รู้ว่ามีอีเมลใดบ้างที่กล่าวถึง แต่คุณอาจอนุมานได้อย่างแม่นยำเกี่ยวกับ เกิดอะไรขึ้นในชีวิตของพวกเขา รูปแบบนี้เป็นลักษณะทั่วไป: รูปแบบการสื่อสารเปิดเผยความสัมพันธ์ กำหนดการ การตัดสินใจ และการเปลี่ยนแปลงสถานะแม้ว่าจะไม่มีเนื้อหาข้อความก็ตาม
ในกรณีที่ข้อมูลเมตารั่วไหลเกิดขึ้น
- ส่วนหัวอีเมล ผู้ส่ง ผู้รับ บางครั้งหัวเรื่อง เส้นทางทั้งหมดผ่านเมลเซิร์ฟเวอร์ (รับ: ส่วนหัว) timestamps.
- Phone records. Carrier logs แสดงทุกการโทรและ SMS — หมายเลข, ระยะเวลา, ตำแหน่ง ณ เวลาที่โทร.
- HTTPS Traffic. SNI (ไซต์ที่คุณเยี่ยมชม), ขนาดแพ็กเก็ต, รูปแบบการกำหนดเวลา Modern Encrypted Client Hello แก้ไข SNI บางส่วน ส่วนที่เหลือยังคงมองเห็นได้
- DNS ค้นหา ทุกโดเมนที่คุณเยี่ยมชมจะถูกสอบถามผ่าน DNS ซึ่งตัวแก้ไขจะมองเห็นได้แม้ในขณะที่การรับส่งข้อมูลจริงถูกเข้ารหัส
- แอปการส่งข้อความ เข้ารหัสเนื้อหาส่วนใหญ่ แต่เซิร์ฟเวอร์รู้ว่าใครส่งข้อความถึงใคร เมื่อใด การมองเห็นข้อมูลเมตาของ WhatsApp นั้นสูงกว่าการออกแบบของ Signal มาก
- ข้อมูลตำแหน่งของสมาร์ทโฟน แม้จะ "ปิด" บริการระบุตำแหน่งแล้วก็ตาม การแฮนด์ออฟเสาสัญญาณมือถือ คำขอตรวจสอบ Wi-Fi และ Bluetooth จะสแกนการแสดงตนและการเคลื่อนไหวที่รั่วไหล
- ภาพถ่ายและเอกสาร ข้อมูล EXIF รุ่นกล้อง พิกัด GPS เวลาที่ใช้ แม้แต่ภาพขนาดย่อของต้นฉบับ รูปภาพก่อนการแก้ไข
- บันทึกการไหลของเครือข่าย โครงสร้างพื้นฐานใดๆ ที่จัดการการรับส่งข้อมูลสามารถบันทึกว่าใครเชื่อมต่อกับใครและเมื่อใด
อะไร "การเข้ารหัสจากต้นทางถึงปลายทาง" ไม่ครอบคลุม
Signal — โดยทั่วไปถือว่าเป็นมาตรฐานทองคำสำหรับการส่งข้อความ E2E — ซ่อนเนื้อหาข้อความ แต่บริการยังคงอยู่ รู้:
- บัญชีของคุณมีอยู่แล้ว (ลงทะเบียนด้วยหมายเลขโทรศัพท์ เร็วๆ นี้จะเป็นชื่อผู้ใช้หรือไม่ก็ได้)
- คุณเข้าสู่ระบบในบางช่วงเวลาจากบาง IPs
- บัญชีของคุณติดต่อกับบัญชีเฉพาะอื่นๆ (แม้ว่าผู้ส่งที่ปิดผนึกจะซ่อนสิ่งนี้ไว้ในบางกรณี)
- ขนาดข้อความโดยประมาณและ timing
Signal จะย่อขนาดสิ่งที่เก็บไว้ให้เหลือน้อยที่สุด และสิ่งที่มีเพียงเล็กน้อยก็ถือว่าน้อยที่สุดในการตอบกลับหมายศาล แต่ข้อมูลเมตา มีอยู่ ในระดับโปรโตคอลแม้ว่าจะไม่ได้จัดเก็บก็ตาม
WhatsApp ใช้โปรโตคอลสัญญาณสำหรับเนื้อหา แต่เก็บข้อมูลเมตาได้มากกว่ามาก — รายชื่อติดต่อ การประทับเวลาของข้อความ การเป็นสมาชิกกลุ่ม ที่อยู่ IP — และข้อมูลเมตานั้นสามารถเข้าถึงได้โดย Meta และ (ผ่านหมายจับ) ต่อการบังคับใช้กฎหมาย
เมตาดาต้าของเครือข่าย
แม้จะมีเต็มรูปแบบ การเข้ารหัส (Tor, VPN ทั้งหมดนั้น) ข้อมูลเมตาที่ฝ่ายตรงข้ามสามารถมองเห็นได้ในตำแหน่งที่สามารถสังเกตเครือข่ายได้เพียงพอ ได้แก่:
- รูปแบบการรับส่งข้อมูล — เมื่อคุณออนไลน์ เมื่อคุณใช้งานอยู่
- ปริมาณการรับส่งข้อมูล — ดาวน์โหลดจำนวนมาก = วิดีโอ ช่วงเวลาเล็ก ๆ = แชท ฯลฯ
- กำหนดเวลาการมาถึงระหว่างแพ็คเก็ต — บางครั้งก็เพียงพอที่จะสแกนลายนิ้วมือ แอปพลิเคชันหรือเว็บไซต์เฉพาะ
- ความสัมพันธ์ระหว่างเซสชัน — ผู้ใช้คนเดียวกันบนหลายแพลตฟอร์มที่สามารถระบุได้ด้วยรูปแบบกิจกรรม
ยิ่งหน้าต่างสังเกตของฝ่ายตรงข้ามมีขนาดใหญ่เท่าใด ข้อมูลเมตาก็จะยิ่งมีความหมายมากขึ้นเท่านั้น ในอดีตฝ่ายตรงข้ามทั่วโลก (NSA, GCHQ) มีความสามารถนี้กับ Tor — การสังเกตเจ้าหน้าที่รักษาความปลอดภัยทางเข้าและโหนดทางออกพร้อมกันทำให้เกิดความสัมพันธ์ของการรับส่งข้อมูล
สิ่งที่คุณสามารถทำได้เกี่ยวกับ metadata
Defenses ตามลำดับความซับซ้อน:
- ใช้สัญญาณแทน SMS/WhatsApp สำหรับการสนทนาที่ละเอียดอ่อน การลดขนาดข้อมูลเมตาให้ดีขึ้น
- ตัดข้อมูล EXIF ก่อนแชร์รูปภาพ แพลตฟอร์มส่วนใหญ่จะตัดการอัปโหลดแต่ไม่เสมอไป เครื่องมืออย่าง exiftool ให้คุณทำได้ก่อน
- ใช้ DNS ที่เข้ารหัส (DoH, DNSCrypt) เพื่อให้ตัวแก้ไขของคุณไม่เห็นข้อความค้นหา ดูบทความ DoH ของเรา.
- VPN สำหรับข้อมูลเมตาระดับ ISP ซ่อนการค้นหาโดเมน ปลายทาง รูปแบบการรับส่งข้อมูลจาก ISP ของคุณ — ย้ายความไว้วางใจไปยัง VPN
- Tหรือเพื่อการปกป้องข้อมูลเมตาเครือข่ายที่แข็งแกร่งยิ่งขึ้น เอาชนะการสังเกตการณ์เครือข่ายท้องถิ่นส่วนใหญ่ ความเสี่ยงบางประการต่อศัตรูทั่วโลกยังคงอยู่
- การแบ่งส่วน ข้อมูลระบุตัวตนที่แตกต่างกันสำหรับบริบทที่แตกต่างกัน โดยมีอุปกรณ์และบัญชีแยกกัน การป้องกันเดี่ยวที่มีประสิทธิภาพสูงสุดสำหรับสถานการณ์ที่มีภัยคุกคามสูง
- วินัยในการปฏิบัติงาน รูปแบบการสื่อสารที่คาดการณ์ได้รั่วไหลมากกว่ารูปแบบที่ระมัดระวัง ผสมผสานช่วงเวลาของกิจกรรมที่มีความละเอียดอ่อนเข้ากับกิจกรรมธรรมดาๆ
Content Surveillance ที่ไม่สมมาตรจะปรับขนาดเป็นเส้นตรงตามความพยายาม ยิ่งคุณอ่านมากเท่าไร คุณก็จะรวบรวมเนื้อหาได้มากขึ้นเท่านั้น ข้อมูลเมตาปรับขนาดได้ดีขึ้นมากเนื่องจากมีขนาดเล็ก มีโครงสร้าง และค้นหาได้ "X คุยกับใครเมื่อสัปดาห์ที่แล้ว" เป็นการสืบค้นฐานข้อมูล "สิ่งที่ X พูดถึงเมื่อสัปดาห์ที่แล้ว" จำเป็นต้องอ่านข้อความหลายพันข้อความ
ความไม่สมดุลนี้คือสาเหตุที่รัฐบาลทั่วโลกผลักดันให้มีกฎหมายการเก็บรักษาข้อมูลเมตามากกว่ากฎหมายการอ่านเนื้อหา ข้อมูลเมตามีราคาถูกกว่าในการสำรวจในวงกว้าง และมักจะเปิดเผยได้เพียงพอ
สิ่งที่ต้องคำนึงถึง
สำหรับผู้ใช้ทั่วไป: การรั่วไหลของข้อมูลเมตานั้นมีอยู่จริงแต่ส่วนใหญ่เป็นเพียงการตกแต่งเท่านั้น ผู้ให้บริการเห็นรูปแบบกิจกรรมของคุณ พวกเขาสร้างรายได้ผ่านการโฆษณา นั่นคือการต่อรองราคาที่คุณยอมรับแล้วโดยการใช้บริการฟรี
สำหรับผู้ใช้ที่มีรูปแบบภัยคุกคามที่รัดกุมกว่า เมตาดาต้ามักจะเป็นที่ที่มีข้อมูลการระบุตัวตนจริงอยู่ การปกป้องเนื้อหาโดยไม่สนใจข้อมูลเมตาถือเป็นข้อผิดพลาดทั่วไปและร้ายแรง
คำถามที่พบบ่อย
- Signal ซ่อนข้อมูลเมตาหรือไม่
- ดีกว่ามากที่สุด Signal ลดสิ่งที่รู้ให้เหลือน้อยที่สุดโดยการออกแบบ — ผู้ส่งที่ปิดผนึกจะซ่อนว่าใครส่งข้อความถึงใครจากเซิร์ฟเวอร์ในหลาย ๆ กรณี บริษัทตอบสนองต่อหมายศาลอย่างมีชื่อเสียงโดยแทบไม่ต้องเปิดเผยเลย มันไม่ได้ซ่อนทุกอย่าง (การมีอยู่ของบัญชี, เวลาเข้าสู่ระบบ, IP) แต่มันดีกว่าทางเลือกอื่นอย่างเห็นได้ชัด
- VPN สามารถปกป้องข้อมูลเมตาของฉันได้หรือไม่?
- มันซ่อนจุดหมายปลายทางและรูปแบบการรับส่งข้อมูลจาก ISP ของคุณ โดยจะย้ายความน่าเชื่อถือของข้อมูลเมตาไปยังผู้ให้บริการ VPN ซึ่งตอนนี้จะเห็นสิ่งที่ ISP ของคุณจะเห็น เพื่อการปกป้องข้อมูลเมตาที่ดีขึ้น Tor; สำหรับเครือข่ายมัลติฮอปที่ดีที่สุด สำหรับสถานการณ์ความขัดแย้งในองค์กร Tails หรือ Qubes บวกกับระเบียบวินัย
- HTTPS รั่วไหลข้อมูลเมตาใด
- IP ปลายทาง ซึ่งมักเป็น SNI (ชื่อโฮสต์) ขนาดแพ็คเก็ตและเวลา ไคลเอนต์ที่เข้ารหัส Hello กำจัด SNI; ส่วนที่เหลือสามารถสังเกตได้สำหรับทุกคนที่อยู่ในเส้นทาง HTTPS ปกป้องเนื้อหา ไม่ใช่รูปแบบการไหลของเครือข่าย
- ฉันควรดึงข้อมูล EXIF ออกจากรูปภาพของฉันหรือไม่
- ใช่ สำหรับรูปภาพที่คุณแชร์แบบสาธารณะ มักจะมีพิกัด GPS ของตำแหน่งที่ถ่ายภาพ แพลตฟอร์มหลักส่วนใหญ่จะยกเลิกการอัปโหลด แต่ก็ไม่เสมอไป ทั้ง iOS และ Android มีตัวเลือกในการแชร์โดยไม่มีข้อมูลตำแหน่ง การปอกแบบแมนนวล (Image Magick, exiftool) ช่วยให้ควบคุมได้มากขึ้น
- เหตุใดหน่วยข่าวกรองจึงใช้ข้อมูลเมตา?
- มันปรับขนาด การอ่านทุกข้อความของทุกเป้าหมายเป็นไปไม่ได้ การวิเคราะห์กราฟการโทรและรูปแบบการสื่อสารคือ "คุณสามารถฆ่าคนได้โดยอาศัยข้อมูลเมตา" (ทั่วไป Michael Hayden, 2014) รวบรวมความเป็นจริงในการปฏิบัติงาน - รูปแบบที่เปิดเผยเพียงพอสำหรับการตัดสินใจกำหนดเป้าหมายที่มีความมั่นใจสูงโดยไม่ต้องอ่านเนื้อหา