تجريد البيانات الوصفية
تتضمن كل صورة تلتقطها إحداثيات نظام تحديد المواقع العالمي (GPS)، وطراز الكاميرا، والطابع الزمني، وإصدار البرنامج. يتضمن كل مستند تكتبه اسم المؤلف وسجل التحرير وتوقيعات البرنامج. يعد تجريد هذه البيانات التعريفية قبل مشاركة الملفات أحد ممارسات الخصوصية الأعلى فعالية والتي لا يقوم بها أي شخص تقريبًا باستمرار - وهو مصدر لعدد لا يحصى من عمليات إلغاء الهوية غير المقصودة.
يتم توفير نص المقالة الكامل باللغة الإنجليزية أدناه.
تجريد البيانات الوصفية هي ممارسة إزالة المعلومات الوصفية المضمنة من الملفات قبل مشاركتها. فئات البيانات التعريفية الأكثر أهمية بالنسبة للخصوصية: بيانات
- EXIF على الصور - إحداثيات نظام تحديد المواقع العالمي (GPS)، وطراز الكاميرا والرقم التسلسلي، والطابع الزمني الدقيق، والبرنامج، وأحيانًا الصورة الأصلية غير المحررة كصورة مصغرة
- البيانات التعريفية لمستندات المكتب - اسم المؤلف، والمؤسسة، وتاريخ التحرير، والنص المنقح الذي لا يزال قابلاً للاسترداد، وسلاسل التعليقات، والمستند Properties
- PDF البيانات الوصفية - نفس Office، بالإضافة إلى برنامج المنتج، أحيانًا الخطوط المضمنة التي تحمل بصمات نظام الإنشاء
- Audio/video metadata - جهاز التسجيل، موقع GPS، البرنامج، وأحيانًا المصدر الأصلي
- البيانات الوصفية لملف البرنامج - إصدار المترجم، بناء الأعلام ومسارات المصدر التي تكشف عن بنية الدليل لجهاز المطور
الحوادث الكلاسيكية
- تم الكشف عن موقع John McAfee في 2012 عندما نشر Vice صورة تحتوي على بيانات EXIF سليمة تُظهر إحداثيات نظام تحديد المواقع العالمي (GPS) بينما كان مختبئًا من سلطات بليز. تم تحديد موقعه خلال ساعات.
- تم الكشف عن مواقع أو جداول زمنية للعديد من الشخصيات السياسية من خلال الصورة EXIF.
- نشطاء مجهولون تم إخفاء هويتهم عندما احتفظت EXIF بالرقم التسلسلي للكاميرا الذي ظهر في صور أخرى أقل مجهولة.
- الصحافة الاستقصائية تم تحديد المواضيع من خلال حقول مؤلف مستند Word عندما تم تسريب المستند.
- مستودعات التعليمات البرمجية المصدر التي تكشف مسارات جهاز المطور الداخلي من خلال المعلومات الثنائية المضمنة.
ما تفعله الأنظمة الأساسية الحديثة
تقوم العديد من الأنظمة الأساسية الآن بتجريد البيانات التعريفية منها التحميل:
- Facebook وInstagram وTwitter/X وLinkedIn عادةً ما يزيل نظام EXIF GPS من الصور التي تم تحميلها. يحتفظ
- WhatsApp ببعض ملفات EXIF ولكنه يزيل نظام تحديد المواقع العالمي (GPS) افتراضيًا. عادةً ما تقوم مشاركات الملفات المباشرة (مرفقات البريد الإلكتروني وخدمات مشاركة الملفات)
- بحذف not metadata.
السلوك غير متناسق بدرجة كافية بحيث لا يجب الاعتماد عليه. إزالة البيانات الوصفية من المصدر.
أدوات للتجريد
Photos:
- iOS / macOS الصور: مشاركة → خيارات → تبديل الموقع خارج قبل مشاركة.
- Android: يختلف حسب تطبيق المعرض؛ تحتوي صور Google الحديثة على "إزالة بيانات الموقع" في قائمة المشاركة.
- exiftool (سطر الأوامر) - الأداة الأساسية.
exiftool -all= image.jpgيزيل كل شيء. - GIMP، Photoshop: تتضمن خيارات الحفظ تجريد البيانات التعريفية.
- الأدوات عبر الإنترنت: موجود ولكنه يعرض الملف لطرف ثالث - مما يبطل الغرض من الملفات الحساسة content.
PDFs:
- Adobe Acrobat: ملف → خصائص → الوصف، بالإضافة إلى ميزة تعقيم المستند للتجريد الشامل.
- pdftk يمكن تحديث_المعلومات لتفريغ الحقول.
- qpdf --linearize مع --remove-page-piece-info والخيارات المماثلة.
Office المستندات:
- Word/Excel/PowerPoint: File → Info → Inspect Document → Document Inspector (Windows) أو ما يعادله على Mac.
- احفظ بتنسيق PDF أولاً إذا لم تكن بحاجة إلى إمكانية التحرير - ثم قم بإزالة الملف PDF.
عام:
- MAT2 (مجموعة أدوات إخفاء بيانات التعريف) - يتعامل مع العديد من أنواع الملفات وإصدارات سطر الأوامر وواجهة المستخدم الرسومية.
- Tails يتضمن OS MAT2 بشكل افتراضي.
مأزق التنقيح
خطأ شائع: حجب النص في ملف PDF باستخدام مستطيل أسود. النص لا يزال في الأسفل؛ الاختيار والنسخ يكشف ذلك. لقد فشل تقرير كاليباري الأمريكي الإيطالي لعام 2003 والعديد من التنقيحات الحكومية الأخرى بهذه الطريقة بالضبط. يتطلب التنقيح الصحيح ما يلي:
- استخدام أدوات تنقيح مخصصة (Adobe Acrobat Redact، qpdf مع --decrypt، مشابه)
- التحقق من إزالة النص بالفعل، وليس فقط حجبه بصريًا
- النظر في التقاط لقطة شاشة للنسخة المنقحة واستخدام الصورة فقط - يؤدي إلى تدمير النص قابلية الاسترداد
التحقق من الملفات التي تم تجريدها
بعد التجريد، تحقق من النتيجة:
exiftool image.jpg- يسرد البيانات التعريفية المتبقيةpdfinfo file.pdf- يعرض بيانات تعريف PDF- - النقر بزر الماوس الأيمن فوق → خصائص (Windows) أو الحصول على معلومات (macOS) يعرض بيانات التعريف المرئية لنظام التشغيل
التجريد الذي لم يتم بشكل كامل الشريط أسوأ من عدم التجريد على الإطلاق لأنه يعطي ثقة زائفة.
ما يتم تفويته حتى مع التجريد الشامل
- المحتوى نفسه. يمكن للصورة تحديد الموقع عبر المعالم المرئية في الصورة؛ يمكن أن يحتوي مستند Office على عبارات محددة. لا تعالج إزالة البيانات الوصفية المحتوى.
- تجزئات الصورة. إذا قمت بمشاركة صور أخرى من نفس الكاميرا بهوية مختلفة، فيمكن إعادة التعرف على أنماط ضوضاء مستشعر الصورة حتى مع تجريد EXIF.
- عناصر الضغط وإعادة تشفير العناصر يمكنها بصمة المصدر الأصلي البرمجيات.
للاستخدام العادي
العادة الأكثر فائدة: قبل نشر أي صورة على وسائل التواصل الاجتماعي، في أي مكان، قم بإزالة ملف EXIF أو استخدم خيار النظام الأساسي للقيام بذلك عند التحميل. بالنسبة للسيناريوهات ذات المخاطر العالية (الصحافة والنشاط)، استخدم MAT2 أو ما يعادله في كل شيء قبل النشر. بالنسبة لمشاركة مستندات الشركة، يجب أن يكون Office Document Inspector عنصرًا قياسيًا في قائمة التحقق.
الأسئلة المتداولة
- هل النشر على Instagram يزيل EXIF؟
- في الغالب نعم - يقوم Instagram بإزالة نظام تحديد المواقع العالمي (GPS) ومعظم ملفات EXIF المحددة عند التحميل. يحتفظون ببعض البيانات الوصفية لاستخدامهم الخاص. لا تعتمد عليه في المحتوى عالي المخاطر؛ الشريط في المصدر للتأكد.
- هل أحتاج إلى تجريد البيانات الوصفية من الصور المرسلة إلى الأصدقاء؟
- المشاركة غير الرسمية - عادة لا ضرر. بالنسبة لأي شيء حساس أو يمكن مشاركته بشكل أكبر، نعم. الصور الملتقطة في المنزل تحتوي على نظام تحديد المواقع العالمي (GPS) المنزلي؛ الصور الملتقطة في العمل تحتوي على نظام تحديد المواقع العالمي (GPS) الخاص بالعمل. مجمعة عبر تاريخ طويل، وهذا يرسم نمط الحركة.
- هل يمكن استعادة البيانات الوصفية التي تم تجريدها؟
- بمجرد تجريدها بشكل صحيح، لا، ستختفي البيانات من الملف. سيتطلب الاسترداد الوصول إلى النسخ التي لم يتم تجريدها (النسخة الأصلية الموجودة على هاتفك، والنسخ الاحتياطية السحابية، وما إلى ذلك). التجريد هو اتجاه واحد للملف المحدد الذي تتم معالجته.
- ما هي أفضل أداة منفردة؟
- أداة exiftool للصور والعديد من التنسيقات الأخرى - شاملة وقابلة للبرمجة وتتم صيانتها جيدًا. MAT2 لأنواع الملفات الأوسع بما في ذلك PDF وOffice. مزيج من كلا يغطي كل شيء تقريبا.
- هل تجريد البيانات الوصفية خطأ على الإطلاق؟
- تعتمد بعض مسارات العمل على البيانات الوصفية (أدوات الكتالوج، وأنظمة الأرشفة). بالنسبة لهؤلاء، احتفظ بالنسخ الأصلية وقم بتجريدها فقط عند مشاركتها خارجيًا. بالنسبة للمشاركة العامة للصور الشخصية، قم بالإعداد الافتراضي للتجريد ما لم يكن لديك سبب محدد للاحتفاظ بالبيانات الوصفية.