Удаление метаданных
В каждую сделанную вами фотографию встраиваются GPS-координаты, модель камеры, временная метка и версия программного обеспечения. В каждый написанный вами документ включается имя автора, история изменений и подписи программного обеспечения. Удаление этих метаданных перед обменом файлами — один из наиболее эффективных методов обеспечения конфиденциальности, который почти никто не применяет постоянно — и это источник бесчисленных случайных деанонимизаций.
Полный текст статьи на английском языке представлен ниже.
Очистка метаданных — это практика удаления встроенной описательной информации из файлов перед их публикацией. Категории метаданных, которые наиболее важны для конфиденциальности:
- EXIF-данные на фотографиях — координаты GPS, модель и серийный номер камеры, точная отметка времени, программное обеспечение, иногда исходное неотредактированное изображение в виде миниатюры
- Метаданные документа Office — имя автора, организация, история редактирования, отредактированный текст, который все еще можно восстановить, ветки комментариев, свойства документа
- PDF метаданные — то же, что и Office, плюс программное обеспечение производителя, иногда встроенные шрифты, которые идентифицируют создающую систему
- Метаданные аудио/видео — записывающее устройство, местоположение GPS, программное обеспечение, иногда исходный источник
- Файл программного обеспечения метаданные — версия компилятора, флаги сборки, исходные пути, раскрывающие структуру каталогов компьютера разработчика
Классические инциденты
- Местоположение Джона Макафи, раскрытое в 2012 году, когда Vice опубликовал фотографию с неповрежденными данными EXIF, показывающими координаты GPS, пока он прятался от Власти Белиза. Его местонахождение было обнаружено в течение нескольких часов.
- Многие политические деятели получили информацию о местоположении или графике работы с помощью фотографии EXIF.
- Анонимные активисты деанонимизировались, когда EXIF сохранил серийный номер камеры, который фигурировал в других менее анонимных сообщениях. фотографии.
- Субъекты журналистских расследований, идентифицированные через поля автора документа Word при утечке документа.
- Репозитории исходного кода, раскрывающие внутренние пути к машинам разработчика через встроенную двоичную информацию.
Какие современные платформы do
Многие платформы теперь удаляют метаданные при загрузке:
- Facebook, Instagram, Twitter/X, LinkedIn обычно удаляют EXIF GPS из загруженных фотографий.
- WhatsApp сохраняет часть EXIF, но по умолчанию удаляет GPS.
- Direct общие общие файлы (вложения электронной почты, службы обмена файлами) обычно not удаляет метаданные.
Поведение настолько непоследовательно, что на него не следует полагаться. Удалить метаданные в источнике.
Инструменты для удаления
Фото:
- iOS / macOS Фотографии: Поделиться → Параметры → Отключить местоположение раньше обмен.
- Android: зависит от приложения галереи; в современном Google Фото есть пункт «Удалить данные о местоположении» в меню «Поделиться».
- exiftool (командная строка) — канонический инструмент.
exiftool -all= image.jpgудаляет все. - GIMP, Photoshop: Опции сохранения включают удаление метаданных.
- Онлайн-инструменты: существует, но предоставляет доступ к файлу третьей стороне, что противоречит цели конфиденциальной информации. content.
PDFs:
- Adobe Acrobat: Файл → Свойства → Описание, а также функция очистки документа для тщательной проверки. Stripping.
- pdftk может update_info для очистки полей.
- qpdf --linearize с --remove-page-piece-info и аналогичными options.
Документы Office:
- Word/Excel/PowerPoint: Файл → Информация → Проверить документ → Инспектор документов (Windows) или эквивалент на Mac.
- Сначала сохраните в формате PDF, если вам не нужна возможность редактирования, а затем удалите PDF.
Generic:
- MAT2 (анонимизация метаданных) Toolkit) — обрабатывает множество типов файлов, версий командной строки и графического интерфейса.
- Tails OS по умолчанию включает MAT2.
Ошибка редактирования
Распространенная ошибка: затемнение текста в PDF-файле черным цветом прямоугольник. Текст все еще находится внизу; выбор и копирование показывают это. Отчет Калипари США и Италии за 2003 год и несколько других правительственных редакций потерпели неудачу именно по этой причине. Для правильного редактирования необходимо:
- Использовать специальные инструменты редактирования (Adobe Acrobat Redact, qpdf с --decrypt, аналогичный)
- Убедиться, что текст действительно удален, а не просто скрыт визуально
- Подумайте о том, чтобы сделать снимок экрана отредактированной версии и использовать только изображение — текст будет уничтожен. возможность восстановления
Проверка удаленных файлов
После удаления проверьте результат:
exiftool image.jpg— список оставшихся метаданныхpdfinfo file.pdf— показывает метаданные PDF- Щелкните правой кнопкой мыши → Свойства (Windows) или «Получить информацию» (macOS) отобразит метаданные, видимые ОС
Stripping то, что не было снято полностью, хуже, чем вообще не снято, потому что это дает ложную уверенность.
То, что упускается даже при тщательном удалении
- Само содержимое. Фотография может определить местоположение по ориентирам, видимым на изображении; Документ Office может содержать идентифицирующие обороты фраз. Удаление метаданных не затрагивает содержимое.
- Хеши изображений. Если вы поделились другими фотографиями с той же камеры с другим идентификатором, шаблоны шума датчика изображения могут повторно идентифицироваться даже после удаления EXIF.
- Артефакты сжатия и артефакты перекодирования может определить исходный источник программное обеспечение.
Для обычного использования
Самая полезная привычка: прежде чем публиковать любую фотографию в социальных сетях где угодно, удалите EXIF или воспользуйтесь функцией платформы, чтобы сделать это при загрузке. Для сценариев с более высокими ставками (журналистика, активизм) перед публикацией используйте MAT2 или его эквивалент. Для совместного использования корпоративных документов Инспектор документов Office должен быть стандартным элементом контрольного списка.
Часто задаваемые вопросы
- Публикация в Instagram удаляет EXIF?
- В основном да — Instagram удаляет GPS и большую часть идентифицируемого EXIF при загрузке. Они сохраняют некоторые метаданные для собственного использования. Не полагайтесь на него для контента с высокими ставками; разденьте источник, чтобы быть уверенным.
- Нужно ли удалять метаданные из фотографий, отправленных друзьям?
- Случайный обмен — обычно без вреда. Да, если речь идет о чем-то конфиденциальном или о чем-то, о чем можно будет рассказать дальше. Фотографии, сделанные дома, содержат домашний GPS; фотографии, сделанные на работе, содержат рабочий GPS. В совокупности за долгую историю это рисует модель движения.
- Можно ли восстановить удаленные метаданные?
- После правильной очистки — нет, данные исчезли из файла. Для восстановления потребуется доступ к копиям, которые не были удалены (оригинал на вашем телефоне, резервные копии в облаке и т. д.). Удаление является односторонним для конкретного обрабатываемого файла.
- Какой одиночный инструмент лучше всего?
- exiftool для фотографий и многих других форматов — всеобъемлющий, поддерживающий сценарии и хорошо поддерживаемый. MAT2 для более широких типов файлов, включая PDF и Office. Сочетание того и другого охватывает практически все.
- Является ли удаление метаданных ошибочным?
- Некоторые рабочие процессы зависят от метаданных (инструменты каталогизации, системы архивирования). В этом случае сохраняйте оригиналы и раздевайте их только при предоставлении внешнего доступа. При публичном обмене личными фотографиями по умолчанию они удаляются, если у вас нет особой причины хранить метаданные.