Пожар в ЦОД Южной Кореи уничтожил безвозвратно государственные данные

В начале октяборя в Южной Корее произошел уже не первый инцидент в одном ЦОДов, где хранились важные государственные и дугие данные. До этого 15 октября 2024 года в городе Панчхон, провинция Кёнсан-Пукто. Пожар вспыхнал в дата-центре, принадлежащем компании SK C&C, который использовался для хранения и обработки данных множества государственных и частных организаций.

  • Причина: Официально названной причиной стала вспышка литий-ионной батареи в системе бесперебойного питания (ИБП). Возгорание произошло в подземном помещении, где были расположены аккумуляторные батареи.
  • Развитие событий: Огонь и особенно плотный едкий дым быстро распространились по серверным помещениям. Несмотря на то, что открытое пламя было потушено относительно быстро, дым нанес катастрофические повреждения чувствительному серверному оборудованию.
  • Масштаб разрушений: Физически сгорело помещение с батареями, но главный ущерб был нанесен не огнем, а сажей и коррозией от дыма, которые вывели из строя огромное количество серверных стоек.

Последствия: Почему данные уничтожены "безвозвратно"

Этот инцидент стал примером катастрофического сбоя в системе резервного копирования и восстановления.

  1. Уничтожение первичных данных: Огнем и дымом были повреждены или уничтожены основные (продакшн) серверы.
  2. Критический провал с бэкапами: Самое шокирующее — оказалось, что резервные копии данных также хранились в том же самом дата-центре, либо в соседнем помещении, либо на отдельных серверах в том же здании. В результате пожар уничтожил не только основные данные, но и их бэкапы.
  3. Кто пострадал:
    • Национальный архив услуг здравоохранения (NHIS): Безвозвратно утеряны данные о медицинских осмотрах и лечениях примерно 17 миллионов южнокорейцев (около трети населения страны). Это записи с 2014 по 2023 год, включая данные о диагностике, назначенных лекарствах и процедурах.
    • Компании-партнеры: Были уничтожены данные ряда частных компаний, которые использовали услуги этого ЦОД.
    • Репутационный и финансовый ущерб: Колоссальный удар по репутации как SK C&C, так и государственных органов, отвечающих за сохранность критически важных данных. Компаниям грозят многомиллионные иски.

Вывод: Отсутствие географически удаленного резервного копирования привело к тотальной потере данных.

Меры по предотвращению подобных проблем

Этот случай стал суровым уроком для всего мира в области управления данными и аварийного восстановления. Ключевые меры, которые необходимо применять для предотвращения подобных катастроф:

1. Стратегия резервного копирования "3-2-1-1-0" (Расширенное "Правило 3-2-1")

  • 3 копии данных (основная + две резервных).
  • 2 разных типа носителей (например, HDD и ленточные накопители или облако).
  • 1 копия хранится вне площадки (off-site), в географически удаленном месте.
  • 1 копия хранится в режиме "только для чтения" или на воздушном зазоре (air-gapped), чтобы защитить ее от ransomware-атак и случайного удаления.
  • 0 ошибок при проверке восстановления. Регулярные тесты восстановления данных из бэкапов — критически важная процедура.

2. Регулярное тестирование процедур аварийного восстановления (Disaster Recovery)
* Наличие плана — это только половина дела. Его нужно регулярно отрабатывать на практике, чтобы убедиться, что в случае реальной катастрофы данные можно восстановить в приемлемые сроки (RTO - Recovery Time Objective) и с приемлемыми потерями (RPO - Recovery Point Objective).

3. Физическое разделение и изоляция критической инфраструктуры
* Помещения с системами ИБП и аккумуляторами должны быть физически изолированы от серверных залов противопожарными перегородками, иметь собственную систему вентиляции и пожаротушения.
* Резервные копии не должны храниться в том же здании, что и основные данные.

4. Современные системы пожаротушения и обнаружения возгорания
* Системы газового пожаротушения (например, на основе инертных газов), которые тушат пожар, не повреждая оборудование, в отличие от воды или пены.
* Системы раннего обнаружения дыма (аспирационные системы), которые могут засечь возгорание на самой ранней стадии, еще до появления открытого пламени.

5. Тщательный аудит и сертификация ЦОД
* Государственные и критически важные данные должны размещаться только в дата-центрах, имеющих соответствующие международные сертификаты надежности (например, Tier III или IV по классификации Uptime Institute), которые гарантируют высокий уровень отказоустойчивости и безопасности.

Пожар в Южной Корее — это не столько история о пожаре, сколько история о системной халатности и провале в управлении рисками. Он наглядно показал, что наличие резервных копий бессмысленно, если они не защищены от единой точки отказа. Этот инцидент заставит многие компании и правительства по всему миру пересмотреть свои стратегии резервного копирования и аварийного восстановления.