본문 바로가기
일반상식

카카오 데이터 센터 화재 | 카톡 먹통 그리고 임대 외부 데이터 센터

by 얌얌제주 | 제주 먹스타그램 2022. 10. 17.
반응형

 

[데이터 센터]
제가 이전에 다니던 회사의 데이터 센터에는 화재, 습기, 환기 등의 관제가 전자동으로 모니터링되는 스마트 관제 시스템이 있었고 다중으로 화재를 보호하는 장치와 상시 대기하는 직원이 상주하고 있었습니다.
또한 정전으로 인하여 불시에 전원이 끊길때를 대비하여 서버나 컴퓨터 및 주변 장치에 전력을 공급하는 고용량의 무정전 전원 장치(UPS)가 준비되어 있고 이 장치들은 데이터 센터를 운영하는 데에는 기본인 장비들입니다.


[카카오톡 서비스]
첫 번째로 주말 시외로 가려고 카카오 네비를 켰으나 작동하지 않아 업데이트가 되지 않은 차량의 내비게이션을 사용하였습니다. 카카오톡 역시 당연히 작동하지 않아 원하는 문자나 사진을 친구들에게 전송할 수 없어서, 오랜만에 일반 텍스트 문자를 보내 친구와 약속시간과 장소를 확인하였습니다.

목적지까지 이동하는 동안 음악을 듣기 위해 멜론 어플을 가동하였으나 이용할 수 없어 불편했습니다.
블로그 글을 올리고 댓글을 달기 위해 티스토리 앱을 켰지만 동작하지 않았습니다.

저녁을 먹고 금액 정산하려고 했으나 카카오 페이가 작동하지 않아 
계좌번호를 확인하여 이체하고 나니 우리의 삶에 카카오가 깊숙이 들어와 있구나라는 생각을 하였고 카카오로 시작해서 카카오로 마무리되는 하루였습니다.


[카카오톡 장애 원인]
카카오톡에 장애가 발생한 원인은 카카오 서버가 있는 판교 sk c&c 데이터 센터 화재 때문입니다. 
원인은 데이터 센터 지하 3층의 무정전 전원 장치인 UPS의 배터리 랙에서 스파크가 발생하여 화재로 번졌으며,

물로 화재를 진압해야 하는 상황이기 때문에 누전에 위험이 있으니 전체 전원을 차단하였다고 합니다.
그러다 보니 카카오와 연동되어 있는 모든 서비스들이 전체적으로 동작하지 않았던 것입니다.


[데이터 센터 이중화 작업]
보통 IT 계열 회사들은 화재나 테러 등의 사태를 대비하여 메인 데이터 센터와 일정 거리 떨어진 곳에 예비 데이터 센터를 두어 카카오 사태처럼 메인 데이터센터에 화재가 날 경우 예비 데이터 센터를 통해 바로 서비스를 복구할 수 있도록 설계하는 것은 기본 중에 기본이다. 카카오와 같은 대형 회사가 예비 데이터 센터가 없다는 것은 말이 안 되고  예비 데이터 센터를 메인으로 전환하는 과정에서


시스템의 가동이 문제였을 거라고 보고 있습니다. 보통 오래 걸려도 반나절도 안되어 복구해야 하는 게 일반적이나 사흘이 지나도록 완전하게 복구가 되지 않았다는 건 시스템 전반적으로 문제가 있다고 볼 수 있으며 수십조의 돈을 버는 회사가 고객정보와 금융시스템과 서비스등 중요한 정보를 다루고 운영하는 데이터 센터를 임대해서 사용하고 있다는것 또한 이러한 결과를 초래했다고 볼수 있습니다.


[마치며]
카카오톡은 이미 2018년부터 몇 차례 전산장애를 일으켰으니 이번 데이터 센터의 화재는이미 예견된 결과였으며, 사전에 충분히 예방할 수도 있었던 일이었으나 너무나도 안일한 대처를 하고 있다는 지적을 받고 있습니다.

현재 카카오를 이용하는 서비스 이용자만도 4500만 명이 넘는 상황에서 전산 센터의 화재로 서비스가 중단되었고 그것이 불가항력이었다고 주장하기에는 그 대응이 너무 미흡해 보이는 대처였습니다. 이번 카카오 사태로 인해 독과점의 위험을 체감하며 카카오를 대체할 대안이 필요하다고 생각하게 되었습니다. 주변에서도 다들 그렇게 느끼는지 주말과 월요일 사흘간 라인 어플에 친구로 등록되는 사람 또한 늘었습니다. 한국 1등 소셜 기업 카카오가 회사 몸집만 키우는데만 급급하고 전산장애 대응은 이처럼 미흡하다면 다른 건실한 회사와 시스템들에도 눈여겨봐야 할 때가 아닐까 생각해봅니다.

반응형

댓글