ADVERTISEMENT

‘628억’ 기상청 슈퍼컴, 올해만 3번 고장

김주영 의원 “예보 안정성 흔들려”
“안정적인 운영체계 구축 나서야”


기상이상으로 예보의 중요성이 커지는 가운데 핵심 인프라인 기상청 슈퍼컴퓨터가 올해 들어서만 세 차례 고장난 것으로 드러났다.

슈퍼컴퓨터 시스템 장애는 기상정보 제공 지연, 예보 정확도 저하, 재난 대응 차질로 이어질 수 있어 안정적 운영체계 구축에 나서야 한다는 지적이 나온다.

국회 기후에너지환경노동위원회 소속 김주영 더불어민주당(경기 김포시갑) 의원실이 국가기상슈퍼컴퓨터센터에서 제출받은 ‘슈퍼컴퓨터 고장 및 오류 현황’에 따르면 최근 5년간 슈퍼컴퓨터 핵심 부품인 스토리지 서버 고장이 총 8건으로 나타났다. 이 가운데 3건이 올해 발생했다.

국가기상슈퍼컴퓨터는 전 세계에서 수신되는 각종 기상관측 자료를 바탕으로 수치예보모델을 운영해 미래 날씨를 예측하고, 이를 기상청 예보관과 유관기관에 신속히 제공하는 핵심 장비다. 현재 기상청은 1999년 1호기 도입 이후, 2019년부터 5호기를 운영하고 있다.

그러나 설치 이후 장애 및 오류 현황을 보면 ▷2021년 2건(디스크 교체 후 저장장치 재구성 중 스토리지 장애·스토리지 서버 비정상 작동)▷2022년 2건(스토리지 서버 비정상 작동·계산시스템 일부 노드 비정상 종료)▷2024년 1건(스토리지 서버 비정상 작동) ▷2025년 9월기준 3건(9스토리지 서버 비정상 작동·일부 스토리지 서버 비정상 작동 2회 등 총 8건의 장애가 발생했다.

특히 주요 설비 고장도 지속적으로 발생한 것으로 조사됐다. 2022년 냉동기 1호기 (압축기 내부 SCR 모듈 및 소프트스타터 PCB 불량 교체, 수리기간 11일)를 비롯해 지난해 ▷냉동기 2호기 (냉수 출구온도센서 불량 교체, 24시간 이내) ▷냉동기 1호기 (압축기 발생으로 원제조사 미국 수리, 289일) ▷무정전전원장치 (정류기 및 IGBT PCB 불량교체, 24시간 이내) ▷냉동기 4호기 (냉동기 팽창밸브 컨트롤러 파라미터값 재설정, 3일) 등에서 고장이 발생했다. 기상청은 주요설비 고장 시 예비용 냉동기 전환 운영 및 무정전전원장치(UPS) 병렬운영 등으로 슈퍼컴퓨터 운영에는 영향 없었다는 입장이다.

하지만 수리비와 유지보수 비용은 세금으로 충당된다. ‘국가기상슈퍼컴퓨터센터 기반시설 통합유지보수 용역’ 제안요청서에 따르면, 고장 수리 비용은 월 유지보수 금액의 20% 이하일 경우 계약상대자가 부담하고, 이를 초과하는 비용은 기상청이 부담하도록 규정돼 있다.

장애 신고가 접수되면 관련 기술자가 즉시 현장에 출동해 슈퍼컴퓨터 운영에 직접적인 영향이 있는 설비의 경우 1일 이내, 자동제어나 보안설비 등 간접 설비의 경우 3일 이내에 복구를 완료해야 한다. 이를 초과할 경우 초과 일수에 해당하는 금액만큼 월 지급대가에서 공제하도록 명시돼 있다.

이에따라 지난해에는 냉동기 1호기 압축기 3번 고장으로 인해 원제조사인 미국에서 수리를 진행했지만 총 수리비용 4300만원 중 2000만원은 기상청이 부담했다. 수리 지연(288일)에 따른 위약금 3368만원은 국고 세입으로 조치됐다.

김주영 의원은 “돌발적 폭우, 태풍, 이상기상이 늘어나는 지금, 예보 시스템의 안정성은 그 어느 때보다 중요한 상황”이라며 “슈퍼컴퓨터는 국민 안전을 지탱하는 ‘기후안전망’의 핵심 인프라이다”고 강조했다. 이어 “기상청은 반복되는 장애 원인을 면밀히 분석하고, 안정적인 운영체계 구축에 나서야 한다”고 지적했다. 배문숙 기자