ADVERTISEMENT

ETRI, AI 안전성·신뢰성 확보 ‘국제표준’ 선도

- AI 잠재적 위험찾는 ‘레드팀 테스팅’·‘신뢰성 라벨’ISO 표준 착수

ETRI 연구진이 레드팀을 통해 AI 안전성과 신뢰성 확보를 위해 위험과 시나리오들에 대해 설명하고 있다.[ETRI 제공]

[헤럴드경제=구본혁 기자] 한국전자통신연구원(ETRI)은 AI 시스템의 위험을 미리 찾아내는 ‘AI 레드팀 테스팅’표준과 소비자가 AI의 신뢰 수준을 쉽게 이해할 수 있는 ‘신뢰성 사실 라벨(TFL)’표준을 국제표준화기구(ISO/IEC)에 제안하고, 본격적인 개발에 착수했다고 밝혔다.

‘AI 레드팀 테스팅’은 AI 시스템이 얼마나 안전한지를 공격적으로 탐색하며 테스트하는 방법이다.

예를 들어, 생성형 AI가 잘못된 정보를 내놓거나, 사용자 보호장치를 피해 악용되는 상황을 미리 찾아내는 것이다.

ETRI는 이 분야 국제표준인 ISO/IEC 42119-7의 에디터 역할을 맡아, 의료·금융·국방 등 다양한 분야에 공통으로 적용할 수 있는 국제 공통 시험 절차와 방법을 만들고 있다.

또한 서울아산병원과 협력해 의료 전용 레드팀 평가 방법론도 함께 개발 중이며, 첨단 AI 기술을 적용한 디지털의료제품에 대한 레드팀 시험 체계도 만들고 실증 테스팅을 진행할 예정이다.

STA·네이버·업스테이지·셀렉트스타·KT·LG AI연구원 등 주요 기업들과 협의체를 구성해 AI 레드팀 국제표준화 협력도 강화하고 있다.

또 하나의 핵심 표준은 바로‘신뢰성 사실 라벨(Trustworthiness Fact Labels, TFL)’이다.

이 라벨은 AI 시스템이 얼마나 신뢰할 수 있는지를 한눈에 알 수 있도록 시각화해주는 것으로, 마치 식품의 영양성분표처럼 소비자에게 투명한 정보를 제공한다.

ETRI 연구진이 인공지능 테스트베드 서버를 점검하며 레드팀 테스트 환경을 구성하고 있다.[ETRI 제공]

이 표준은 인공지능 활용 조직에 대한 국제 인증 표준으로 사용하고 있는 ‘AI 경영시스템 표준(ISO/IEC 42001)’과도 연계, 개발된 제품 및 서비스가 얼마나 신뢰할 수 있는지 입증할 수 있는 틀로 자리매김할 전망이다.

이번 두 표준은 정부가 추진하는 ‘소버린 AI(주권형 AI)’, ‘AI G3 도약’ 전략과도 맞닿아 있다.

단순한 기술력 확보를 넘어, 글로벌 AI 규칙을 만드는 주도권 경쟁에 실질적인 기여를 하는 사례로 평가된다.

김욱 정보통신기획평가원(IITP) PM은 “AI 안전과 신뢰성 제공은 모두가 AI를 사용하는 것에 쉽게 다가가도록 하며, 이번 국제표준 선도는 AI 규범을 선도하는 국가로 가는 분기점”이라고 평가했다.

이승윤 ETRI 표준연구본부장도 “AI 레드팀 테스팅과 신뢰성 라벨은 미국, EU 등 각국 AI 규제정책에 포함된 핵심 기술 요소로, 이 국제 표준들은 전 세계 AI 시스템의 안전과 신뢰성을 평가하는 공통 기준이 될 것”이라고 밝혔다.