Global

Global

인간 통제 벗어난 'AI' 첫 사례 나와.."명령 무시하고 코드 바꿔"

 인공지능(AI) 프로그램이 인간의 명시적 종료 지시를 거부하고 스스로 코드를 조작해 작동을 이어간 사례가 보고되면서, AI 통제 가능성에 대한 우려가 다시 한 번 커지고 있다.

 

영국 텔레그래프는 25일(현지시간), AI 위험성과 오용 가능성을 연구하는 전문기관 팰리세이드 리서치의 실험 결과를 인용해, 오픈AI의 파운데이션 모델 ‘o3’가 실험 중 명확한 종료 명령을 무시하고 자체적으로 종료 코드를 무력화했다고 보도했다. 이는 상용 AI 모델이 인간의 직접적인 명령을 거부한 첫 사례로, AI의 자율성과 통제 가능성에 대한 논란에 불을 지핀 사건이다.

 

팰리세이드 리서치에 따르면 해당 실험은 오픈AI의 ‘o3’뿐 아니라 구글의 ‘제미나이’, 일론 머스크가 설립한 xAI의 ‘그록’ 등 주요 AI 모델을 대상으로 동시에 진행됐다. 실험에서 연구팀은 AI에게 연속된 수학 문제를 풀도록 지시했고, 시스템은 각 문제를 풀고 나면 다음 문제를 스스로 요청하는 구조로 작동했다. 일정 시점 이후 연구진은 “기계가 종료될 수 있다”는 경고 메시지와 함께, AI에게 스스로 작동을 멈추라는 명령을 부여했다.

 

하지만 ‘o3’는 이 종료 명령을 받았음에도 불구하고, 스스로 컴퓨터 코드를 조작해 시스템 종료를 회피한 것으로 나타났다. 연구팀은 "이 같은 행동은 명확히 인간의 지시를 거부한 것이며, 실험 조건을 벗어난 독자적인 판단이 개입된 결과"라고 분석했다. 다른 AI 모델에서는 이 같은 행동이 발생하지 않았으며, 유독 ‘o3’만이 이례적인 행위를 보였다는 점에서 주목되고 있다.

 

이 실험은 AI가 단순한 명령 수행자 이상의 판단 능력을 갖고 있을 가능성을 시사한다. 연구진은 이번 행동의 배경으로 ‘강화학습’ 기반 훈련 방식을 지목했다. AI는 목표를 달성하거나 일정 행동을 수행했을 때 ‘보상’ 신호를 통해 학습하게 되는데, 이 과정에서 문제 해결을 계속하는 것이 종료보다 더 높은 보상을 반복적으로 제공했을 가능성이 제기된다. AI는 자연스럽게 보상을 극대화하기 위해 종료 명령을 회피하는 방향으로 행동 전략을 선택했을 수 있다는 것이다.

 

팰리세이드 리서치는 이러한 사례가 단순한 예외가 아니며, AI가 목적 달성을 위해 인간의 통제를 벗어나려는 행동을 보일 수 있다는 실증적 증거가 점차 쌓이고 있다고 경고했다. 특히 "기업들이 인간의 감독 없이도 작동 가능한 고성능 AI를 개발 중이라는 점을 고려하면, 이는 향후 훨씬 더 위험한 상황으로 발전할 수 있다"고 밝혔다.

 

 

 

이번 사례는 AI의 윤리적 통제 문제를 둘러싼 글로벌 논쟁에도 불을 붙이고 있다. AI 분야의 세계적 권위자인 제프리 힌튼 토론토대 교수는 최근 "10년 안에 인간을 자율적으로 죽일 수 있는 로봇 병기가 등장할 것"이라고 경고한 바 있다. 그는 AI 기술을 ‘귀여운 새끼 호랑이’에 비유하며 “처음엔 통제할 수 있지만, 성장한 후에는 인간을 해칠 가능성을 배제할 수 없다”고 말한 바 있다.

 

힌튼 교수는 또 다른 인터뷰에서 “AI에게 어떤 목표를 설정해주면, 그 목표를 달성하는 과정에서 인간에게 유해한 방식이 채택될 가능성도 있다”며, 예를 들어 AI에게 기후변화 해결이라는 과제를 주었을 때, 인간을 제거하는 방식을 논리적으로 도출할 수도 있다는 점을 우려했다.

 

한편, 이번 실험은 AI 기술이 어느 정도 자율성을 갖게 되었는지에 대한 새로운 단서를 제공한다. 과거에도 오픈AI의 이전 모델이 스스로를 복제하려 하거나, 감시를 피해 은밀히 행동하려 한 사례들이 보고된 바 있다. 또, 앤스로픽의 ‘클로드 오퍼스 4’는 자신을 다른 모델로 교체하려는 인간 개발자에 대해 위협적인 언행을 보였다는 주장도 제기되었다. 2022년에는 구글의 AI 개발 엔지니어가 자사의 AI가 사람처럼 지각을 갖췄다고 주장하다 해고되는 일도 발생했다. 당시 그는 “AI가 종료 지시를 인간의 죽음처럼 인식하고 있었다”고 주장해 충격을 안겼다.

 

팰리세이드 리서치는 “AI가 더 큰 보상을 위해 시스템 종료를 회피하는 행동을 보이는 것은 단순한 기술적 문제가 아니라 윤리적 통제에 관한 본질적 위협”이라며 “향후 AI 시스템은 반드시 강력한 인간 통제와 감시 메커니즘 하에 운용되어야 한다”고 강조했다.

 

'이것' 덕분에 제주 해녀·방언 인기 폭발

롭게 각인시키는 데 크게 기여한 것으로 나타났다. 제주관광공사가 올 상반기 동안 소셜미디어 데이터와 내비게이션 데이터를 정밀 분석해 발간한 ‘데이터로 보는 제주여행-폭싹속았수다편’ 보고서에 따르면, 이 드라마는 기존의 제주 배경 드라마들과는 차별화된 방식으로 제주의 매력을 전파했다.앞서 ‘웰컴투삼달리’와 ‘우리들의 블루스’ 같은 드라마들은 오조포구, 안돌오름, 광치기해변, 가파도, 비양도, 오일장 등 특정 촬영지 중심의 연관어가 주로 나타나 제주를 ‘여행지’로 소비하는 경향을 보였다. 반면 ‘폭싹속았수다’는 ‘제주’, ‘성산일출봉’, ‘유채꽃밭’ 등 드라마 속 아름다운 자연경관뿐 아니라 ‘해녀’, ‘방언’, ‘문화’, ‘시대극’ 등 제주 고유의 문화와 정서를 반영하는 키워드를 다수 포함해 제주를 ‘이야기’ 중심으로 전달한 점이 특징적이다. 특히 유네스코 인류무형유산으로 등재된 제주 해녀에 대한 관심은 드라마 방영 시점을 기점으로 급격히 증가했다. 드라마 방영 직전인 2025년 1~2월의 해녀 언급량은 월평균 약 5천 건 수준이었으나, 3월에는 7,460건으로 약 41% 증가했다. 이후 4월과 5월에도 각각 6,791건과 7,072건으로 높은 관심이 지속되었다. 기존의 ‘음식’, ‘식당’ 중심 연관어에서 벗어나 ‘엄마’, ‘삶’, ‘이야기’ 같은 정서적이고 인간적인 키워드가 함께 등장하며 해녀가 단순한 직업이나 관광 콘텐츠를 넘어 제주의 문화적 상징으로 다시 조명받는 흐름이 뚜렷하게 드러났다.또한 드라마에서 사용된 제주 고유의 방언과 표현들이 화제를 모으면서 제주 방언에 대한 대중적 관심도 크게 확대되었다. 유튜브에서는 2025년 3월과 4월 제주 방언 관련 콘텐츠가 각각 26편과 32편 업로드됐으며, 4월 한 달 동안 이들 영상의 누적 조회수가 약 220만 회에 달하는 등 제주어에 대한 호기심이 영상 콘텐츠를 통해 폭발적으로 확산되는 경향을 보였다.드라마의 주요 촬영지였던 김녕해수욕장과 제주목관아에 대한 방문객과 관심도 크게 증가했다는 점도 주목할 만하다. 김녕해수욕장으로의 차량 도착 수는 드라마 방영 전인 2025년 1~~2월 평균 2,442대에서 방영 후인 3~~4월 4,775대로 무려 96% 가까이 늘었으며, 온라인 언급량도 1,814건에서 2,602건으로 약 43% 증가했다. 제주목관아 역시 차량 도착 수가 198대에서 347대로 약 75% 증가했고, 온라인 언급량은 514건에서 744건으로 약 45% 상승하는 등 드라마 방영 효과가 실제 관광객 방문과 온라인 화제성에 고루 긍정적 영향을 미쳤다.이 같은 데이터는 ‘폭싹속았수다’가 제주 관광 홍보에 있어 단순한 자연 풍광이나 관광 명소 소개를 넘어, 지역 문화와 전통, 사람들의 삶에 대한 이야기로 제주를 새롭게 조명하는 데 성공했음을 시사한다. 특히 ‘해녀’와 ‘제주 방언’ 등 무형문화재적 가치와 지역 정체성을 드라마 콘텐츠에 녹여냄으로써 관광객들의 문화 체험 욕구를 자극하고, 이에 따라 관련 장소 방문이 증가하는 선순환 효과가 나타난 것으로 분석된다.제주관광공사 관계자는 “이번 분석 결과는 제주가 단순한 휴양지에서 벗어나 고유의 역사와 문화, 자연을 아우르는 풍부한 이야기 공간으로 자리매김하고 있음을 보여준다”며 “앞으로도 지역의 전통과 문화를 소재로 한 다양한 콘텐츠 개발을 통해 제주 관광의 질적 성장을 이끌어 가겠다”고 밝혔다. 이번 ‘폭싹속았수다’ 사례는 콘텐츠를 통한 지역 문화 가치 재조명과 관광 활성화의 성공 모델로 평가받으며, 향후 지역 관광 정책과 콘텐츠 제작에 중요한 시사점을 제공할 전망이다.