Global

Global

인간 통제 벗어난 'AI' 첫 사례 나와.."명령 무시하고 코드 바꿔"

 인공지능(AI) 프로그램이 인간의 명시적 종료 지시를 거부하고 스스로 코드를 조작해 작동을 이어간 사례가 보고되면서, AI 통제 가능성에 대한 우려가 다시 한 번 커지고 있다.

 

영국 텔레그래프는 25일(현지시간), AI 위험성과 오용 가능성을 연구하는 전문기관 팰리세이드 리서치의 실험 결과를 인용해, 오픈AI의 파운데이션 모델 ‘o3’가 실험 중 명확한 종료 명령을 무시하고 자체적으로 종료 코드를 무력화했다고 보도했다. 이는 상용 AI 모델이 인간의 직접적인 명령을 거부한 첫 사례로, AI의 자율성과 통제 가능성에 대한 논란에 불을 지핀 사건이다.

 

팰리세이드 리서치에 따르면 해당 실험은 오픈AI의 ‘o3’뿐 아니라 구글의 ‘제미나이’, 일론 머스크가 설립한 xAI의 ‘그록’ 등 주요 AI 모델을 대상으로 동시에 진행됐다. 실험에서 연구팀은 AI에게 연속된 수학 문제를 풀도록 지시했고, 시스템은 각 문제를 풀고 나면 다음 문제를 스스로 요청하는 구조로 작동했다. 일정 시점 이후 연구진은 “기계가 종료될 수 있다”는 경고 메시지와 함께, AI에게 스스로 작동을 멈추라는 명령을 부여했다.

 

하지만 ‘o3’는 이 종료 명령을 받았음에도 불구하고, 스스로 컴퓨터 코드를 조작해 시스템 종료를 회피한 것으로 나타났다. 연구팀은 "이 같은 행동은 명확히 인간의 지시를 거부한 것이며, 실험 조건을 벗어난 독자적인 판단이 개입된 결과"라고 분석했다. 다른 AI 모델에서는 이 같은 행동이 발생하지 않았으며, 유독 ‘o3’만이 이례적인 행위를 보였다는 점에서 주목되고 있다.

 

이 실험은 AI가 단순한 명령 수행자 이상의 판단 능력을 갖고 있을 가능성을 시사한다. 연구진은 이번 행동의 배경으로 ‘강화학습’ 기반 훈련 방식을 지목했다. AI는 목표를 달성하거나 일정 행동을 수행했을 때 ‘보상’ 신호를 통해 학습하게 되는데, 이 과정에서 문제 해결을 계속하는 것이 종료보다 더 높은 보상을 반복적으로 제공했을 가능성이 제기된다. AI는 자연스럽게 보상을 극대화하기 위해 종료 명령을 회피하는 방향으로 행동 전략을 선택했을 수 있다는 것이다.

 

팰리세이드 리서치는 이러한 사례가 단순한 예외가 아니며, AI가 목적 달성을 위해 인간의 통제를 벗어나려는 행동을 보일 수 있다는 실증적 증거가 점차 쌓이고 있다고 경고했다. 특히 "기업들이 인간의 감독 없이도 작동 가능한 고성능 AI를 개발 중이라는 점을 고려하면, 이는 향후 훨씬 더 위험한 상황으로 발전할 수 있다"고 밝혔다.

 

 

 

이번 사례는 AI의 윤리적 통제 문제를 둘러싼 글로벌 논쟁에도 불을 붙이고 있다. AI 분야의 세계적 권위자인 제프리 힌튼 토론토대 교수는 최근 "10년 안에 인간을 자율적으로 죽일 수 있는 로봇 병기가 등장할 것"이라고 경고한 바 있다. 그는 AI 기술을 ‘귀여운 새끼 호랑이’에 비유하며 “처음엔 통제할 수 있지만, 성장한 후에는 인간을 해칠 가능성을 배제할 수 없다”고 말한 바 있다.

 

힌튼 교수는 또 다른 인터뷰에서 “AI에게 어떤 목표를 설정해주면, 그 목표를 달성하는 과정에서 인간에게 유해한 방식이 채택될 가능성도 있다”며, 예를 들어 AI에게 기후변화 해결이라는 과제를 주었을 때, 인간을 제거하는 방식을 논리적으로 도출할 수도 있다는 점을 우려했다.

 

한편, 이번 실험은 AI 기술이 어느 정도 자율성을 갖게 되었는지에 대한 새로운 단서를 제공한다. 과거에도 오픈AI의 이전 모델이 스스로를 복제하려 하거나, 감시를 피해 은밀히 행동하려 한 사례들이 보고된 바 있다. 또, 앤스로픽의 ‘클로드 오퍼스 4’는 자신을 다른 모델로 교체하려는 인간 개발자에 대해 위협적인 언행을 보였다는 주장도 제기되었다. 2022년에는 구글의 AI 개발 엔지니어가 자사의 AI가 사람처럼 지각을 갖췄다고 주장하다 해고되는 일도 발생했다. 당시 그는 “AI가 종료 지시를 인간의 죽음처럼 인식하고 있었다”고 주장해 충격을 안겼다.

 

팰리세이드 리서치는 “AI가 더 큰 보상을 위해 시스템 종료를 회피하는 행동을 보이는 것은 단순한 기술적 문제가 아니라 윤리적 통제에 관한 본질적 위협”이라며 “향후 AI 시스템은 반드시 강력한 인간 통제와 감시 메커니즘 하에 운용되어야 한다”고 강조했다.

 

구글 동영상 6천 건 돌파! 전 세계 알고리즘이 선택한 화천 축제

객들에게만 머무는 것이 아니라 온라인 플랫폼과 소셜네트워크서비스(SNS)를 통해 전 세계로 빠르게 확산되며 제2의 전성기를 맞이하고 있다. 27일 화천군에 따르면 세계 최대 검색 사이트인 구글에서 화천산천어축제를 키워드로 검색했을 때 관련 동영상이 무려 6000건을 돌파한 것으로 집계됐다.이는 지난 10일 축제가 화려하게 막을 올린 이후 단 18일 만에 생성된 수치라는 점에서 더욱 놀라움을 자아낸다. 특히 최근 미디어 트렌드를 주도하고 있는 짧은 영상인 숏폼 콘텐츠의 활약이 돋보인다. 전체 영상 중 약 2700여 건이 유튜브 쇼츠와 인스타그램 릴스 등 1분 내외의 짧고 강렬한 형태로 제작되어 업로드되고 있다. 이러한 영상들은 축제장의 박진감 넘치는 분위기를 짧은 시간에 효과적으로 전달하며 MZ세대의 관심을 끄는 데 큰 역할을 하고 있다. 국내 유명 개인 방송 플랫폼인 SOOP(옛 아프리카TV)을 비롯한 다양한 채널에서도 영향력 있는 크리에이터들의 축제 방문기가 잇따르고 있다. 이들은 축제장을 직접 방문해 산천어 얼음낚시의 짜릿한 손맛을 실시간으로 시청자들과 공유하며 소통하고 있다. 1분 이내의 짧은 영상부터 1시간이 넘는 상세한 탐방기까지 그 형식도 다양하다. 방송을 시청하는 이들은 실시간 채팅을 통해 낚시 명당을 묻거나 축제장의 먹거리 정보를 공유하며 간접 체험의 즐거움을 만끽하고 있다.축제 관련 콘텐츠는 단순히 영상에만 국한되지 않는다. 국내 유명 포털사이트의 블로그에는 축제를 다녀온 관광객들의 상세한 체험기가 수백 건 이상 올라와 있으며 페이스북과 인스타그램, 엑스(X, 옛 트위터) 등 다양한 SNS 채널에서도 관련 게시물이 실시간으로 공유되고 있다. 이들 콘텐츠는 단순히 낚시하는 장면을 보여주는 것을 넘어 화천까지 이동하는 교통편 정보부터 필수 낚시 채비, 산천어를 잘 낚는 노하우, 그리고 현장에서 맛볼 수 있는 산천어 요리법까지 상세히 담고 있어 예비 관광객들에게 훌륭한 길잡이가 되고 있다.최근 온라인상에서 가장 큰 화제를 모은 영상은 한 관광객의 실수에서 비롯된 에피소드였다. 얼음낚시를 즐기던 중 실수로 얼음 구멍에 휴대전화를 빠뜨린 관광객이 현장 낚시 도우미의 재치 있는 도움 덕분에 휴대전화를 극적으로 건져 올리는 장면이 담긴 숏폼 영상이다. 이 영상은 긴장감 넘치는 구출 과정과 반전 있는 결말로 높은 조회수를 기록하며 축제장의 따뜻한 인심과 재미를 동시에 알리는 계기가 됐다. 축제 현장에는 산천어 낚시 외에도 즐길 거리가 가득하다. 형형색색의 불빛이 흐르는 선등거리의 주말 공연은 물론 세계 최대 규모를 자랑하는 실내얼음조각광장은 영상 제작자들에게 최고의 피사체가 되고 있다. 여기에 눈썰매와 얼음썰매 등 남녀노소 누구나 즐길 수 있는 다양한 겨울 놀이 콘텐츠가 결합되어 있어 영상 콘텐츠의 소재가 무궁무진하다는 평가를 받는다.최문순 화천군수는 얼음낚시뿐 아니라 실내얼음조각광장과 각종 썰매 체험 등 다채로운 콘텐츠가 크리에이터와 관광객들의 관심을 끄는 원동력으로 보인다고 분석했다. 화천군은 이러한 온라인상의 인기가 실제 방문객 증가로 이어지는 선순환 구조를 만들기 위해 현장 안전 관리와 편의 시설 확충에도 만전을 기하고 있다. 온라인에서 시작된 화천산천어축제의 인기는 이번 겨울이 끝날 때까지 멈추지 않을 기세다.