[편집자 주] 조선미디어그룹이 설립한 인공지능 전문 매체, ‘더에이아이(THE AI)’가 창간 5주년을 맞이했습니다. THE AI는 생성형 AI 열풍이 불기 전부터, AI 가능성과 한계를 탐구하며 깊이 있는 취재와 분석을 이어왔습니다. 이번 5주년 특집에서는 국내외 AI 석학 및 전문가들과의 인터뷰를 통해 AI 기술의 현재와 미래를 조망합니다. AI 혁명의 최전선에 서 있는 여러 전문가의 통찰과 비전을 독자 여러분께 전합니다. 많은 관심과 성원 부탁드립니다.
인공지능(AI)이 이제 컴퓨터 속을 넘어 현실 세계로 진출을 준비하고 있다. 언어, 시각, 청각 등 인간 지능을 모방하던 AI는 이제 손과 발로 직접 행동하는 ‘피지컬 AI’로 진화 중이다. 현재 AI 기술은 단순 학습을 넘어 스스로 판단하고 결정하는 수준까지 발전했다. 이제는 인간과 물리적 환경을 이해하고 소통할 수 있는 시대로 전환을 꿈꾸고 있다. 피지컬 AI 기술 발전으로 로봇이 현실 세계를 인식하고 행동할 수 있는 물리 지능을 갖추는 것이 미래 AI의 핵심 기술이 될 것이라는 전망이다.
장병탁 서울대 AI 연구원(이하 AIIS)장 겸 컴퓨터공학부 교수는 인간의 뇌를 닮은 AI가 컴퓨터 속에서 작동하던 시대를 지나 이제는 현실 세계로 확장되는 기술 변화의 중심에 ‘피지컬 AI’가 있다고 강조했다. 그는 “피지컬 AI가 진정한 범용 인공지능(AGI)로 가는 필수 조건”이라며 “5년 안에 제조·물류 등 산업 현장에, 10년 안에 가정에서 AI 로봇이 사람과 소통하면서 일을 돕는 시대가 도래할 것”이라고 전망했다.
장 교수는 AGI에 이르기까지의 AI 발전 단계를 6단계로 구분했다. 현재 AI 기술 수준에 대해 장 교수는 AGI로 진입점에 도달했다고 진단했다. 그는 “과거 규칙만 따르는 초기 AI(1단계)에서 데이터 학습해 작동하는 머신러닝 기반 AI(2단계)가 발전했다”며 “최근에는 딥러닝 기반 텍스트·이미지 생성형 AI(3단계)에서 스스로 판단·실행하는 자율에이전트(4단계)와 자기반성형 AI(5단계)가 발전하고 있고, 앞으로는 인간 수준의 AGI(6단계) 나아갈 것”이라고 설명했다.
피지컬 AI는 단순히 지능을 학습한 사고 능력을 넘어 물리적 세계에서 인지하고 실제 행동까지 수행하는 능력을 의미한다. 장 교수는 “챗GPT는 언어를 이해하지만 ‘물을 갖다줘’라는 명령을 수행할 수 없다”며 “피지컬 AI는 카메라와 센서를 통해 환경을 인식하고 로봇 팔을 통해 직접 물을 가져다줄 수 있는 등 물리적 활동이 가능한 AI를 말한다”고 설명했다.
그는 피지컬 AI 분야가 한국이 AI 선도국으로 도약할 수 있는 핵심 기회라고 강조했다. 그는 “AI 기술은 지난 10년 발전이 과거 60년보다 크다”며 “지금이 향후 50년을 선도할 기반을 마련할 시점”이라고 말했다. 이어 “로봇의 뇌에 해당하는 브레인 중심의 AI 파운데이션 모델 개발과 도입이 글로벌 경쟁에서 도약할 수 있는 마지막 기회가 될 수 있다”며 “지금이 바로 빠르고 과감한 투자와 산학 협력이 집중돼야 할 골든타임”이라고 강조했다. 장병탁 교수와 피지컬 AI를 중심 미래 전망에 대해 자세한 이야기를 나눠봤다.
- 피지컬 AI의 개념은 무엇이며 현재 기술이 어느 수준까지 와 있는가.
“피지컬 AI는 지각, 생각, 행동이 통합된 개념이다. 챗GPT는 사고는 가능하지만 지각과 행동 능력이 부족해 완전한 에이전트는 아니다. 물리적 세계에서 물건을 인식하고 조작할 수 있으려면 손과 발, 눈을 갖춘 로봇 형태가 필요하다. 컴퓨터 안에서만 작동하는 닫힌 세계가 아닌 지각하고 행동할 수 있는 물리 지능까지 갖춘 에이전트이다. 휴머노이드 로봇의 두뇌를 만드는 것이 ‘피지컬 AI’ 연구 방향이라고 볼 수 있다.”
- 피지컬 AI 기술의 현재 한계는 무엇인가.
“현재 AI는 ‘생각’에 해당하는 언어 처리 능력은 뛰어나지만 ‘지각’과 ‘행동’은 부족하다. 시간적·공간적 상황 판단이 어렵다. 물리 세계와 상호작용하는 능력을 체득하는 기술이 필요하다. 지금 인터뷰를 하는 것처럼 실제 인터뷰 상황처럼 인간의 말투, 눈동자, 제스처, 감성, 의도 등을 종합적으로 이해해야 상호작용이 가능하다. 현재는 AI가 이를 완전히 파악하기 어렵다. 미묘한 말투와 톤, 감성, 인간의 의도, 실세계 정보를 종합적으로 감지하고 판단하는 능력이 부족하다. 비언어적 신호와 의도를 인식하고 판단할 수 있어야 한다. 이는 지각과 행동이 결합한 완전한 물리 지능이 갖춰졌을 때 가능하다.”
- 이러한 멀티모달 데이터는 현재 어떤 방식으로 수집되고 있나.
“과거에는 로봇을 움직이기 위해 하나하나 코딩을 입력했다. 지금은 사람이 센서를 부착해 직접 시연하는 시뮬레이션 기반 학습으로 움직임 데이터를 실시간 수집하고 있다. 예를 들어 로봇에게 컵을 들어서 옮기는 행동을 가르치기 위해 사람에 센서를 달아 직접 행동을 시연하고 그 데이터를 수집해 학습에 활용하는 방식이다. 로봇이 코딩 없이도 사람 동작을 모방해 학습할 수 있게 됐다.”
- 피지컬 AI 기술은 앞으로 어떤 속도로 발전할 것으로 보는가.
“AI는 최근 10년 동안의 발전이 과거 60년간의 발전을 넘어설 만큼 급격히 발전했다. 피지컬 AI도 같은 속도를 이어갈 것으로 예상된다. 피지컬 AI의 중요성을 깨달은 지금 기존의 AI 발전보다 더 빠르게 발전할 수 있다고 본다.”
- 범용 인공지능(AGI)의 개념을 교수님은 어떻게 정의하고 있나. AGI가 언제 도래할 것으로 예상하는가.
“AGI는 물리적 지능까지 포함해 인간처럼 모든 업무를 수행하는 수준이다. 챗GPT는 텍스트 기반으로 소프트웨어적 AGI에 가까워지고 있다. 물리적 지능을 갖춘 AGI는 더 오래 걸린다. 10년 안에 초기 단계가 나타날 것으로 예상한다. 완전한 AGI는 그 이후에 가능하다. AI 자율성 증가로 생기는 통제 문제를 해결하려면 윤리와 안전성 연구를 병행해야 한다.”
- AI가 적용된 로봇이 인간과 상호작용을 하는 세상이 언제 올 것이라고 생각하는가.
“AI 로봇이 인간과 상호작용을 하는 세상은 이미 초기 단계에 들어섰다. 오픈AI가 투자한 휴머노이드 로봇 스타트업 ‘피겨(Figure)’가 개발한 휴머노이드 로봇이 챗GPT를 두뇌(브레인)으로 활용하고 있다. 5년 안에 제조업에서, 10년 안에는 가정에서 로봇과 인간이 상호작용할 수 있다.”
- 피지컬 AI의 발전이 일자리에 미칠 긍정적·부정적 영향은 무엇인가.
“지금까지 AI가 대체하는 것은 주로 정신노동이었다. 피지컬 AI가 물리적 노동을 대체할 수 있어 영향이 훨씬 크다. 피지컬 AI는 반복적이고 육체적으로 힘든 일 또는 위험한 일부터 사람을 대체해 나갈 것이다. 사람들이 기피하는 일자리를 로봇이 대신할 수 있다. 제조업 분야 기업들과 이야기해 보면 현재 인력 중 전문가를 대체할 인력이 없다고 토로한다. 이러한 전문가 은퇴 후 후속 인력 문제를 AI 로봇이 해결할 수 있다. 반면 기존 일자리를 대체하는 문제도 무시할 수 없다. 인간의 일자리를 앗아갈 수 있다. 아무도 하지 않으려고 하는 힘든 업무에 AI 로봇이 대체되는 것은 긍정적인 면이고 기존 일자리를 대체하는 것은 부정적인 면이다. 재교육과 사회 정책으로 이러한 균형을 맞춰야 한다.”
- 물리 지능을 갖춘 로봇에 대한 윤리적 문제는 무엇인가. 인간처럼 AI가 자유 의지를 가질 수도 있나.
“자율성이 높아지면 통제와 안전 문제가 커진다. 설명 가능한 AI나 투명성 연구가 필요하다. 국방 같은 분야에서 잘못된 의사결정이 전쟁으로 이어진다. 기술 발전과 규제의 균형을 맞춰야 한다. 자유 의지를 기계에 집어넣는 게 아니라 스스로 생기도록 하는 게 연구 목표다. 자유 의지도 철학적으로 논쟁거리다. AI가 자율성을 가지면 편리함을 주지만 통제와 윤리 문제가 같이 해결돼야 한다.”
- 교수님이 연구한 분야 중 피지컬 AI와 관련된 기술이 있다면, 그 기술이 실생활에 어떻게 적용될 수 있는가.
“체화 AI 연구로 물류 정리와 가사 로봇 브레인을 담당하는 AI 연구를 국내 기업과 하고 있다. 휴머노이드 로봇의 브레인에 속하는 AI 파운데이션 모델을 만든다고 생각하면 된다. 국가 차원에서 체화 AI 연구센터가 설립돼 있다. 2023년 교육부와 한국연구재단이 지원하는 사업에 선정돼 체화 AI의 핵심 원천기술을 연구개발에 나섰다. 체화 AI 연구센터에서 AI, 로봇공학, 인지과학, 뇌과학 연구자들과 협업하고 있다. 예를 들어 로봇이 컵을 만질 때 뜨거움을 느끼고 소리를 들으며 ‘커피가 담긴 컵’이라는 개념을 체험 기반으로 이해할 수 있도록 한다. 이러한 체화된 지식을 통해 단순히 텍스트로 배운 AI가 아니라 지각, 감각, 행동이 통합된 AI 개발을 목표로 한다.”
- 최근 개원한 서울대 헬스케어AI연구원 원장을 맡게 됐다. 이 연구원에서는 어떤 연구가 진행 중인가.
“서울대병원 내 운영 및 서비스,, 의학 연구에 AI를 도입하는 일을 하고 있다. 환자 기록 자동화, 의사 업무 보조, 수술 중 AI 모니터링 등 병원 내 AI 기술을 도입하는 것이 주요 목표다. 현재 외과 수술 중 AI가 실시간으로 수술 상황을 감지하고 이상 여부를 조기 경고하는 시스템을 논의 중이다. 수술용 로봇 자체를 개발한다기보다는 의사 보조형 AI 시스템을 우선적으로 고려하고 있다.”
- 피지컬 AI 기술 활용에 있어 미래에 가장 주목할 만한 분야는.
“물류, 제조, 가사, 의료 분야가 주목할 만하다. 1~2년 내에 물류와 제조에서 실용화되고 10년 안에는 가사 로봇이 일상화된다고 본다. 재활 의학이나 위험 작업 대체에서도 돋보일 것이다.”
- 국내 산업 구조에서 피지컬 AI 기술 결합은 어떤 기회와 도전을 가져올 수 있나.
“제조업처럼 이미 강점을 가진 분야에 기회가 있다. 빠르게 피지컬 AI를 접목하면 글로벌 선도할 수 있는 자리에 오를 수 있다. AI를 활용해 더 과감하게 50년 후를 내다보는 전략이 필요하다. 산업혁명 초기처럼 새로운 패러다임이 형성되는 시기이다. AI를 활용한 혁신 동력을 적극적으로 키워야 할 때다. 자동차나 컴퓨터가 처음 나왔을 때처럼 AI도 어디에 어떻게 쓰일지 아직 완전히 정해지지 않았다. 선제적이고 창의적인 응용과 투자가 중요하다.”
피지컬 AI 분야에서 한국이 퍼스트 무버가 될 수 있다고 보는가.
“텍스트 중심 LLM 기술은 이미 글로벌 빅테크 기업이 선점했다. 피지컬 AI는 초기 단계라 우리나라가 빠르게 투자하면 선점할 수 있다. 글로벌 출발선이 비슷하다. 국내는 제조업이 탄탄해 실제 데이터를 확보하기 유리하다. 적극적인 정부 투자와 전략 기술로 지정이 필요하다. 지금이 골든 타임으로 속도가 중요하다.”
- 마지막으로 하고 싶은 말은.
“지금 AI는 변혁의 시대다. 피지컬 AI 기술은 현재 글로벌 출발선이 같기 때문에 국내에 큰 기회다. 한국이 글로벌 경쟁에서 AI 산업을 선도할 수 있는 골든 타임이다. 국내 산업이 가지고 있는 강점을 살려 국가, 민간에서 전략적으로 투자해 기술을 선점해야 한다.”