화면 속 디지털 지능이 ‘물리적인 몸’으로 진화
자동차· 반도체 등 국내 제조업 전반에 AI 혁신
‘인간의 고유 영역’ 어떻게 지켜낼 지 숙고해야
피지컬 AI(Physical AI)는 물리적 세계를 인지하고 있으며, 실제로 물리적 몸을 가지고 스스로 작동하는 AI를 말한다. 엔비디아(nVIDIA)의 CEO 젠슨 황이 지난해 세계 최대 IT· 가전전시회인 ‘CES 2025’, 그리고 엔비디아 개발자 행사인 ‘GTC 2025’에서 AI 발전 4단계 프레임워크(Framework)를 제시한 바 있다. 그것이 바로 퍼셉션 AI(Perception AI), 생성형 AI(Generative AI), AI 에이전트(AI Agent) 그리고 피지컬 AI다.
지금까지 컴퓨터나 스마트폰 화면 속에서만 존재하던 디지털 지능이 이제 물리적인 몸을 가지고 현실 세계로 뛰쳐나오고 있다. 드디어 피지컬 AI의 시대가 열린 것이다. 2025년 7월, 아마존이 전 세계에 소유하고 있는 창고에 배치된 로봇이 100만 대를 돌파했다고 한다.
이 로봇들은 단순히 프로그램화된 대로 움직이지는 않는다. AI를 탑재해 실시간으로 상황을 판단하고, 다른 로봇들과 소통하며 가장 효율적인 작업 경로를 혼자서 실시간으로 계산한다는 것이다. 그 결과 2015년에는 직원 한 명이 하루 175개의 상품을 처리했는데, 이제 로봇의 도움을 받는 직원이 하루에 3870개의 상품을 처리할 수 있어 22배의 능률을 올리고 있다고 한다.
과거에는 로봇을 제작하려면 소프트웨어, 데이터, 하드웨어 등 직접 해야 했지만, 지금은 이 과정들이 분화되고 분업화되기 시작했다. 로봇의 두뇌 역할은 엔비디아나 구글 딥마인드 같은 AI 플랫폼이 맡고, 피지컬 AI는 기계적 완성도를 최대한 높이는 분업구조가 나타나고 있다. 과거에는 데이터 수집과 활용을 처음부터 끝까지 다 해야 했기에 어려웠고 비용도 많이 들었지만, 이제는 이미 형성된 생태계를 활용해 새로운 시도를 할 수 있는 환경이 마련돼 있다.
피지컬 AI 발전의 중심에 거대언어모델(LLM) 및 멀티모달 모델과 하드웨어의 비약적인 발전이 뒷받침되어 있다. 우리가 시각· 청각· 미각· 후각· 촉각 등 오감을 종합해 판단하는 것처럼 로봇도 텍스트· 이미지· 음성· 영상 등 서로 다른 형태의 정보를 한꺼번에 이해하고 처리할 수 있는 멀티모달 모델을 통해 한층 더 스마트해졌다.
구글은 2025년 3월에 제미나이 로보틱스를 공개했는데, 이는 보고-이해하고-행동하는 통합모델(VLA Model)을 기반으로 하고 있다. 이 제미나이 로보틱스는 한 번도 보지 못한 사물이나 상황에서도 적절히 대응할 수 있는 일반화 능력, 사람이 새로운 지시를 하거나 주변 환경이 바뀌면 즉시 파악하고 행동을 수정할 수 있는 상호작용 능력과 인간의 손가락처럼 섬세하고 복잡한 조작이나 정교함까지 보여준다.
최근 산업현장에서는 휴머노이드에 주목하고 있다. 기존 공정 프로세스를 바꾸지 않고 로봇을 바로 투입하려면, 사람과 유사한 크기(size)와 움직임을 가진 형태여야 가능하기 때문이다. 휴머노이드는 가정보다 먼저 공장에서 부족한 인력을 대체하는 역할로 자리 잡을 것으로 전망된다. 물론 로봇은 역할과 기능에 따라 효율적인 여러 형태로도 발전하고 있다. 미래에는 수천 가지 다른 형태의 로봇들이 각자의 전문 분야에서 활동하게 될 것이다.
생성형 AI는 학습한 데이터를 토대로 확률이 높은 답을 생성함으로써 때로는 할루시네이션(Hallucination) 같은 오류를 유발하기도 한다. 반면에 피지컬 AI는 몸을 가지고 있기에 현장에 들어가 체험한다. 로봇이 직접 경험을 바탕으로 스스로 학습을 강화하거나 전이한다는 것이다.
따라서 피지컬 AI는 체득할 수 있는 존재다. 기존의 생성형 AI가 간접 경험하는 것과 달리 피지컬 AI는 직접 경험을 통해서 데이터를 축적하고 판단하기에 생성형 AI의 한계를 넘어섰다는 평가를 받는다. 그러기에 피지컬 AI는 생성형 AI의 다음 버전으로 보는 게 합리적이다. 이미 세계 군사 대국에서는 피지컬 로봇을 전쟁에 활용하기 위한 시뮬레이션과 테스트에 열중하고 있다. 보안‧안보 차원에서도 피지컬 AI는 필수가 될 준비를 하고 있다.
특히 우리나라 산업현장에서는 이미 생산 가능 인구의 부족 현상으로 심각한 상황이다. 조선업계의 경우 2014년 약 20만 3400명에 달했던 조선소 인력이 2024년 11만 6천 명 수준으로 10년 사이 절반 가까이 급감했다. 장기간 경력을 쌓아 안정적으로 일할 수 있을지에 대한 불확실성이 내재하고 임금 상승에 대한 걱정 또한 크다. 그래서 결국 AI와 결합한 피지컬 로봇, 휴머노이드가 공장에 들어올 수밖에 없는 상황이다.
사실 우리나라는 피지컬 AI 분야에서도 잠재력을 갖추고 있다. 큰 강점으로는 바로 데이터를 들 수 있다. 또한 우리나라는 세계 어느 나라에 비하여 풍족한 산업현장과 제조 노하우를 보유하고 있다. 그리고 우리나라처럼 바늘부터 자동차· 반도체· 조선· 배터리· 비행기 등 거의 모든 제조업을 하는 나라는 몇 안 된다. 그러므로 한국의 수많은 제조업 공장은 ‘피지컬 AI 개발의 메카’라고 하여도 무방할 것 같다.
휴머노이드가 출현하면 인간의 일자리를 다 빼앗아 갈 것이라는 우려도 크다. AI 시대는 인간이 잘하는 것과 로봇이 잘하는 것을 분명 구별해야 한다. 휴머노이드와 피지컬 AI의 시대일수록 인간만이 할 수 있는 일, 인간에게만 있는 능력과 고유한 가치가 뭔지를 더욱더 탐색해야 할 것이다. 그리고 인간의 고유한 영역을 어떻게 지켜나가고 확장할지를 숙고하고 탐구해야 한다. 무엇보다 중요한 것은, 피지컬 AI는 인간에게 있어서 ‘도구(tool)’라는 관점을 유지하는 것이다.
*구병두((사)한국빅데이터협회 부회장/ 전 건국대학교 교육대학원 교수/(주)테크큐 대표이사)