피지컬 AI의 기술 VLM, 왜 중요한가
화면 속에서 글자만 만들던 인공지능이 눈과 손을 얻고 현실로 걸어 나오고 있다. 인간의 명령을 이해하고 공간을 분석하는 비전 언어 모델은 이제 로봇 산업의 가장 핵심적인 인프라로 자리 잡는 중이다. VLM(Vision Language Model)이란 무엇인가 과거의 로봇은 눈앞에 있는 물체가 무엇인지 이름만 겨우 맞추는 수준이었다. 하지만 비전 언어 모델은 이미지를 보면서 동시에 문장의 맥락까지 함께 이해하도록 설계되었다. … 더 읽기