널리 사용되는 챗봇 ChatGPT는 시부터 연구 논문, 컴퓨터 프로그램에 이르기까지 모든 디지털 텍스트를 생성하도록 설계되었습니다. 그러나 컴퓨터 칩 회사인 Nvidia의 인공 지능 연구원 팀은 챗봇의 기본 기술을 손에 넣었을 때 챗봇이 훨씬 더 많은 일을 할 수 있다는 것을 깨달았습니다.
몇 주 안에 그들은 그에게 세계에서 가장 인기 있는 비디오 게임 중 하나인 Minecraft를 플레이하는 방법을 가르쳤습니다. 마인크래프트의 디지털 세계에서 나는 수영, 식물 채집, 돼지 사냥, 금 채굴, 집을 짓는 법을 배웠습니다.
Jim으로 알려진 Nvidia의 선임 연구원인 Linxi Fan은 “그는 Minecraft의 세계에 들어가서 스스로 탐험하고, 스스로 재료를 수집하고, 모든 종류의 기술을 향상시킬 수 있습니다.”라고 말했습니다.
프로젝트 이는 세계 최고의 AI 연구자들이 챗봇을 AI 에이전트라는 새로운 유형의 자율 시스템으로 전환하고 있다는 초기 신호였습니다. 이러한 상담원은 단순한 채팅 이상의 일을 할 수 있습니다. 그들은 스프레드시트, 온라인 캘린더, 여행 웹사이트 등을 포함한 소프트웨어 애플리케이션, 웹사이트 및 기타 온라인 도구를 사용할 수 있습니다.
많은 연구자들은 시간이 지남에 따라 AI 에이전트가 훨씬 더 정교해지고 직장인을 대체할 수 있으며 거의 모든 관리 기능을 자동화할 수 있다고 말합니다.
“이것은 잠재적으로 수조 달러의 가치가 있는 거대한 비즈니스 기회입니다.”라고 브리티시 컬럼비아 대학의 컴퓨터 과학 교수인 Jeff Clune은 말했습니다. 기술. ChatGPT. “이것은 사회에 엄청난 이점과 심각한 결과를 가져옵니다.”
Nvidia 에이전트가 게임을 하고 있습니다. 유사한 상담원은 회의 일정을 예약하고, 파일을 편집하고, 데이터를 분석하고, 다양한 색상의 막대 차트를 만들 수 있습니다. 이러한 자동화된 시스템은 결국 광범위한 온라인 작업을 처리할 수 있는 개인 비서 역할을 하게 될 것이라는 생각입니다.
오늘날의 에이전트는 제한되어 있으며 귀하의 삶을 정확하게 정리할 수 없습니다. ChatGPT는 여행 사이트 Expedia에서 뉴욕행 항공편을 검색할 수 있지만 여전히 직접 예약해야 합니다.
연구자들이 이 기술을 개선하면 사무실 직원과 소비자를 더욱 효율적으로 만들 수 있습니다. 또한 플레이어가 함께 플레이하고 채팅할 수 있는 새로운 봇을 제공하여 비디오 게임의 특성을 바꿀 수도 있습니다.
ChatGPT를 지원하는 기술인 GPT-4는 연구자들이 그랜드 언어 모델이라고 부르는 것입니다. 방대한 양의 데이터를 분석해 기술을 학습하는 인공지능 시스템이다.
지난 몇 달 동안 이 기술은 거의 모든 주제에 대해 이메일을 작성하고, 연설을 쓰고, 노래를 부르는 방식으로 수억 명의 사람들을 놀라게 했습니다. 그러나 그의 가장 중요한 기술은 아마도 컴퓨터 프로그램 작성에 대한 재능일 것입니다.
그는 즉시 노트북 화면에 유니콘을 그리거나 디지털 방식으로 눈송이를 떨어뜨리는 프로그램을 만들 수 있습니다. 전문 소프트웨어 개발자는 소셜 미디어 앱부터 검색 엔진까지 모든 것을 포함하여 더 큰 프로그램에 통합할 수 있는 코드를 의뢰할 수 있습니다. 하지만 이는 이 기술이 할 수 있는 일의 일부일 뿐입니다. 또한 다른 소프트웨어 응용 프로그램 및 웹 사이트에서 사용할 수 있는 컴퓨터 코드를 생성할 수도 있습니다.
이것이 Dr. Fan과 다른 Nvidia 연구원들이 GPT-4에게 Minecraft 플레이 방법을 가르친 방법입니다. “여기서 가장 중요한 단어는 코드입니다.”라고 Fan 박사는 말했습니다. “코드는 조치를 취할 수 있습니다.”
사람들은 버튼, 메뉴, 기타 그래픽 도구를 터치하여 소프트웨어 애플리케이션과 웹사이트를 사용합니다. AI 에이전트는 다른 온라인 서비스와 통신할 수 있게 해주는 기본 소프트웨어 코드인 API(애플리케이션 프로그래밍 인터페이스)에 액세스하여 앱과 웹사이트를 사용합니다.
예를 들어 에이전트에게 인터넷에 동영상을 업로드해 달라고 요청하면 YouTube에서 제공하는 API(애플리케이션 프로그래밍 인터페이스)라는 코드를 생성할 수 있습니다. 자율 AI 에이전트 프로젝트인 AutoGPT를 실행하는 데 도움을 주는 연구원 Selin Nayhin은 “API는 기계와 대화하는 데 사용되는 텍스트일 뿐입니다.”라고 말했습니다.
이론적으로 챗봇은 인터넷의 모든 API에 액세스하는 코드를 작성할 수 있습니다. 그러나 오늘날의 챗봇은 단순한 작업 이상의 작업을 수행할 만큼 기술이 부족합니다. 설사 그런 경우라도 그들이 온라인으로 자유롭게 돌아다니도록 허용하는 것은 엄청난 보안 위험이 될 것입니다. 그래서 회사는 작게 시작했습니다.
OpenAI는 ChatGPT를 공개한 지 몇 달 후 챗봇이 단순히 텍스트를 생성하는 것 이상의 작업을 수행할 수 있는 방법을 조용히 출시했습니다. 봇의 기능을 향상시키는 소프트웨어인 여러 플러그인을 설치한 후 Expedia와 같은 여행 사이트에서 이용 가능한 항공편을 검색하도록 요청하고 Google 어스에서 도시 지도를 가져오거나 연간 지출을 자세히 설명하는 스프레드시트를 변환할 수도 있습니다. .. 다색 막대 차트.
ChatGPT에는 코드 컴파일러라는 플러그인이 포함되어 있기 때문에 코드 작성뿐만 아니라 실행할 수도 있습니다. 이를 통해 스프레드시트 편집, 정지 이미지를 비디오로 변환하는 등 과거에는 할 수 없었던 작업을 즉시 수행할 수 있게 되었습니다. Google, Microsoft 및 기타 회사에서도 유사한 기술을 탐색하고 있습니다.
마이크로소프트 부사장 애슐리 로렌스(Ashley Lawrence)는 “이 프로젝트는 AI가 본질적으로 사용자를 대신해 다른 AI와 협력하는 것을 상상하는 프로젝트”라고 말했다.
AutoGPT와 같은 독립 프로젝트는 이러한 종류의 작업을 몇 단계 더 발전시키려고 노력하고 있습니다. 아이디어는 “회사 시작” 또는 “돈 벌기”와 같은 시스템 목표를 제공하는 것입니다. 그런 다음 스스로에게 질문을 던지고 다른 인터넷 서비스에 연결하여 해당 목표를 달성할 수 있는 방법을 찾습니다.
오늘날에는 이것이 잘 작동하지 않습니다. AutoGPT와 같은 시스템은 무한 루프에 빠지는 경향이 있습니다. 그러나 Dr. Fan과 같은 연구자들은 이러한 유형의 기술을 더욱 유용하고 안정적으로 만들기 위해 지속적으로 노력하고 있습니다.
다른 연구자들은 소프트웨어 도구를 사용하도록 설계된 새로운 유형의 인공 지능 에이전트를 구축하고 있습니다. 2022년 여름, Clune 박사는 OpenAI 연구원 팀의 일원으로 이 기능을 갖춘 에이전트를 구축했습니다. 사람만큼 컴퓨터 프로그램을 사용하십시오. – 마우스 클릭 후 마우스 클릭, 키 입력 후 키 입력.
Clune 박사와 그의 동료들은 사람들이 Minecraft를 플레이하는 모습을 보여주는 온라인 비디오를 시스템에 몇 시간 동안 공급했습니다. 사람들이 Minecraft의 디지털 세계를 탐색하기 위해 마우스와 키보드를 사용하는 방식을 분석함으로써 시스템은 게임을 자체적으로 실행하는 방법을 학습했습니다.
Adept라는 스타트업을 포함한 다른 회사들도 구축하고 있습니다. 유사 에이전트 Wikipedia, Redfin, Craigslist와 같은 웹사이트와 Salesforce와 같은 회사의 인기 있는 사무용 애플리케이션을 사용합니다.
Clune 박사는 이러한 유형의 에이전트를 통해 결국 AI가 훨씬 더 광범위한 소프트웨어 애플리케이션과 웹사이트를 사용할 수 있게 될 것이라고 말했습니다. 모든 사람이 인터넷에서 거의 모든 일을 할 수 있는 디지털 보조 장치에 액세스할 수 있게 될 것이라고 그는 말했습니다. 이는 삶을 더 쉽게 만들어 줄 뿐만 아니라 수많은 일자리를 대체할 수도 있습니다.
“AI가 우리가 할 수 있는 모든 일을 할 수 있다면 그것은 단순히 지루한 작업을 대체하는 것이 아닙니다.”라고 그는 말했습니다. “모든 작업을 대체합니다.”