안에 새로운 연구 논문Google은 Project Starline의 인상적인 제품 이면의 기술을 자세히 설명했습니다. 올해 I/O 컨퍼런스. Project Starline은 2D 2D 회의 통화를 실제 사람 앞에 앉아 있는 듯한 경험으로 대체하는 3D 영상 채팅 키오스크입니다.
간단하게 들리지만 Google의 연구 보고서는 몇 미터 떨어진 곳에 실제 사람이 앉아 있다고 믿도록 뇌를 속이는 데 얼마나 많은 어려움이 있는지 강조합니다. 분명히 이미지는 고해상도여야 하고 산만하지 않아야 하지만 기내의 상대적 위치에서도 올바르게 보여야 합니다. 오디오는 시스템이 사람의 말이 실제 입에서 나오는 것처럼 들리도록 해야 하기 때문에 또 다른 문제입니다. 그런 다음 눈을 마주치는 작은 문제가 있습니다.
그러나 결국에는 Project Starline이 사용자가 부피가 큰 헤드폰이나 트래커를 착용하지 않고도 가상 또는 증강 현실과 유사한 존재감을 제공할 수 있기를 바랍니다.
이 문서는 이러한 문제를 해결하기 위해 얼마나 많은 하드웨어가 필요한지 정확히 보여줍니다. 시스템은 60Hz에서 작동하는 대형 65인치 8K 패널을 중심으로 구축되었습니다. 주변에 Google 엔지니어는 컬러 이미지와 깊이 데이터를 모두 캡처할 수 있는 3개의 “캡처 포드”를 배치했습니다. 이 시스템에는 4개의 추가 추적 카메라, 4개의 마이크, 스피커 및 적외선 프로젝터도 포함됩니다. 총 7개의 비디오 스트림에 대해 3개의 깊이 맵과 4개의 시점에서 컬러 이미지가 캡처됩니다. 오디오는 44.1kHz에서 캡처되고 256kbps로 인코딩됩니다.
이러한 모든 장치는 분명히 전송해야 할 많은 데이터를 생성하며 Google은 전송 대역폭 범위가 “사용자의 옷의 세부 사항과 제스처의 크기”에 따라 30Mbps에서 100Mbps 사이라고 말합니다. 따라서 표준 Zoom 통화 이상이지만 일반적인 도시 사무실에서는 처리할 수 없습니다. Project Starline에는 이 모든 데이터를 암호화 및 해독하기 위해 4개의 고급 Nvidia 그래픽 카드(2개의 Quadro RTX 6000 및 2개의 Titan RTX)가 장착되어 있습니다. 평균 종단 간 대기 시간은 105.8ms입니다.
Google이 말한 대로 Starline이 설치된 세 곳의 사이트에서 Starline을 사용한 직원은 존재감과 개인적인 유대감을 형성하고 관심과 반응을 측정하는 데 도움이 된다는 점에서 기존 화상 회의를 능가한다고 믿습니다. 회사에 따르면 9개월 동안 117명의 참가자가 텔레프레즌스 키오스크에서 총 308회의 회의를 열었으며 평균 회의 시간은 35분이 조금 넘었습니다.
이 모든 것이 매우 유망하게 들리지만, 시스템이 언젠가 상용화될지 여부에 대한 징후는 아직 없습니다. Starline의 다양한 장치가 실제로 얼마인지에 대한 정보도 거의 없습니다(연구 논문의 표 4는 추적기를 식별하고 추적기를 사용하는 것을 표시하지만 수학을 하고 싶다면). 현재 Google은 “미국 전역의 더 많은 Google 사무실에서” Project Starline 가용성을 확장하기 위해 노력하고 있다고 말합니다.
“재화는 뛰어난 분석 능력을 가진 분석가로, 다양한 주제에 대한 깊은 통찰력을 가지고 있습니다. 그는 창조적인 아이디어를 바탕으로 여러 프로젝트를 주도해왔으며, 좀비 문화에 특별한 애정을 갖고 있습니다. 여행을 사랑하며, 대중 문화에 대한 그의 지식은 깊고 폭넓습니다. 알코올에 대한 그의 취향도 독특합니다.”