FBEC2023 | 诺亦腾 联合创始人&CTO戴若犁:AI & AVP是Metaverse和XR的救世主么?
2023-12-13来源: 网络作者: hjFBEC2023未来商业生态链接大会暨第八届金陀螺奖于2023年12月8日在深圳福田大中华喜来登酒店6楼盛大召开,本次大会由广东省游戏产业协会、深圳市互联网文化市场协会指导,陀螺科技主办,中国光谷、游戏陀螺、VR陀螺、陀螺财经、陀螺电竞联合主办。
大会以“合力共生·韧者行远”为大会主题,以具有行业前瞻洞察的“航行者”为视角,破冰之旅为主线,关注AI、元宇宙、XR、游戏、电竞、数字经济等科技与互联网前沿领域,全方位呈现科技前沿成果,聚焦时代与商业热点议题,探讨新科技、新商业、新模式的未来价值,与真正的勇者共赴剧变革新下的凛冬破冰之旅!
主会场C:元生未来,共链价值——2023全球元宇宙产业核心技术论坛,邀请到诺亦腾 联合创始人&CTO戴若犁带来主题为“AI & AVP是Metaverse和XR的救世主么?”的精彩演讲。戴若犁认为,AI能力的提升或会加速助推消费级轻量化AR落地,但对VR产业来说却可能无法带来显著变化。而随着新一代VR设备到来,B2B VR或将迎来第二春。
以下为演讲实录:
感谢各位。发现许多嘉宾提到了Apple Vision Pro,它与人工智能的兴起一样,对XR行业如同打了一针强心针,有着积极的影响。在过去一段时间里,Apple Vision Pro和人工智能的出现无疑是科技领域和XR领域最引人注目的两个事件。这两个标志性的事件到底能不能给我们带来一些变化?带来的是好的变化,还是一些负面的影响?今天和大家相对轻松地聊一聊。
我的企业叫做诺亦腾,专注于动作捕捉技术,包括手部追踪、身体追踪和面部追踪等。我们采用可穿戴传感器、光学追踪技术以及计算机视觉等各种技术将人类动作、表情等信息数字化,并应用于不同行业。目前,诺亦腾的产品与技术在全球50多个国家拥有广泛的用户群,市场占有率相当可观,所以在这样一个小的行业里,我们还是可以拿出相对不错的成绩的。
我在国内是最早从事XR技术积累与应用开发的一批人之一。在上一轮XR热潮中,公司获得了可观的投资,实现了商业上的成功,积累了大量的经验,在过去一段时间里做了大量的XR项目,很多都来自于如车企的研究项目、商业广告项目、科研领域的一些项目等。诺亦腾是第一批和各种大厂、各种技术方进行产品设备级别、项目级别合作的厂商。这么多年过来,我们也见证了行业的起伏。
从我个人角度,也帮助某些创业AR公司提供一些顾问指导。我和AR行业内最顶尖的一批人严肃地讨论过AI和AR相结合的各种实践的可能性。这也就是为什么我有资格站在这里来聊这个话题。
AI 或会助推消费级AR加速落地
现在,大家都看到了AI所带来的变化。许多人认为,人工智能对于XR领域,在商业层面,其实是有负面影响的——短期内,它的出现分散了投资人对于XR项目的关注。但长期来看,它可能会对XR领域产生积极影响。下面我们来讨论第一个话题,AI是不是Metaverse的救世主?
人工智能技术的巨大发展给这个行业带来了「心理」与「生理」层面的双重冲击。我们看到很多以前认为解决不了、复杂度甚高的事情,居然「完美」地解决了。可以说 Large Language Model 和 Diffusion Model,在过去的一年中,打破了天花板。一些以前觉得不能做的事情,立项讨论阶段被 Pass 的项目,都可以重新回到思考流程,拿回来讨论一下——是不是利用新工具,可以在我们的领域中解决一些以前解决不了的问题?
回到XR的具体领域中,应该将虚拟现实(VR)和增强现实(AR)分开来讨论,AI对于这两个子领域的影响是截然不同的。先说AR,AI对于AR的影响将会是巨大的,且非常正面的。我们认为AI能力的提升将极大加速AR设备的普及,尤其是轻量化消费级设备。
传统的人机交互平台,它的核心交互逻辑都是基于图形界面的,无论是PC还是移动设备。我们假设用户看着一个屏幕去点击屏幕,通过鼠标键盘、触控去操作数字内容。但是随着大语言模型革命的发展,一个基础的判断是基于图形界面的人机交互占比会极大降低,基于自然语言交互的占比会极大提升。
通过这件事情,降低了对于显示组件的依赖。而显示组件是AR设备路径上单一最大的「路障」,各类光学器件的小型化、低成本、低功耗、高分辨率、显示质量等提升是业界将轻量化消费级别AR眼镜交付到市场路径上最大的阻碍。而如果AI能够帮助我们降低对于屏幕的依赖,事实上就会加速消费级别AR设备的到来。
而另一方面,当轻量化的AR设备可以全日佩戴的时候,它也将成为多模态AI的模型的一个最佳载体。这个设备它能够陪伴我们的时间比手机更长,如果用户有需求的话,可以always on,实时同步看到用户视野中的世界,听到周遭的对白与声音,是一个非常好的多模态大模型的信息输入源。
从这两个方面来说,AI对于AR这个赛道的帮助是显而易见的,它会让AR设备本身的能力得到提升,加速落地,同时反过来AR也是多模态大模型的良好载体。但在达到这一步之前,最大的障碍卡点依然是重量、舒适度、设计的合理性、造型的合理性以及能否全日工作与全功能工作的问题。如果这些都能解决,它将会是一个完美组合。
AI或无法解决VR发展的难题
那么VR又如何呢?我的观点是,对于VR来说,或许并不会带来特别显著的变化。AI能够帮助VR解决降低部分内容制作的难度,用到AIGC的能力,产生一些内容、声音甚至动作,可以提升一些人机交互方面的体验。
但它不能从根上解决的,是VR设备长期高频使用、应用场景、使用复杂度的问题,是如何提升用户使用频度以及延长使用时长的问题。即便在游戏这个相对硬核的领域中,也没有形成一个真正有盈利能力的商业模型。所以来说并不能期待AI来完全解决VR的大问题。
新一代VR设备或将带来B2B VR的春天
作为曾被Apple邀请独立体验了4个小时 Vision Pro,而且重度使用Quest3等VR设备的用户,虽然我不会讲任何违反NDA的内容,但我的个人判断是有一定事实基础的,我的观点是,即便是像Vision Pro这样惊艳的设备,像是Quest 3这么成熟的设备,这些有非常好VST(Video See-through)的设备,它们也不会是XR的白衣骑士,它们也许不会带来2C VR的春天。
原因有很多,包括价格因素,体验提升因素、存量市场因素、佩戴舒适性因素以及视觉体验能否与现实中屏幕相提并论的因素。如果出现了一些真正的Killer App——能够解决传统的iPad、Mac、手机上解决不了的事情的App,让用户愿意高频使用甚至愿意耗光电量的App,或许还有一线希望。但否则,二者都不可能带来2C VR真正的春天。
最后给大家讲一个好消息。在我看来,Quest 3和Vision Pro大概率能够带来 B2B VR的第二春。2C会面临很多问题——内容的问题,交互的问题,舒适度的问题,分辨率的问题,价格的问题,用户学习的问题。但是B2B VR通过定制化的内容,定制化的场景,帮助它的终端用户解决了这些问题,更重要的是通过这一代设备提供的VST技术,解决了用户戴上头显的心理障碍以及眼手协同的问题,让用户几乎免学习上手就会。这是一个非常利好的特性。在我看来,基于Quest 3和Vision Pro,可以让广告、销售、工业虚拟仿真、协同远程设计等这些各式各样的B2B VR应用在探索了七八年后真正做起来,而且不仅仅是创新性项目,而是真正可以长期使用的场景。
最后这张PPT上,左边是我的女儿,今年九岁,她带着的这个像VR头显一样的东西,是我美国同事送给我的40岁生日礼物,一个1901年的古董。虽然不是VR,但是它能够提供简单的立体视野。中间的这个是我的背影,是在这个世界上还没有现成的6DOF头显,现成的6DOF的手部追踪,以及道具追踪的时候,我用我们的技术结合Oculus DK2实现的前沿探索。而最右边的就是 Vision Pro。从左边抵达右边,所花费的时间超过了100年。我相信这个领域的未来一定会有更大的发展,希望大家能够多一些耐性,希望我们一起坚持走下去。谢谢大家。