发布日期:2024-11-18 12:57 点击次数:71 |
11 月 12 日,小度科技 CEO 李莹在百度世界 2024 上正式揭开了小度 AI 眼镜的面纱。
在一副与传统眼镜几乎无异的外形下,小度AI眼镜不仅集成了一副耳机和一个摄像头,更重要的是作为全球首款搭载中文大模型的原生 AI 眼镜,在实现多模态交互的基础上,将支持边走边问、识物百科、视听翻译以及智能备忘等一系列AI功能。
小度的入场,也让「AI 眼镜」这团火烧得更旺了。
从今年伊始,大模型涌入硬件后就迅速催生出大量的 AI 硬件产品,「AI 眼镜」作为这一赛道的热门之一,Ray-Ban Meta 在发售半年后获得了一百万的销量。与此同时,大量科技公司都在尝试进入这个新兴的领域,甚至彭博社在最近的报道中披露,苹果内部也在推进代号「Atlas」的 AI 眼镜项目。
这种热情并不难理解。在 AI 眼镜的火爆背后,其实有着一条非常清晰的逻辑:在满足传统眼镜光学功能的基础上,AI 眼镜还可以集成开放式耳机和摄像头,用更便捷的方式满足了很多消费者的智能化需求。正如从传统手表到智能手表的升级,在满足便捷查看时间的基础需求之上,智能手表加入了更多的智能功能。
不过,AI 眼镜或者说智能眼镜并不是一个突然出现的产品,早在好几年前,华为等其他厂商就一直在推出类似的产品——将耳机或者摄像头集成到传统外形的眼镜中,但始终没有引起消费者的兴趣。而转变背后最关键的变量是:
大模型来了。
简单来说,大模型带来了更聪明的 AI,真正意义上让人与 AI 之间的语音交互、甚至多模态交互变得能用、好用,也让 AI 眼镜的智能化升级有意义。就像如果没有多点触控的支持,初代 iPhone 的智能化也无从谈起。
但大模型到底让 AI 眼镜发生了哪些变化?一副好的 AI 眼镜需要什么样的能力?小度又会在 AI 眼镜的进程中扮演什么样的角色?
大模型涌入眼镜,AI 重塑智能体验
很多人都需要眼镜,这是一个不争的事实。但当大模型涌入眼镜,会发生什么样的改变?
就拿刚发布的小度AI眼镜来讲,不仅省去了一副耳机,还集成了一颗1600万像素的摄像头,可以随时用第一视角记录下生活和旅行中的精彩画面。更重要的是,大模型技术的应用让AI眼镜能够理解用户的意图,带来革命性的多模态交互,真正超越单一功能设备。
众所周知,大模型带来最大的变化之一就是更强大的自然语言理解能力,用户当然也就愿意跟AI进行更高频的交互。正如小度今年初换上了新「大脑」——基于百度文心大模型打造的DureOS 操作系统,智能水平有了质的飞跃,在AI 对话聊天中用户跟小度进行多轮交互的次数,比起传统的语音对话,整整提升了 700%。
换言之,基于大模型的「AI 智能进化」奠定了 AI 眼镜把语音作为主要人机交互方式的基础,就算只是语音拍照、录像、播放音乐/播客等体验也会有根本的改进。
更何况,大模型还带来了前所未有的功能和体验升级,尤其搭配摄像头带来的视觉能力。比如小度 AI 眼镜上的翻译和总结功能,出国旅游的时候,不管是机场、酒店的信息,还是在餐厅看菜单,都能让小度“阅读理解”后,为你进行讲解。
在旅游时,遇到一处陌生的建筑或景点,这时候 AI 眼镜就可以作为「AI 导游」,结合视觉、定位以及知识库直接介绍景点。
简单来说,大模型驱动的 AI 眼镜不仅人机交互变得自然、流畅,同时也在从「智能硬件」向「智能助手」转变,让用户能够随时随地,通过 AI 从不同角度、不同深度理解世界。如果还有共享用户视觉的能力,则是更进了一步。
做好一副 AI 眼镜,关键在哪里?
放眼当下,AI 眼镜变得越来越炙手可热,也有越来越多新品推出,不过总的来看大抵是两类:一类就是在AR眼镜上通过接入大模型获得AI能力;另一类则是基于大模型原生开发的AI眼镜,同时集成了音频和 AI 模块,甚至还有摄像头,但并不搭载光学和显示模块,典型代表就是 Ray-Ban Meta 和小度 AI 眼镜。
这两种 AI 眼镜的差异不仅反映在能力的差异上,更直接关系到它们的日常体验中。
AR眼镜由于搭载了光学显示模组,虽然有了显示能力,但相对应地,重量和成本都会有明显地增加,续航也面临很大的挑战,很难做到长时间配戴。
而带摄像头的 AI 眼镜,虽然不支持显示,但受益于大模型原生的智能能力,完全可以进行更自然、顺畅的人机交互,同时砍掉光学显示模组,不仅意味着成本的降低以及续航的提升,更重要的是可以设计得更轻薄,实现更长时间的配戴,使用场景更加广泛。
实际上我们会发现,要真正做好一副 AI 眼镜,绝不仅仅是简单地利用供应链资源进行组装,而是涉及方方面面,根本在于软硬件一体化,以及与大模型的深度融合。
这也是 Meta 和小度能做好一副 AI 眼镜的关键基础。小度 AI 眼镜就搭载了基于百度文心大模型的 DuerOS AI操作系统,不仅和 Ray-Ban Meta 一样支持视觉 AI,而且在自然语言交互、多模态感知、拟人化呈现等方面,都有极佳的表现。其次,在软硬一体化优势的产品定义能力上,小度打造了智能屏、健身镜、智能学习机、闺蜜机等各种智能设备,沉淀了非常深厚的硬件能力和供应链资源。
不过另一方面,用户对 AI 眼镜智能化的需求具有明显的本土化特征,语言、文化和使用场景的差异也会在一定程度上决定 AI 眼镜的体验。换句话说,在中国市场,AI 眼镜必须更懂中文,更理解中国用户的使用需求和场景。
在这一点上,国产 AI 眼镜显然更有优势。尤其是小度 AI 眼镜,背靠百度文心大模型这个全球最懂中文的大模型之一,在中文环境下能够更准确地理解我们的意图,生成更高质量的回答。另外小度还能无缝接入百度及⾏业伙伴丰富的数据、应⽤⽣态,进一步扩展AI眼镜的“软实力”。
同时小度也更懂国内用户。正如前文所提到的,小度旗下设备众多,并且都取得了不俗的成绩。按照官方给出的数据,小度各类智能设备目前已经覆盖了超过 4600 万家庭用户。
这也正是小度 AI 眼镜的本土化优势所在,再加上小度、百度以及行业生态的应用支撑,让用户在出行、学习、办公、娱乐、健康等与眼镜紧密相关的场景下也能享受到全面的服务。
一言以蔽之,通过深耕中文大模型和中国用户的实际场景需求,充分发挥自身的内容和生态优势,小度AI眼镜可以更加灵活、精确地满足国内市场的多样化应用场景。
市场爆发前夜,AI 眼镜需要新的破局者
作为一种新品类,随着产品的出圈、市场热度的攀升,AI 眼镜可以说已经有了一定的用户认知。但 AI 眼镜想要在国内市场普及到更广泛的用户群体,仍然还有很多方面需要攻克和改进。
重量、续航、影像、音频……还有更多的功能和更强的智能,它们共同构建的功能和体验,每一个方面都关乎用户对于 AI 眼镜这个新品类的认知和接受度。这些改进当然不简单,尤其是要在保持 AI 眼镜轻便、长续航的同时,对软硬件以及大模型都提出了严苛的要求。
所以,AI 眼镜行业需要新的破局者,尤其是在国内市场,通过垂直整合软硬件以及大模型的能力,解决用户在使用中的痛点、痒点,打造一副打动中国消费者的 AI 眼镜,从而带动整个市场向前发展。
从这个角度来看,小度的入场不仅是自身「AI+硬件」战略的延续,以及 AI 眼镜的产品升级,也是在探索中国 AI 眼镜的产品范式,推动整个行业的迭代优化。