股票融资交易开户 全国首款!智元具身交互模型通过合规备案,今年将推出升级版,可与人自然对话

作者:admin 发布时间:2026-05-18 23:49:09

元股证券:ygzq.hk

5月18日,上海市生成式人工智能服务备案情况显示,智元WITA(硅光动语大模型)成为全国首款合规备案的具身智能交互大模型,意味着中国具身智能产业从“技术验证”加速进入“合规商用”阶段。

记者了解到,WITA模型属于智元机器人“一体三智”(本体、运动智能、作业智能、交互智能)中的交互智能,率先在灵犀X2机器人上搭载。WITA模型具备毫秒级的交互反应能力,通过人类的面部表情和语音语调,就能精准判断对方的情感状态,并给予回应。依靠WITA模型,机器人依靠视觉来理解物理世界,不再需要语音或文字指令。举个例子,当你向机器人同时展示咖啡和牛奶,并询问“睡不着该喝什么”,机器人会迅速指向牛奶并回答“喝牛奶”。

元股证券

智元WITA通过合规备案。

但随着机器人商用化场景的增加,WITA模型的局限性也逐渐显现。

2026炒股配资

“WITA模型仍不完美,它的工作方式是‘三段式’的,先把你说的话转成文字,让大模型处理完,再把文字转成语音说回来。就好像在传话时,语气、情绪这些言外之意,会在文字转换中丢失掉。”智元机器人董事长邓泰华表示,“三段式”的模型能力并非为真实物理世界的机器人量身定做,仍需要增强具身交互模型中情感化语音、拟人表情和记忆等功能。

智元机器人灵犀X2。  新华社记者 方喆 摄

据悉,智元机器人将在今年三季度推出行业首个“端到端”具身多模态交互大模型WITA Omni 1.0。所谓“端到端”,就是不再拆成语音和文字两个阶段来分别处理,而是直接用人类说话时的完整信息去训练和回应。这样一来,机器人在对话中能保留对话中的情绪和语境,回话时懂得分寸,更像一个真正的人在交流。因为跳过了中间的转换环节,它的反应时延被压缩到了500毫秒以内,接近真人聊天的节奏,还能随时插话、打断和纠正,让交流的感受和人与人说话几乎没有区别。

“WITA模型和WITA Omni的模型都会以云服务的方式提供股票融资交易开户,基于全球云节点部署,WITA是基础云服务,Omni是高阶云服务。”邓泰华表示,未来具身交互智能将会迁移至机器人本地运行,即便在断网环境下,也能如人类一般自然对话。