5月18日,上海市生成式人工智能服务备案情况显示,智元WITA(硅光动语大模型)成为全国首款合规备案的具身智能交互大模型,意味着中国具身智能产业从“技术验证”加速进入“合规商用”阶段。
记者了解到,WITA模型属于智元机器人“一体三智”(本体、运动智能、作业智能、交互智能)中的交互智能,率先在灵犀X2机器人上搭载。WITA模型具备毫秒级的交互反应能力,通过人类的面部表情和语音语调,就能精准判断对方的情感状态,并给予回应。依靠WITA模型,机器人依靠视觉来理解物理世界,不再需要语音或文字指令。举个例子,当你向机器人同时展示咖啡和牛奶,并询问“睡不着该喝什么”,机器人会迅速指向牛奶并回答“喝牛奶”。
元股证券
智元WITA通过合规备案。
但随着机器人商用化场景的增加,WITA模型的局限性也逐渐显现。

“WITA模型仍不完美,它的工作方式是‘三段式’的,先把你说的话转成文字,让大模型处理完,再把文字转成语音说回来。就好像在传话时,语气、情绪这些言外之意,会在文字转换中丢失掉。”智元机器人董事长邓泰华表示,“三段式”的模型能力并非为真实物理世界的机器人量身定做,仍需要增强具身交互模型中情感化语音、拟人表情和记忆等功能。
智元机器人灵犀X2。 新华社记者 方喆 摄
据悉,智元机器人将在今年三季度推出行业首个“端到端”具身多模态交互大模型WITA Omni 1.0。所谓“端到端”,就是不再拆成语音和文字两个阶段来分别处理,而是直接用人类说话时的完整信息去训练和回应。这样一来,机器人在对话中能保留对话中的情绪和语境,回话时懂得分寸,更像一个真正的人在交流。因为跳过了中间的转换环节,它的反应时延被压缩到了500毫秒以内,接近真人聊天的节奏,还能随时插话、打断和纠正,让交流的感受和人与人说话几乎没有区别。
“WITA模型和WITA Omni的模型都会以云服务的方式提供股票融资交易开户,基于全球云节点部署,WITA是基础云服务,Omni是高阶云服务。”邓泰华表示,未来具身交互智能将会迁移至机器人本地运行,即便在断网环境下,也能如人类一般自然对话。

市场观察:内地股市中重庆股票证券配资的风险偏好变化多周期共振近期,在国际主流股市的箱体震荡区间运行期中,围绕“重庆股票证
2026-02-21
在内地股市处于多空双方博弈更趋胶着的时期阶段中配资炒股排行的近期,在全球多国证券市场的技术面信号反复出现的时期中,围绕“
2026-01-30
飞驰而过的CR450动车试验组、翱翔蓝天的飞机发动机、驶向深海的智能船舶、锻造精密机械的工业母机……高端装备撑起国家工业
2026-05-08
本文来源:时代周报 作者:迟雨 2026年一季度财政收支数据十分提气——全国一般公共预算收入6.16万亿元,同比增长2.
2026-05-06
国务院办公厅印发《关于深化投资审批制度改革的意见》,《意见》提出,严格政府投资项目审批管理。除党中央、国务院有明确要求或
2026-04-18