大模型正在重新定义智能硬件。
从“听懂一句话”,到“理解一个场景”,再到“完成一项任务”,AI交互正从单一语音能力演进为融合视觉、语言、Agent与具身智能的综合能力,成为智能硬件与机器人发展的核心基础设施。
7月2日,在2026科大讯飞智能交互生态发布会上,科大讯飞发布AIUI交互平台、AIUI多语种交互平台及机器人超脑平台三项核心升级。

从多模态交互到全球化部署,再到机器人规模化落地,三大平台共同构建起面向智能硬件与机器人时代的新一代AI交互基础设施。
AIUI交互平台升级,从语音交互迈向多模态AI交互
伴随大模型发展,语音交互正在发生新的变化。
用户需要的不再只是"听懂一句话",而是能够理解上下文、识别眼前场景,并结合视觉信息完成连续交互。基于这一趋势,AIUI完成近年来最大的一次升级,正式迈向多模态AI交互平台。

在语音能力方面,平台持续优化底层能力。针对低算力RTOS设备,AIUI进一步降低接入门槛,实现在100MHz主频、140KB存储条件下即可稳定运行;多模态降噪与全双工能力同步升级,通过融合语音与视觉信息,在复杂噪声环境中进一步提升识别稳定性,让设备真正做到"听得清"。
与此同时,平台开放100余种超拟人音色,升级语音合成模型,支持轻笑、停顿等副语言表达,并支持Prompt生成不同角色声音。结合数字形象表情动作生成能力,设备能够实现语音、情绪与视觉表达协同,进一步提升交互的自然度。
相比以往,最大的变化来自多模态能力。

