聚焦多模态交互与机器人，科大讯飞发布三大AI交互平台升级-人工智能那点事

大模型正在重新定义智能硬件。

从“听懂一句话”，到“理解一个场景”，再到“完成一项任务”，AI交互正从单一语音能力演进为融合视觉、语言、Agent与具身智能的综合能力，成为智能硬件与机器人发展的核心基础设施。

7月2日，在2026科大讯飞智能交互生态发布会上，科大讯飞发布AIUI交互平台、AIUI多语种交互平台及机器人超脑平台三项核心升级。

从多模态交互到全球化部署，再到机器人规模化落地，三大平台共同构建起面向智能硬件与机器人时代的新一代AI交互基础设施。

AIUI交互平台升级，从语音交互迈向多模态AI交互

伴随大模型发展，语音交互正在发生新的变化。

用户需要的不再只是"听懂一句话"，而是能够理解上下文、识别眼前场景，并结合视觉信息完成连续交互。基于这一趋势，AIUI完成近年来最大的一次升级，正式迈向多模态AI交互平台。

在语音能力方面，平台持续优化底层能力。针对低算力RTOS设备，AIUI进一步降低接入门槛，实现在100MHz主频、140KB存储条件下即可稳定运行；多模态降噪与全双工能力同步升级，通过融合语音与视觉信息，在复杂噪声环境中进一步提升识别稳定性，让设备真正做到"听得清"。

与此同时，平台开放100余种超拟人音色，升级语音合成模型，支持轻笑、停顿等副语言表达，并支持Prompt生成不同角色声音。结合数字形象表情动作生成能力，设备能够实现语音、情绪与视觉表达协同，进一步提升交互的自然度。

相比以往，最大的变化来自多模态能力。

聚焦多模态交互与机器人，科大讯飞发布三大AI交互平台升级