微软正为旗下 AI 助手 Copilot 测试一项名为 “Portraits” 的实验性功能,通过为其配备可交互的动画形象,让原本偏向 “语音化” 的 AI 交互增添更多视觉维度,显著提升了 Copilot 作为助手的交互亲和力。
在 “Portraits” 功能中,微软为用户提供了 40 款风格化的人类虚拟形象选择。这些形象并非静态图标,而是能在用户与 Copilot 进行语音对话时,实时呈现出自然的面部表情与肢体动作,打破了传统 AI 语音交互中 “只闻其声不见其形” 的局限。
该功能背后的核心技术支撑是微软的 VASA-1 AI 模型。借助这一技术,系统仅需一张静态图像作为基础,就能高效生成虚拟形象的头部动态效果,同时实现唇形与语音内容的精准同步 —— 这意味着虚拟形象的 “说话” 节奏能完全匹配 Copilot 的语音输出,让整体交互更显生动、真实,进一步拉近了人与 AI 助手的距离。

.
.
.
.
.
