11 月 18 日,蚂蚁集团正式推出全模态通用 AI 助手 “灵光”,这款应用已同步登陆安卓与苹果应用商店。作为业内首个能通过全代码生成多模态内容的 AI 助手,它开创性地在移动端实现 “自然语言 30 秒生成小应用”,生成的应用支持编辑、交互与分享,彻底降低了 AI 应用创作的门槛。
一、三大核心功能,重构 AI 交互体验
“灵光” 首批上线三大核心功能,覆盖信息获取、应用创作与实景交互等多元场景,全程以 “让复杂变简单” 为产品理念。

- 灵光闪应用:零门槛造工具:用户只需一句话,最快 30 秒就能生成专属 AI 应用,1 分钟内即可完成健身计划工具、旅行规划器、健康食谱生成器等实用工具的创建。如用户咨询“溏心蛋要煮多久?”灵光可生成一个“溏心蛋时间计算器,用户根据实际情况自己选择“鸡蛋大小”“要求的熟度”等条件,自己调整出一个最符合自己情况的答案;用户想知道怎样养车最划算,灵光可以生成一个“养车成本计算器”,用户自由选择里程、油费等,组合出极具个性化的养车方案。这些应用支持参数自定义和即时分享,且并非静态页面,能调用大模型后端能力实现实时交互 —— 咨询溏心蛋煮制时间会生成可调鸡蛋大小和熟度的计算器,想知道养车成本则能获得个性化成本核算工具。
- 灵光开眼:AI 看懂物理世界:搭载 AGI 相机技术,通过实时视频流解析实现对现实场景的观察与理解,还支持文生图 / 视频、图生图 / 视频等创作模式。旅游时对准陌生建筑,就能获得实时讲解,让 AI 成为连接数字与物理世界的桥梁。
- 灵光对话:像策展一样呈现答案:打破传统文字问答的局限,不再堆砌信息而是通过结构化思维梳理逻辑,搭配动态 3D 模型、可交互地图、音视频等可视化内容,让复杂知识 “秒懂”。比如咨询核聚变进展会生成清晰动态图表,查询 798 美食探店路线能直接输出带导航的沉浸式逛吃方案,兼具逻辑张力与信息美感。
二、硬核技术支撑,落地场景生产力
“灵光” 的便捷体验背后,是两大核心技术突破。它实现了全代码生成的多模态输出能力,图表、动画、应用组件等均由模型根据对话情境即时生成;同时构建多智能体协作的 Agentic 架构,能动态调度图像、3D、动画等专用工具实时协作,带来更沉浸的视图体验。

作为蚂蚁集团 AGI 战略的重要产品落地,“灵光” 精准契合 2025 年 AI 应用向场景化生产力工具转型的趋势。此前蚂蚁已加速布局通用人工智能,推出 AI 医疗管家 AQ、布局具身智能灵波科技,蚂蚁百灵大模型也跻身万亿参数阵营,而 “灵光” 的发布,进一步完善了其从技术突破到场景落地的全链路能力。
.
.
.
.
.


