通义千问正式发布Qwen-Image-Layered图像生成模型,凭借自研的RGBA-VAE核心技术,打破传统AI修图“牵一发而动全身”的局限。该模型创新性引入“图像解耦”理念,摆脱主流视觉大模型的扁平认知,可自动将静态图片拆解为语义独立的RGBA图层,精准解决局部编辑时常见的遮挡错乱与边界模糊痛点。借助这一技术,用户无需复杂抠图,就能灵活完成物体替换、色彩重塑、元素缩放等操作,实现“指哪改哪”的像素级精准重构。目前,该模型相关代码及Demo已全线开源,为商业设计、影视后期等领域提供高效工具,有望加速AI在专业图像编辑场景的落地普及。
.
.


