字节跳动近日开源了一款名为 VINCIE-3B 的 AI 模型,主打连续图像编辑。这款模型从视频中学习,参数仅 3 亿,能记住编辑上下文,避免修改 “跑偏”。
它生成图像只要 4 秒,速度比同类模型快 8 倍。目前,其代码和权重已在 GitHub 发布,基于 Apache2.0 许可,可供非商业使用,能支持影视场景切换、品牌 Logo 植入等场景。
不过,该模型当前仅支持英文指令,官方表示后续会优化中文支持;同时建议编辑轮次不超过 5 次,以防出现虚影。
字节跳动近日开源了一款名为 VINCIE-3B 的 AI 模型,主打连续图像编辑。这款模型从视频中学习,参数仅 3 亿,能记住编辑上下文,避免修改 “跑偏”。
它生成图像只要 4 秒,速度比同类模型快 8 倍。目前,其代码和权重已在 GitHub 发布,基于 Apache2.0 许可,可供非商业使用,能支持影视场景切换、品牌 Logo 植入等场景。
不过,该模型当前仅支持英文指令,官方表示后续会优化中文支持;同时建议编辑轮次不超过 5 次,以防出现虚影。