2025上半年,常用AI绘图工具大盘点

2025 年上半年,我常用的 AI 绘图工具盘点来啦。主要集中在 AI 图像生成与编辑领域,下面就来详细说说。

最常用的工具

  1. Midjourney・视觉质感王者
    网址:https://www.midjourney.com/imagine
    它依旧是我上半年用得最频繁的 AI 绘图工具,在创意和视觉效果上仍保持行业领先。V7 版本的质感比 V6 系列有提升,但偶尔会觉得有点过度,这时我会切回 V6 系列继续生成。它的创意激发能力很强,不仅擅长真实感人物和现实图像,各种创意插图、幻想场景以及不同材质的表现效果也很出色,尤其在美感上广受好评。V6/V7 的风格化代码很好用,能轻松产出风格一致又独特的图片,放大和扩图效果也很棒。
    不过缺点也很明显:提示词遵循度一般,“脑补” 能力强,精确控制方面有局限;图片中的文字生成效果差,不支持中文,英文效果也不算理想;另外,对中国元素的理解有偏差,亚洲人物风格偏日系韩系,直接生成的中国人物面孔有时缺乏美感。
    题外话,Midjourney 的 V1 视频模型发布后,图片转视频更方便了,效果也不错,但视频画质目前是 480P,没什么优势。
  2. 即梦・多功能创意平台
    网址:https://jimeng.jianying.com/ai-tool/home
    我真的是即梦的狂热粉丝!它对平面设计师来说是个提效好工具,对小白也很友好。在艺术字、中文海报生成方面目前没什么对手,人物质感提升很快,生成视觉草案、海报等效果都值得一试,不过要是追求高画质细节,还得搭配后期修图和专业软件辅助。
    即梦能生图、生视频、制作对口型数字人,还有画布相关功能补充,现在还能和剪映梦幻联动,生成的素材可以直接同步到剪映,使用很方便。比如想在视频里加贴纸、艺术字、元素气泡等,在即梦做好就能在剪映里用,感觉被字节 “安排” 得明明白白,太好用了根本停不下来!
    即梦的人物质感还在持续提升,但我觉得人物有时太好看反而显得不真实,辨识度不够。因为我对字体比较敏感,发现即梦在智能参考 3.0 阶段,海报中已经使用免费商用字体了,期待它继续优化,也希望海报小字细节能不断改善。
  3. ChatGPT 4o・对话式绘图先锋
    网址:https://chatgpt.com/?model=gpt-4o
    ChatGPT 4o 的绘图功能一出来就惊艳了全球,改图和风格迁移效果不错,能无缝嵌入对话中即时生成和编辑图像,适合制作海报(英文海报效果更好,中文美感一般,但一直在进步)、插画、各种材质的小物件以及快速设计原型参考。
    把它放在 AI 生图工具里显得有点超前,主要是因为它原生多模态集成,聊天时就能画图,在生成细节、语义理解、文字渲染方面质量都很高,还能多轮对话进行局部修改(不过前后一致性会受影响)。
    当然缺点也很突出:拼写错误和细节漏洞存在,生成单张图片像拉生锈的卷闸门;原生生图刚开始还好,聊几轮就偏暖发黄,有种出土文物般的陈旧感。分享两个小技巧,用提示词 “保持色温 6500k” 或 “柔和的漫射光,带有中性或冷色调,确保纯净、无黄色调的外观”,偶尔能改善这种情况。如果就为了绘图功能,更推荐用 Lovart、星流或者 Hatchcanvas 这类能直接对话且批量输出的设计 Agent。

有惊喜的工具

  1. 豆包・国产 AI 性价比之王
    网址:https://www.doubao.com/chat/
    豆包是人人都该试试的国民级 AI,在中文生态下表现出色,中文理解能力强,输出效果稳定,尤其在摄影、电商场景和 3D 风格上表现突出,质感优秀。现在的超能创意 1.0/2.0,在修图、对话修改、批量输出和生成海报等方面都很方便。
    豆包的核心优势在于功能多且能打,因为模型强大,生图功能也上来了。超能创意 2.0 批量出图能力很强,一次能直接出 36 张,108 张图三轮就能搞定。对话改图简单到奶奶都会用,反推和复刻功能也很强,最重要的是现在还免费。
    美中不足的是,改图时多轮对话后图片质量会下降,细节丢失变多;一致性还不够好,有时得看运气;对于高级感海报和图片,提示词有一定要求;复刻时不能完全还原风格,更倾向于还原它擅长的风格。
  2. Flux 1.0 Kontext・一致性编辑利器
    网址:https://playground.bfl.ai/image/edit
    这是 Black Forest Labs 最新推出的 AI 图像生成和编辑工具,图像生成的美感一般,但真实感很好,英文文字生成能力强,尤其在图片编辑方面表现强劲,改图能力出色。
    它能理解上下文,生成和编辑图像时,能保持人物、物品在多场景中的形象一致,适合三视图、连贯场景创作,编辑精准,风格迁移能力也好,可以多次迭代编辑。
    不过多轮编辑后细节会失真,还可能出现图像伪影;指令过于精确或复杂时,可能无法正确响应;对真实世界知识的掌握不够,部分复杂场景理解不到位。Pro/Max 模式推理速度比传统模型快,但不管在哪个平台使用,基本都需要积分点数或会员。
    FLUX.1-Kontext-dev 已开源(https://huggingface.co/black-forest-labs/FLUX.1-Kontext-dev),不过是非商用开源,开发者使用时要遵守相关非商业许可条款。
  3. ComfyUI・专业工作流必备
    虽然今年多次被唱衰,但我还是想说,到目前为止,要做专业工作流,ComfyUI 依然是绕不开的好工具。
    如果你追求对整个图像生成过程的可视化控制,想构建自定义工作流程,需要处理批量任务或集成多模型工具,且有一定编程思维,同时硬件支持,那 ComfyUI 是绝佳选择。它通过节点拼接组合完整流程,灵活性和可控性远超传统图形界面工具,适合希望精细控制生成流程、搭建复杂工作流的用户。如果接受云端,也可以考虑 Liblib 等工具。
    主要难度在于学习曲线陡峭,节点式操作近似徒手编程,需要理解节点间的连接逻辑和数据传递流程,对新手不友好;同时对硬件有依赖,虽然显存管理高效,但对 GPU 性能有要求,配置不足会卡顿。不过能学的话还是建议学一学。
    这里推荐一个教 ComfyUI 的 UP 主 @CG 迷李辰,老师除了普通话有点 “l”“n” 不分,其他都很完美,在 B 站搜他的账号,免费能学很多知识,付费课程我买的时候 200 多,现在也就 300 多,还在持续更新,老师也会在群里答疑,有时候晚上很晚还在解答,很真诚,跟着他入门 ComfyUI 是我做过的很正确的决定(我和这位老师没私交,纯粹觉得好才推荐)。

有印象的工具

  1. Reve・质感胶片风首选
    网址:https://preview.reve.art/app
    它生成速度快,图片质感好,主打高效理解提示词,画面美感和文字渲染能力不错。擅长胶片质感摄影图片、人文摄影、超现实表现、英文海报,支持中文提示词输入。Reve 当初靠 “硬好看” 出圈,从名不见经传到上过排行榜第一,制作艺术字效果不错(但限英文)。Prompt Enhance 功能方便写不出提示词的朋友,而且商用权归用户,限制不复杂,适合电商、小团队使用。
    不过目前修改还是全图更新,没有局部编辑功能;在全景、广角、透明物体、特定角色和复杂场景表现上还有欠缺。
  2. Recraft・设计师快乐老家
    网址:https://www.recraft.ai/
    这是个适合设计师的平台,有很多设计师刚需功能,比如支持 SVG/Lottie 矢量格式输出,在图标、logo、图案设计上适用性强;可以上传自由风格或自己预设的模板,让系列设计图视觉风格统一,“5 张图炼 LoRA” 说的就是它,不过视觉风格统一度不算特别高;样机功能实用,编辑工具箱丰富,工作区简约清晰,界面直观,对设计师友好。现在还内置了 GPT-4o 和 Flux 1 Kontext 系列模型,改图很便捷。
    它预设的很多风格用来做特定风格的插画效果很好,Recraft V3(代号 Red Panda 可能大家更有印象)曾登顶多项 benchmark,提示精确度和画面质量也不错。
    对于不熟悉设计工具的用户,上手需要理解画布与编辑逻辑,用过星流或 Lovart 的话能较快适应。
  3. Ideogram・Logo 设计好帮手
    网址:https://ideogram.ai/
    我认为它是目前 AI 图像生成中处理英文文字最出色的工具之一,适合海报设计、Logo 设计、工业设计、首饰设计等场景,提示词理解和文字集成功能较强,在设计型应用中占优势。不过设计风格偏国外,在国内可能有些 “水土不服”。
    Ideogram 能在图像中生成清晰可读的中英文文本(中文能做但质量差),英文比较精准,能涵盖很多文章内容。Magic Prompt 功能和 Reve 的 Enhance 一样好用,能提高提示词创意质量。Canvas 有些功能实用,但交互不太舒服,逻辑不清晰,需要适应。
    不足在于审美不够突出,艺术风格不够多元,风格迁移类似功能效果也不算好。
  4. Whisk・创意探索工具
    网址:https://labs.google/fx/zh/tools/whisk
    这是 Google Labs 的工具,能通过上传图像作为提示(不用文本提示词)快速生成和重混新图像,基于 Gemini 模型分析图像,使用 Imagen 4 生成输出,整体效果还不错,现在还能直接转视频,玩法很多。
    缺点是很不稳定,登录网站是最大挑战;风格控制还可以,混合图片效果不错,但一致性一般;除了视频动效和不用写提示词也能生成的功能,其他功能现在 ChatGPT 4o 和豆包也差不多能替代。

日常推荐

日常比较推荐的是:Midjourney、即梦、豆包、星流一(最常用的这几个)。

.

.

.

说明:本站所有内容均收集于互联网,如果有不妥之处,敬请谅解。如有侵权内容,请联系我们删除。内容并不能代表产品厂家,或者是第三方的观点,非专业技术类人员,请勿对服务器设备进行操作,以免造成设备不可使用或数据丢失。同时凯铧互联小编建议用户定期对云服务器数据进行备份保存! 北京凯铧互联科技有限公司(简称凯铧互联)由多名前阿里云资深技术专家创立,核心员工来自阿里云、腾讯云等,作为阿里云重要的合作伙伴,专注于为企业用户提供云计算及云计算的解决方案,高端网站建设,设计及维护服务,设计开发经验丰富,用户认可率高. 今天的分享就到这里啦,若您需要帮助, 可以直接扫描添加我们客服微信号,阿里云代理商凯铧互联专业技术团队为您提供全面/便捷/专业的7x24技术服务。