选择你喜欢的标签
我们会为你匹配适合你的网址导航

    确认 跳过

    跳过将删除所有初始化信息

    您的位置:0XUCN > 资讯 > 智能
    新闻分类

    Qwen-Image-Layered – 阿里推出的AI图像编辑模型

    智能 PRO 稿源:AI工具集 2025-12-22 13:05

    Qwen-Image-Layered是什么

    Qwen-Image-Layered是阿里团队推出的AI图像编辑模型,能将普通图片自动拆分为独立的RGB透明图层,实现类似Photoshop的分层编辑功能。通过注意力机制和位置编码动态拆分图层,支持3-10层的灵活分解,允许对单层进行缩放、着色等操作而不影响其他部分。相比传统AI修图”牵一发而动全身”的问题,模型在Hugging Face开源测试中显示,色彩还原误差仅为0.0033,透明度准确率高达0.916,显著优于现有技术。

    Qwen-Image-Layered的主要功能

    • 图像分层:将单一 RGB 图像分解为多个 RGBA 图层,每个图层语义独立,便于后续编辑。
    • 独立编辑:各图层可单独操作,如调整大小、重新定位、重新着色等,不影响其他图层。
    • 高保真操作:支持高保真基本操作,如清晰删除对象、无失真调整大小、自由移动对象等。
    • 灵活分解:支持可变数量的图层分解,还可递归分解,实现无限分解,满足不同编辑需求。
    • 数据管道:建立从 Photoshop 文档提取多层图像的管道,解决高质量多层训练数据稀缺问题。

    Qwen-Image-Layered的技术原理

    • RGBA-VAE:通过统一 RGB 和 RGBA 图像的潜在表示,为多层图像的生成和分解提供基础框架。
    • VLD-MMDiT 架构:采用可变层分解的 MMDiT 架构,能够灵活地将图像分解为不同数量的图层。
    • 多阶段训练策略:结合预训练的图像生成模型,通过多阶段训练,使其适应多层图像分解任务,提升模型性能。
    • 数据管道:从 Photoshop 文档中提取和标注多层图像,建立高质量的训练数据集,解决数据稀缺问题。
    • 扩散模型:基于扩散模型的生成机制,逐步从噪声中重建图像的多层表示,实现高质量的图层分解。

    Qwen-Image-Layered的项目地址

    • Github仓库:https://github.com/QwenLM/Qwen-Image-Layered

    • HuggingFace模型库:https://huggingface.co/Qwen/Qwen-Image-Layered

    • arXiv技术论文:https://arxiv.org/pdf/2512.15603

    • 在线体验Demo:https://huggingface.co/spaces/Qwen/Qwen-Image-Layered

    Qwen-Image-Layered的应用场景

    • 广告设计:快速分解图像为多个图层,方便对广告中的元素进行独立编辑,如更换背景、调整产品位置等。
    • 影视后期:对影视画面中的角色、道具等进行分层处理,便于特效添加、颜色校正等操作。
    • 创意设计:设计师可以轻松分解创意图像,对不同元素进行独立修改,激发更多创意灵感。
    • 图像修复:将图像分解后,可单独修复受损图层,而不影响其他部分,提高修复效率。
    • 教育演示:在教学中,将复杂图像分解为简单图层,帮助学生更好地理解图像构成和编辑原理。

    超好看的资讯你懂得 >>> 点击进入

    0XU.CN

    [超站]友情链接:

    四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
    关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/

    图库
    公众号 关注网络尖刀微信公众号
    随时掌握互联网精彩
    赞助链接
    热门AI排行
    排名 热点 热门指数