论文
登录后可查看剩余解析次数。
标签筛选
文本到图像生成
FreeFuse: Multi-Subject LoRA Fusion via Auto Masking at Test Time
发表:2025/10/28
多主体LoRA融合无训练融合方法跨注意力动态掩码文本到图像生成扩散模型推理优化
提出FreeFuse,通过测试时自动生成上下文感知动态掩码,实现多主体LoRA融合,无需额外训练或辅助模型。该方法直接应用于交叉注意力权重,有效提升多主体文本到图像生成的质量与实用性,简化流程并优于现有技术。
03
DreamAnime: Learning Style-Identity Textual Disentanglement for Anime and Beyond
发表:2024/5/7
文本到图像生成风格与身份表征解耦动漫角色生成文本嵌入空间学习少样本概念学习
DreamAnime提出通过少量示例图像,在文本到图像模型嵌入空间创建风格与身份解耦的独立词元,实现动漫角色及艺术风格的灵活组合和创意生成。实验证明其在准确捕获复杂概念及多场景应用中优于现有方法。
03