AiPaper

论文

登录后可查看剩余解析次数。
标签筛选
视频扩散模型
StreamDiffusionV2: A Streaming System for Dynamic and Interactive Video Generation
发表:2025/11/11
视频扩散模型实时交互视频生成流媒体内容创作低延迟视频生成多GPU实时流媒体服务
本文提出了StreamDiffusionV2,一个用于动态和交互式视频生成的流式系统,旨在解决现有直播模型在时间一致性和低延迟方面的瓶颈。该系统集成了SLO感知的批处理调度器、块调度器以及其他优化,支持无训练的实时流媒体服务,显著提升用户交互体验。
08
SeedVR2: One-Step Video Restoration via Diffusion Adversarial Post-Training
发表:2025/6/6
扩散模型高效推理视频扩散模型视频恢复一阶段视频恢复模型自适应窗口注意力机制
提出SeedVR2,实现高分辨率视频修复的一步扩散模型。通过对抗性后训练和自适应窗口注意力机制,动态调整窗口规模,解决高分辨率处理中的不一致性,显著提升恢复质量并降低推理成本。验证多种损失函数以稳定训练。
03
InfVSR: Breaking Length Limits of Generic Video Super-Resolution
发表:2025/10/1
视频超分辨率自回归扩散模型长序列视频处理视频扩散模型时序一致性评估
InfVSR创新性将视频超分辨率任务重构为自回归单步扩散模型,通过改造预训练扩散变换器实现流式高效推理,结合滚动缓存与视觉引导保障时序一致性,并通过分块像素监督与跨块分布匹配蒸馏多步扩散过程,有效突破长视频处理的效率和伪影限制。
04
LinVideo: A Post-Training Framework towards O(n) Attention in Efficient Video Generation
发表:2025/10/9
视频扩散模型线性注意力机制后训练稀疏注意力优化高效视频生成分布匹配目标函数
LinVideo提出一种无需数据的后训练框架,通过选择性转换机制自动将预训练视频扩散模型中的部分自注意力层替换为线性注意力,并用任意时刻分布匹配目标有效保持性能,实现最高15.92倍延迟降低和1.252倍加速。
08