论文

登录后可查看剩余解析次数。
标签筛选
视频生成加速
Training-Free Efficient Video Generation via Dynamic Token Carving
发表:2025/5/23
视频扩散模型高效推理动态令牌雕刻梯度分辨率生成块状注意力机制视频生成加速
本文提出了一种无需训练的高效视频生成方法Jenga,通过动态注意力雕刻和渐进分辨率生成,显著解决了视频扩散变换器模型的计算瓶颈问题。研究表明,该方法在保持生成质量的同时,实现了8.83倍的推理加速,极大提升了实际应用效率。
03
From Slow Bidirectional to Fast Autoregressive Video Diffusion Models
发表:2024/12/11
自回归视频扩散模型扩散模型蒸馏视频生成加速动态视频生成长时序视频合成
论文提出一种新型自回归视频扩散模型,利用分布匹配蒸馏技术将高质量、缓慢生成的双向模型转化为快速生成的自回归模型。通过教师模型轨迹初始化和非对称蒸馏策略,该模型在VBenchLong基准测试中总得分达到84.27,显著提高了视频生成速度及质量。
02
Sparse VideoGen2: Accelerate Video Generation with Sparse Attention via Semantic-Aware Permutation
发表:2025/5/25
稀疏注意力视频生成Diffusion Transformers语义感知排列训练免费框架视频生成加速
本文提出SVG2,一个无需训练的框架,通过语义感知排列最大化关键词元识别的准确性,减少计算浪费,解决了稀疏注意力在视频生成中的效率瓶颈。该方法基于kmeans算法对词元进行语义重排序,实现高达2.30倍的加速,同时保持视频质量,推动生成效率前沿。
03