论文
登录后可查看剩余解析次数。
标签筛选
LIBERO基准测试
SpecPrune-VLA: Accelerating Vision-Language-Action Models via Action-Aware Self-Speculative Pruning
发表:2025/9/6
视觉语言动作模型加速动作感知自推测剪枝训练无关的剪枝方法动态层级剪枝LIBERO基准测试
本研究提出了一种名为SpecPruneVLA的新方法,以加速视觉语言行动(VLA)模型,通过结合局部和全局信息进行高效剪枝。该方法采用静态和动态剪枝策略,实验结果表明在LIBERO基准测试中,SpecPruneVLA在NVIDIA A800和RTX 3090上分别实现了1.46倍和1.57倍的加速,同时成功率损失微乎其微。
02
$π_\texttt{RL}$: Online RL Fine-tuning for Flow-based Vision-Language-Action Models
发表:2025/10/30
流式视觉语言动作模型在线强化学习微调LIBERO基准测试多任务强化学习环境交互中的去噪建模
本文提出了框架,利用在线强化学习技术对基于流的视觉语言动作(VLA)模型进行微调,解决了大规模应用中行动日志似然性的挑战。该方法在LIBERO和ManiSkill基准测试中表现优异,显著提高模型性能,证明了其有效性和实用性。
06