论文
登录后可查看剩余解析次数。
标签筛选
长时序一致性建模
TrackVLA++: Unleashing Reasoning and Memory Capabilities in VLA Models for Embodied Visual Tracking
发表:2025/10/8
视觉语言动作模型空间推理机制目标识别记忆长时序一致性建模自回归推理模型
TrackVLA 是一种新颖的视觉语言动作模型,旨在提升具身视觉追踪的能力。通过引入空间推理机制和目标识别记忆模块,该模型解决了严重遮挡和相似干扰物导致的追踪失败。实验表明,TrackVLA 在准确性和稳定性方面表现优越,达到了最新的技术水平。
011
Spinning Straw into Gold: Relabeling LLM Agent Trajectories in Hindsight for Successful Demonstrations
发表:2025/10/8
大语言模型微调序列策略优化大语言模型强化学习训练长时序一致性建模大语言模型推理能力增强
本文提出事后监督学习(HSL)框架,通过辅助LLM重新标记智能体轨迹中的实际达成目标,结合不相关动作掩蔽和样本重加权,提升长时程部分可观环境中LLM智能体的微调效果。实验在ALFWorld和WebShop验证了HSL的高数据效率和兼容性,显著优于传统方法。
04