论文

登录后可查看剩余解析次数。
标签筛选
多任务机器人操作
GNFactor: Multi-Task Real Robot Learning with Generalizable Neural Feature Fields
发表:2023/9/1
多任务机器人操作可泛化的神经特征场视觉行为克隆Perceiver Transformer稳定扩散模型
本文提出了GNFactor,一个利用可泛化神经特征场的行为克隆智能体,旨在提升机器人在复杂环境中的多任务操作能力。GNFactor通过共享3D体素表示,优化重建模块和决策模块,结合视觉语言模型,显著提高了对3D结构和物体语义的理解,在多个真实和模拟任务中展示了优越的泛化能力。
02
RICL: Adding In-Context Adaptability to Pre-Trained Vision-Language-Action Models
发表:2025/8/4
视觉语言动作模型的上下文适应性无参数微调的新任务学习机器人示范数据集上下文学习注入多任务机器人操作
本文提出RICL框架,通过特定微调方案为预训练视觉语言动作(VLA)模型注入上下文自适应能力,允许用户仅用1020个演示任务提升模型性能,而不需进行参数微调,显著降低了用户的使用门槛。
02
ManiGaussian: Dynamic Gaussian Splatting for Multi-task Robotic Manipulation
发表:2024/3/13
3D Gaussian Splatting 表示机器人多模态学习多任务机器人操作未来场景重建动态语义传播
本文提出ManiGaussian动态高斯散点框架,通过高斯嵌入空间中的语义传播和未来场景重建,捕获场景时空动态,实现多任务机器人操作。该方法构建高斯世界模型提供丰富监督,在RLBench多任务评测中较现有方法成功率提升13.1%。
05