论文
登录后可查看剩余解析次数。
标签筛选
R2RGEN: Real-to-Real 3D Data Generation for Spatially Generalized Manipulation
发表:2025/10/10
基于模仿学习的机器人操作空间通用化数据生成真实到真实的3D数据生成点云观察-动作对扩增复杂多物体任务处理
本文提出了一种名为R2RGen的真实到真实三维数据生成框架,旨在提高机器人在不同空间配置下的操作能力。通过对点云观察动作对的扩展,R2RGen实现了高效的数据生成,突破了传统模拟环境的限制,增强了机器人在多物体任务中的泛化性能,避免了仿真误差。
03
GraspVLA: a Grasping Foundation Model Pre-trained on Billion-scale Synthetic Action Data
发表:2025/5/6
视觉-语言-动作模型基于合成数据的抓取模型大规模合成动作数据集自回归感知任务链式思维过程
GraspVLA是一个预训练于十亿帧合成动作数据的抓取基础模型,填补了现有模型对真实数据依赖的空白。通过构建SynGrasp1B数据集,结合自回归感知和流匹配动作生成,GraspVLA实现了高效的零样本泛化能力,推动了机器人抓取的应用潜力。
03
ModuLoRA: Finetuning 2-Bit LLMs on Consumer GPUs by Integrating with Modular Quantizers
发表:2023/9/28
大语言模型微调低秩适配微调方法量化方法2-bit LLMs 训练消费者 GPU 优化
本文提出的是一种内存高效的微调算法,能在24GB的消费级GPU上以2/3/4比特精度微调高达65亿参数的LLM。其模块化设计通过集成任意权重量化器与低秩适配器,首次实现了对2比特和3比特LLM的微调,显著降低内存消耗并在多个任务中表现优秀。
02
LoRAFusion: Efficient LoRA Fine-Tuning for LLMs
发表:2025/10/1
大语言模型低秩适配微调大语言模型参数高效微调图形分割方法多任务微调调度算法内存绑定操作优化
本文提出LoRAFusion,一个高效的低秩适配微调系统,旨在优化大语言模型的微调效率。通过图分裂方法,该系统融合内存密集型操作,减少不必要的内存访问,同时通过自适应批处理算法优化多任务调度,从而实现显著的性能提升,最高可达1.96倍加速,提供了LoRA微调的新方向。
03
Parameter-Aware Contrastive Knowledge Editing: Tracing and Rectifying based on Critical Transmission Paths
发表:2025/1/1
大语言模型知识编辑参数感知对比知识编辑关键传输路径识别知识基模型编辑方法多层知识累积
本文首次将关键传输路径概念引入大型语言模型的知识编辑,识别出影响模型预测的关键信息流,以便更有效地进行参数更新。提出的参数感知对比纠正算法,通过对比不重要路径,提高知识编辑性能,并在多个数据集和模型上验证了其优越性。
02
Efficient Streaming Language Models with Attention Sinks
发表:2023/9/30
生成式大语言模型流式应用窗口注意力机制注意力沉陷现象长文本建模高效语言模型推理
在流式应用中部署大型语言模型(LLMs),传统方法面临内存消耗大和泛化能力弱的问题。论文发现“注意力汇聚”现象,即保留初始词元的KV状态可以提高性能。基于此,提出StreamingLLM框架,允许模型无微调处理无限序列,显著提升了处理速度和效率。
01
Actions as Language: Fine-Tuning VLMs into VLAs Without Catastrophic Forgetting
发表:2025/9/26
视觉语言模型微调视觉语言动作模型防止灾难性遗忘低秩适配方法机器人遥操作数据
该论文介绍了一种将视觉语言模型(VLMs)微调为视觉语言行动模型(VLAs)的方法,称为VLM2VLA。通过将低层机器人动作用自然语言表述,解决了VLM与机器人数据分布不匹配的问题。该方法有效避免了灾难性遗忘,保持了模型的基本推理能力,在真实实验中实现了零样本泛化。
04
DrVoice: Parallel Speech-Text Voice Conversation Model via Dual-Resolution Speech Representations
发表:2025/6/11
基于大语言模型的语音对话模型双重分辨率语音表示并行语音文本生成自动回归建模开放音频基准测试
本文提出了名为DrVoice的并行语音文本对话模型,采用双分辨率语音表征机制,显著降低LLM输入频率至5Hz,有效减少计算成本。实验结果显示,DrVoice在多个基准测试中达到了新的最先进水平,展示了强大的生成能力及工业应用潜力。
03
15 Years of Research on Redirected Walking in Immersive Virtual Environments
发表:2018/1/12
虚拟环境中的重定向行走虚拟现实中的运动控制虚拟行走技术综述用户运动路径优化大规模虚拟环境交互
本文回顾了重定向行走技术(RDW)自首次应用以来15年的研究进展。RDW通过不易察觉的旋转在虚拟环境中解决用户物理空间限制,实现用户虚拟行走的无限扩展,同时保护沉浸感,控制运动路径并减少晕动症风险。
02
MARR: A Multi-Agent Reinforcement Resetter for Redirected Walking
发表:2024/2/21
多智能体强化学习重定向行走重置技术多用户环境下的行为优化用户沉浸感与存在感环境上下文感知重置
MARR(多智能体强化重置器)是一种新方法,旨在优化虚拟现实中的重定向行走(RDW)中的重置机制。该系统基于多智能体强化学习,学习在动态用户和静态障碍物的环境中寻找最佳重置方向,从而显著减少重置次数,提升用户沉浸感,超越现有启发式算法的表现。
02
Detoxifying Large Language Models via Autoregressive Reward Guided Representation Editing
发表:2025/9/24
大语言模型去毒化自回归奖励引导表示编辑毒性转变建模动态编辑策略效能和效率优化
本研究提出自回归奖励引导的表示编辑(ARGRE)框架,有效去毒化大型语言模型。ARGRE通过建模潜在表示空间中的毒性过渡,识别无毒语义方向并在毒性与无毒表示间插值,生成细粒度过渡轨迹,实现稳定、精确的奖励引导编辑,增强了去毒化效果。
04
UltraFusion: Ultra High Dynamic Imaging using Exposure Fusion
发表:2025/1/20
曝光融合技术高动态范围成像超高动态范围数据集基于引导的图像修复自然色调映射生成
本文提出UltraFusion,首个能够融合9档曝光差异的曝光融合技术。该方法将曝光融合建模为引导修复问题,利用欠曝光图像引导填补过曝区域细节,并通过生成模型实现自然色调映射。实验表明,UltraFusion在多项基准和新收集数据集上超越现有技术。
02
De-collapsing User Intent: Adaptive Diffusion Augmentation with Mixture-of-Experts for Sequential Recommendation
基于扩散模型的推荐系统序列推荐中的用户意图重构稀疏数据增强方法混合专家架构自适应扩散增强框架
本文提出了一种自适应扩散增强推荐框架(ADARec),旨在解决序列推荐中的数据稀疏性问题。通过利用混合专家架构,ADARec有效解耦用户意图的粗粒度与细粒度层次,重建真实意图层次结构。实验表明,该方法在标准基准和稀疏序列上均显著优于现有技术。
010
扇形覆冰特高压八分裂导线舞动特性分析
扇形覆冰导线舞动特征分析特高压输电线路风洞实验ABAQUS有限元模型重冰区输电线气动参数研究风速对导线舞动影响分析
本文结合风洞实验与数值模拟,研究了重冰区特高压输电线路扇形覆冰八分裂导线的舞动特性。通过建立有限元模型,获得各覆冰子导线的气动参数,分析了风速、档距和初始风攻角对舞动特征的影响,证明模型能有效反映舞动特性。
02
UniEdit: A Unified Knowledge Editing Benchmark for Large Language Models
发表:2025/5/18
大语言模型编辑基准邻域多跳链采样算法开放域知识图谱模型编辑性能评估知识编辑样本生成
本文提出了UniEdit,一个针对大型语言模型的统一知识编辑基准,旨在通过开放域知识增强模型的编辑性能。研究设计了邻域多跳链采样算法,实现从25个领域选择实例,确保编辑覆盖全面且评估多样,实验结果揭示了不同模型的优缺点,促进了未来研究的深入。
03
Rethinking Memory in AI: Taxonomy, Operations, Topics, and Future Directions
发表:2025/5/2
记忆表示分类记忆操作动态大语言模型的记忆系统长上下文记忆研究基于 LLM 的个性化记忆
本综述系统分析了人工智能中的记忆机制,提出了统一分类法,将记忆分为参数化和上下文形式,并定义了六种基本操作:巩固、更新、索引、遗忘、检索和压缩。这些操作映射到长期记忆与多源记忆等研究方向,为AI记忆系统提供了结构化和动态的视角,指明未来研究方向。
05
Twilight: Adaptive Attention Sparsity with Hierarchical Top-$p$ Pruning
发表:2025/2/5
自适应注意力稀疏性长上下文大语言模型加速基于Top-$p$采样的稀疏注意力动态预算注意力机制自注意力操作加速
本研究提出了框架,通过引入采样来实现自适应注意力稀疏性,旨在加速长上下文大语言模型(LLMs)。实验结果显示,该框架可自适应剪枝98%冗余词元,实现15.4倍自注意力操作加速和3.9倍的端到端延迟加速,同时不损失准确性。
01
PvP: Data-Efficient Humanoid Robot Learning with Proprioceptive-Privileged Contrastive Representations
发表:2025/12/15
人形机器人全身控制人形机器人学习对比学习框架状态表示学习方法数据高效强化学习
本文提出了PvP框架,通过利用本体状态与特权状态之间的互补性,解决了人形机器人全身控制中的样本效率问题。该框架无需手工设计数据增强,能够学习紧凑且与任务相关的潜在表示,实现更快的策略学习。实验表明,PvP在速度跟踪和动作模仿任务中显著改善了样本效率和性能,推动了人形机器人学习的发展。
03
DiffTMR: Diffusion-based Hierarchical Alignment for Text-Molecule Retrieval
发表:2025/10/25
扩散模型分子检索层次化对齐方法文本-分子检索架构动态扰动嵌入机制跨模态层次对齐
DiffTMR 是一种新颖的文本分子检索框架,通过将检索视为逆向去噪过程,解决了传统方法在检测域外数据和保持多样性方面的局限性。结合分层扩散对齐和动态扰动嵌入机制,DiffTMR 提升了检索准确性和域外泛化能力,评估结果显示其在基准数据集上超越现有基线模型。
02
Wavelet Enhanced Adaptive Frequency Filter for Sequential Recommendation
发表:2025/11/10
序列推荐系统自适应频域滤波小波变换特征增强动态用户偏好建模频域分析方法
本研究提出了一种新颖的Wavelet Enhanced Adaptive Frequency Filter (WEARec)用于序列推荐,通过动态频域滤波和小波特征增强克服现有频域方法的限制。这一方法能够个性化地提取用户的动态偏好,并有效重构模糊的非平稳信号,从而提升长序列推荐的性能与效率,实验证明其优越性。
05
…