论文

登录后可查看剩余解析次数。
标签筛选
MEGCF: Multimodal Entity Graph Collaborative Filtering for Personalized Recommendation
发表:2022/6/13
多模态实体图协同过滤个性化推荐系统多模态用户偏好建模深度特征提取E-commerce平台推荐
本文提出MEGCF模型,针对多模态推荐系统中多模态特征提取(MFE)与用户兴趣建模(UIM)之间的错配问题,通过抽取语义实体提升用户偏好反映,构建用户与物品之间的图结构,并利用情感加权的图卷积网络细化信息传播,从而提高推荐准确性。
01
Efficient Large-Scale Language Model Training on GPU Clusters Using Megatron-LM
发表:2021/4/9
大语言模型强化学习训练大语言模型微调基于 transformer 的高效前向预测GPU集群训练管道并行训练
本文提出了一种新的交错流水线并行调度,结合张量、流水线和数据并行方法,有效提高了大规模语言模型在GPU集群上的训练效率。在3072个GPU上可达到502 petaFLOP/s的训练速度,吞吐量提高超过10%。
03
RWKV-7 "Goose" with Expressive Dynamic State Evolution
发表:2025/3/19
RWKV架构语言模型性能评估多语言任务开源预训练数据集状态跟踪与语言识别
本文介绍了RWKV7 "Goose",一种具有常数内存使用与推理时间的新型序列建模架构。尽管训练所需词元少,但该29亿参数的语言模型在多语言任务上创造了3B级最先进性能,并在英语任务表现上与现有模型相当。通过引入向量值门控与上下文学习率的广义德尔塔规则,RWKV7实现了状态跟踪与正则语言识别,同时保持训练的并行性,超越了Transformer的能力。
011
Semantics Meet Signals: Dual Codebook Representationl Learning for Generative Recommendation
发表:2025/11/15
生成式推荐系统通用推荐系统双代码本表示学习协同过滤与语义理解平衡FlexCode框架
本文提出了一种名为FlexCode的新框架,通过双码本表示学习平衡协同过滤和语义理解的关系,从而提升生成式推荐系统的性能。FlexCode自适应地分配词元预算,采用轻量级混合专家模型增强预测准确性与长尾物品的鲁棒性,在各类数据集中表现优于基线模型。
07
RoboFAC: A Comprehensive Framework for Robotic Failure Analysis and Correction
发表:2025/5/18
机器人失败分析与校正框架视觉语言动作模型基于任务理解的故障校正RoboFAC数据集开放世界机器人操作
本文提出了RoboFAC框架,旨在改善视觉语言动作模型在开放世界场景中对机器人失败的分析与纠正能力。通过构建包含9440条错误操控轨迹和78623个问答对的大规模RoboFAC数据集,开发出具备任务理解、失败分析和纠正能力的RoboFAC模型,实验证明其在多项任务中显著提升表现。
02
Adversarial Data Collection: Human-Collaborative Perturbations for Efficient and Robust Robotic Imitation Learning
发表:2025/3/15
对抗数据收集人机协作扰动机器人模仿学习实验数据效率增强鲁棒性的任务表现
本论文提出对抗性数据收集(ADC)框架,强调在机器人模仿学习中数据质量超越数量。通过人机协作的实时互动,ADC采用协作扰动策略,在最少演示中显著提升了任务性能与鲁棒性,同时推翻传统静态数据记录的方式,展现出极高的信息密度和组合泛化能力。
07
AHA: A Vision-Language-Model for Detecting and Reasoning Over Failures in Robotic Manipulation
发表:2024/10/1
视觉语言模型机器人操作中的失败检测AHA数据集任务与运动规划基于自然语言的故障推理
AHA是一种开源的视觉语言模型,旨在通过自然语言检测和推理机器人操控中的失败。该模型将失败检测构建为自由形式的推理任务,能够适应不同机器人和任务,并提供详细解释。经过精细调优,AHA基于新生成的AHA数据集,展现出对现实世界应用的有效性和优越性。
04
Robotic World Model: A Neural Network Simulator for Robust Policy Optimization in Robotics
发表:2025/1/17
机器人世界模型自回归机制长时序预测模型驱动强化学习自监督训练
本文提出了一种新颖的机器人世界模型框架,结合双重自回归机制与自监督训练,能够在不依赖领域特定偏置的情况下实现长时序的可靠预测。这一方法促进了策略优化,支持在想象环境中有效训练,并确保在现实世界系统中的无缝部署,从而解决了机器人控制中的鲁棒性与适应性问题。
03
Agility Meets Stability: Versatile Humanoid Control with Heterogeneous Data
发表:2025/11/22
人形机器人动态跟踪与平衡控制异构数据驱动的控制框架混合奖励机制人类动作捕捉数据集鲁棒性与灵活性统一
本文提出了框架,首次将人形机器人动态运动跟踪与极端平衡维护统一于单一策略中。通过利用异构数据源,结合人类动作捕捉与合成平衡运动,实现了敏捷性与稳定性的协调。混合奖励方案及自适应学习策略有效提高了训练效率,验证了该框架在多样化运动中的应用潜力。
03
ggy423.pdf
深度神经网络地震到达时间捡拾自动化地震相位咬合地震监测与分析地震传感器数据处理地震相位识别技术
随着地震传感器数量的激增,手动拾取地震相位变得愈发困难,现有自动方法仍难以超越经验分析师的表现。本文提出基于深度神经网络的PhaseNet,能准确拾取P波和S波的到达时间,显著提高拾取准确度和召回率,为地震定位和速度模型的改进提供了新方法。
04
Thinking in 360°: Humanoid Visual Search in the Wild
发表:2025/11/25
人形机器人视觉搜索360°全景图像处理视觉空间推理能力H* Bench基准测试开放源代码模型优化
人类在360°环境中结合头部与眼睛运动高效进行视觉搜索。本文提出类人视觉搜索(HVS)方法,使智能体在沉浸式360°全景图像中主动旋转头部寻找目标。构建的新基准H Bench验证了视觉空间推理能力的重要性,实验显示顶级模型成功率较低,但后训练技术显著提高了开源模型的表现,挑战仍存。
05
Learning to Execute
发表:2014/10/17
长短期记忆网络训练顺序到顺序学习程序求值课程学习新变体字符级表示映射
本文探讨了长短期记忆网络(LSTM)在序列到序列学习中的表达能力与可学习性,通过训练LSTM评估具有简单结构的计算机程序,首次证明其可以从字符级表示中准确输出。作者提出了一种新型课程学习策略,显著提升了LSTM在程序执行的性能,使其能以99%准确率完成加法任务。
01
Black-Box On-Policy Distillation of Large Language Models
发表:2025/11/14
黑箱策略蒸馏生成对抗蒸馏大语言模型蒸馏基于生成模型的反馈机制学生大语言模型训练
本研究提出了一种生成对抗蒸馏(GAD)方法,用于在黑箱环境中从教师大语言模型中提取知识。该方法通过构建最小最大博弈,训练判别器与学生模型共同演化,提供在线策略反馈。实验表明,GAD在性能上优于传统的序列级蒸馏。
02
Scaling Latent Reasoning via Looped Language Models
发表:2025/10/30
循环语言模型潜在空间推理预训练模型优化信息熵正则化大规模语言模型训练
本文提出了一种新型的循环语言模型(Looped Language Models, LoopLM),通过在预训练阶段嵌入推理能力,优化了基于潜空间的迭代计算。Ouro模型在7.7T词元训练基础上,展现出优于12B参数的SOTA LLM的性能,且推理轨迹更一致。
030
SCoTER: Structured Chain-of-Thought Transfer for Enhanced Recommendation
发表:2025/11/24
大语言模型推荐系统结构化推理链转移模式发现机制高效模型结构集成在线推荐系统优化
论文提出了SCoTER,一个结构化思维链迁移框架,旨在有效整合大型语言模型在推荐系统中的推理能力。SCoTER通过自动模式发现和结构保持集成解决了当前方法的两大挑战,实现了更高效的模型性能,实验验证了其优越性。
05
Graph Segmentation and Contrastive Enhanced Explainer for Graph Neural Networks
发表:2025/4/11
图神经网络解释器图分割技术对比学习增强解释器图结构数据建模模型可解释性
本文提出了一种新颖的图神经网络(GNN)解释器,结合图分割与对比学习。通过将输入图分割为解释性和冗余子图,并进行边扰动以生成正负例,该方法有效增强了解释的忠实度,在图分类和节点分类任务中显示出优越的性能。
02
Physics informed WNO
发表:2023/10/30
物理信息神经网络波LET神经算子算子学习随机投影物理信息学习
本文提出了一种物理信息引导的小波神经算子(PIWNO),旨在解决传统方法求解偏微分方程(PDEs)所需的大量标注数据问题。该方法能够在无需标注训练数据的情况下,有效学习参数化PDE族的解算子,通过四个相关的非线性时空系统验证其有效性。
04
LightRAG: Simple and Fast Retrieval-Augmented Generation
发表:2024/10/8
检索增强生成 (RAG)图结构文本索引与检索多级检索系统增量更新算法开放源码检索系统
本文提出了LightRAG,一个新颖的检索增强生成(RAG)系统,旨在克服现有RAG方法的局限性。LightRAG通过引入图结构,采用双层检索系统,增强了对低层和高层知识的综合检索能力,并通过增量更新算法提升了系统响应效率,实现了更准确和相关的生成回答。
03
Enhancing Sequential Recommendation with World Knowledge from Large Language Models
发表:2025/11/25
基于大语言模型的序列推荐系统大语言模型世界知识增强生成增强检索方法多层次注意力机制动态用户兴趣建模
本文提出了GRASP框架,通过生成增强检索和多级注意力机制,克服了传统序列推荐系统在信息捕获方面的局限性。研究表明,GRASP能够在存在大语言模型幻觉的情况下,有效利用世界知识,从而增强用户动态兴趣的建模和推荐性能,达到先进水平。
05
Towards A Tri-View Diffusion Framework for Recommendation
发表:2025/11/25
基于扩散模型的推荐系统最大化Helmholtz自由能的推荐框架接受-拒绝Gumbel采样过程用户偏好建模与生成扩散模型优化方法
本文提出了一种面向推荐的三视图扩散框架,结合热力学视角,揭示现有扩散模型推荐系统通过最大化能量而运行。新的框架通过最大化亥姆霍兹自由能整合了优化策略,同时引入去噪器和接受拒绝Gumbel采样过程,显著提升了推荐系统的准确性和效率。
04