论文

登录后可查看剩余解析次数。
标签筛选
LEMUR: Large scale End-to-end MUltimodal Recommendation
发表:2025/11/14
大规模多模态推荐系统端到端推荐系统联邦学习推荐优化冷启动问题解决多模态数据处理
本文提出了LEMUR,这是一个首次从原始数据进行端到端训练的大规模多模态推荐系统,旨在解决传统推荐系统的冷启动和泛化问题。LEMUR通过联合优化多模态和推荐组件,动态适配新数据,同时利用内存库机制降低计算成本。在实际应用中,LEMUR在抖音的效果显著提升。
01
Robustness Verification of Quantum Classifiers
发表:2020/8/17
量子机器学习算法鲁棒性验证量子训练数据抗噪声分析量子噪声影响下的分类器评估TensorFlow Quantum实现对抗样本生成算法
本文提出了一个形式化框架,用于验证和分析量子机器学习算法在量子噪声下的鲁棒性。作者推导出鲁棒界限并设计了一种算法,以检查量子训练数据的鲁棒性,能够在检查中识别对抗性样本。该方法在TensorFlow Quantum上实现,并通过多项实验验证了其有效性。
02
GR00T N1: An Open Foundation Model for Generalist Humanoid Robots
发表:2025/3/19
通用人形机器人基础模型视觉语言动作模型扩散 Transformer 模块人形机器人操作任务多模态数据训练
本文提出GR00T N1,一个面向通用人形机器人的开放式视觉语言动作基础模型。它结合了推理模块和动作生成模块,通过端到端训练和数据金字塔策略,使用异构数据源有效训练。实验结果显示,该模型在仿真基准上优于现有模仿学习方法,展现了高性能与数据效率。
04
SAFE: Multitask Failure Detection for Vision-Language-Action Models
发表:2025/6/12
视觉语言动作模型的故障检测多任务故障检测基于特征的故障预测通用机器人策略自适应故障警报系统
本文提出SAFE(可扩展故障估计),旨在为通才型视觉语言动作模型(VLA)实现多任务、实时的故障检测。通过分析VLA内部特征,SAFE能够高效预测任务失败的可能性,并在各种模拟和真实环境中表现出卓越的性能,达到更好的准确性与及时性平衡,支持零样本泛化至未见任务。
01
On the role of theories in consciousness science
发表:2025/11/26
意识科学理论的角色神经科学技术进展意识科学的理论与实证发展
该论文批判性地反思意识科学中理论的作用,呼吁走向更细致入微的“谦逊理论”发展路径。作者认为“统一性假设”限制了理论的有效性,建议聚焦理论领域的可测试性,以促进理论与实验的闭环循环,实现意识科学的更健康发展。
03
Curriculum Conditioned Diffusion for Multimodal Recommendation
发表:2025/4/11
多模态推荐系统扩散模型基于负样本的知识采样课程学习框架多模态对齐模块
提出了一种课程条件扩散框架CCDRec,用于解决多模态推荐中的数据稀疏问题。该框架通过扩散模型整合了逆向阶段与负采样,有效挖掘多模态之间的相关性,提升推荐系统的个性化能力,且在多个数据集上验证了其有效性与鲁棒性。
01
Directly Aligning the Full Diffusion Trajectory with Fine-Grained Human Preference
发表:2025/9/9
扩散模型与人类偏好对齐直接对齐方法 (Direct-Align)语义相对偏好优化 (SRPO)噪声先验预定义图像恢复与插值技术
本论文提出一种新方法DirectAlign,旨在通过定义噪声先验,优化扩散模型的生成过程,使其与人类细粒度偏好对齐。该方法解决了多步去噪的计算成本问题,并引入语义相对偏好优化(SRPO),实现实时奖励调整,能有效提高图像再现能力。
02
S-SYNC: Shuttle and Swap Co-Optimization in Quantum Charge-Coupled Devices
发表:2025/5/2
量子电荷耦合器件调度启发式算法量子应用成功率优化量子计算编译器量子比特调度与交换
本文提出了SSYNC编译器,旨在共同优化量子电荷耦合器件(QCCD)中的穿梭和交换操作。该方法利用QCCD的独特特性,通过调度启发式算法有效减少3.69倍的穿梭次数,并将量子应用的成功率提高1.73倍,推动量子计算的实用化进程。
05
Diffusion Transformers with Representation Autoencoders
发表:2025/10/14
扩散模型(transformer)与表示自编码器Representation Autoencoders图像生成质量提升高维潜在空间建模DINO与MAE编码器
本文提出一种新的表示自编码器(RAE)模型,通过用预训练的表示编码器(如DINO、MAE)替换传统的变分自编码器(VAE),克服了扩散变换器(DiT)在图像生成中的限制。RAE不仅提供高质量重建,还具备更丰富的语义信息,实验表明其在图像生成性能上显著优于VAE,成为新的训练默认方法。
06
Evolution Strategies at the Hyperscale
发表:2025/11/21
进化策略算法低秩学习优化大规模神经网络优化无梯度优化方法强化学习环境下的优化
该论文提出了进化引导的低秩学习优化方法(EGGROLL),旨在扩展无反向传播优化至大规模神经网络架构。通过生成低秩矩阵扰动,EGGROLL显著降低计算和内存成本,同时维持优化性能,相较传统方法在处理数十亿参数时更高效。
06
CipherGPT: Secure Two-Party GPT Inference
安全两方GPT推理加密矩阵乘法安全GELU计算协议安全top-k抽样协议GPT推理优化
本论文提出CipherGPT框架,旨在解决用户隐私问题,特别是在GPT推理过程中。通过创新协议,优化了安全矩阵乘法和GELU计算,分别实现6.2倍和1.8倍的性能提升和带宽/通信量减少。此外,首次提出安全TopK采样协议,提供全面的实现与基准测试,为未来研究奠定基础。
03
DiffBIR: Towards Blind Image Restoration with Generative Diffusion Prior
发表:2023/8/29
扩散模型图像恢复盲图像恢复高保真图像重建图像质量改善区域自适应恢复指导
DiffBIR提出了一种通用图像恢复流水线,能有效处理多种盲图像恢复任务。该方法分为两个阶段:去除降解与信息再生。在此过程中,IRControlNet利用潜在扩散模型生成真实细节,并引入区域自适应恢复指导机制,让用户可调节真实感与保真度的平衡。实验证明其在多项任务上优于现有方法。
02
Adenine base editor engineering reduces editing of bystander cytosines
发表:2021/7/1
腺嘌呤碱基编辑器工程细胞外脱氨酶工程碱基编辑工具优化特定碱基转换靶向编辑改进
研究者通过工程化腺嘌呤碱基编辑器TadA7.10,显著降低了旁观者胞嘧啶的脱氨基活性,D108Q突变使其活性降低十倍,同时与V106W突变兼容,减少脱靶编辑。此外,P48R突变提高了胞嘧啶脱氨基活性并降低腺嘌呤编辑率,开发出针对TC转化的新工具,拓宽了碱基编辑的应用前景。
03
ARAG: Agentic Retrieval Augmented Generation for Personalized Recommendation
发表:2025/6/27
基于多智能体的个性化推荐系统增强型检索生成框架大语言模型推荐系统动态用户偏好建模推荐系统评估
本文提出了ARAG框架,用于个性化推荐,通过多智能体合作机制优化检索增强生成(RAG)方法。ARAG结合了用户理解、自然语言推理、上下文总结和物品排序的智能体,以动态捕捉用户偏好。实验显示其在 推荐质量上显著优于传统RAG和近期基线模型。
02
MA-RAG: Multi-Agent Retrieval-Augmented Generation via Collaborative Chain-of-Thought Reasoning
发表:2025/10/8
多智能体检索增强生成协同思考推理任务感知推理动态工作流优化模块化推理驱动架构
本文提出MARAG,一种多智能体框架,用于检索增强生成(RAG),解决复杂信息检索中的模糊性和推理挑战。MARAG通过协调规划、步骤定义、提取和问答智能体,分解任务,确保高效的动态工作流,而无须模型微调。实验结果显示,其性能优于最先进的基线模型,验证了协作推理的有效性。
010
HiPRAG: Hierarchical Process Rewards for Efficient Agentic Retrieval Augmented Generation
发表:2025/10/8
大语言模型强化学习训练代理检索增强生成层次化过程奖励知识驱动的过程奖励检索决策优化
HiPRAG提出了一种新颖的分层过程奖励方法,解决了智能体检索增强生成中常见的过度搜索和欠搜索问题。通过将推理轨迹分解为可解析步骤,该方法实时评估每个搜索决策的必要性并提供细粒度奖励,显著提高了搜索效率和准确率。实验表明,HiPRAG在多个QA基准上超越基线模型,展示了优化推理过程的重要性。
03
RecoveryChaining: Learning Local Recovery Policies for Robust Manipulation
发表:2024/10/18
机器人恢复策略学习分层强化学习复杂操控任务模型驱动控制器稀疏奖励优化
本文提出了一种名为RecoveryChaining的分层强化学习方法,以应对复杂操控任务中的故障恢复问题。通过引入名义控制器选项,在检测到失败时智能体能有效切换恢复策略,实现鲁棒性提升。实验表明,模型成功迁移至真实机器人,显著提高了任务成功率。
03
Towards Domain-Specific Network Transport for Distributed DNN Training
分布式深度学习网络传输DNN通信优化网络流量模式分析域特定网络协议拥塞控制技术
本文针对分布式深度神经网络(DNN)训练工作负载设计定制化的网络传输方案,提出了名为MLT的域特定网络传输协议。该协议优化了DNN通信中的拥塞控制和数据传输,经过广泛评估,显著提升了训练吞吐量和网络利用率,解决了传统协议无法支持的性能瓶颈问题。
02
CogVideoX: Text-to-Video Diffusion Models with An Expert Transformer
发表:2024/8/12
文本到视频生成扩散模型视觉 transformer3D变分自编码器视频生成质量提升
CogVideoX 是一种大规模文本到视频生成模型,采用扩散 Transformer 架构,能够生成10秒、16帧每秒、分辨率高达768×1360的视频。为解决现有模型在连贯性和语义对齐方面的不足,论文提出了3D变分自编码器、专家 Transformer 和渐进式训练等方法,实现了显著的生成质量提升,并且开源了模型权重。
03
Scalable Diffusion Models with Transformers
发表:2022/12/20
扩散模型Transformer架构图像生成大规模扩散模型状态-条件图像生成
本研究提出了一种基于变换器架构的新型扩散模型,称为扩散变换器 (DiTs),替代了传统的UNet主干。分析表明,模型的前向传播复杂度(以Gflops衡量)与生成质量表现(FID分数)呈反比。最大模型DiTXL/2在ImageNet基准测试中达到了最先进的FID表现,显示出优越的可扩展性与性能。
05