论文

登录后可查看剩余解析次数。
标签筛选
Seer: Online Context Learning for Fast Synchronous LLM Reinforcement Learning
发表:2025/11/19
在线上下文学习同步大语言模型强化学习长尾延迟优化动态负载均衡适应性分组推测解码
本文提出Seer,一个新型在线上下文学习系统,旨在优化大型语言模型的同步强化学习,特别是推演阶段的性能瓶颈。Seer通过动态负载均衡、上下文感知调度和自适应分组推测解码等技术,有效减少了长尾延迟,提升了资源利用率,测试结果表明其吞吐量提升了74%至97%。
03
Are Graph Augmentations Necessary? Simple Graph Contrastive Learning for Recommendation
发表:2021/12/16
图对比学习推荐系统用户-物品双边图增强自监督信号提取数据稀疏性问题推荐系统准确性提升
本文探讨对比学习(CL)在推荐系统中的作用,发现图增强并非必要。实验表明,CL 的性能提升源于用户/物品表示的均匀性,能有效缓解流行度偏差。基于此,作者提出SimGCL(简单图对比学习),用均匀噪声替代复杂的图增强,显著提升推荐精度和训练效率。
04
Defining endogenous barcoding sites for CRISPR/Cas9-based cell lineage tracing in zebrafish
发表:2020/2/1
CRISPR/Cas9细胞谱系追踪内源性条形码定位斑马鱼发育生物学基因组技术应用组织构造研究
本研究旨在定义斑马鱼中用于CRISPR/Cas9介导的细胞谱系追踪的内源性条形码位点,利用先进的基因组技术识别可靠的条形码基因座。研究发现了一些新靶点,显著提升了谱系追踪的精度,为遗传学和发育研究提供了重要启示。
04
Align$^3$GR: Unified Multi-Level Alignment for LLM-based Generative Recommendation
发表:2025/11/14
基于大语言模型的推荐系统多级对齐方法行为建模与对齐动态偏好适应自我博弈决策优化
Align3^3GR框架通过统一的多级对齐方法,有效将大型语言模型(LLMs)转化为推荐系统。其创新性包括双重词元化、增强行为建模及渐进式决策优化策略,解决了语义与行为错位的问题,实验结果显示,在Recall@10和NDCG@10指标上显著超越最先进基线。
07
Multi-Aspect Cross-modal Quantization for Generative Recommendation
发表:2025/11/19
生成式推荐系统跨模态量化多模态信息整合语义ID学习推荐系统数据集
本文提出了一种多方面跨模态量化生成式推荐(MACRec)模型,通过整合多模态信息来提升语义标识符的质量。这种方法利用跨模态量化降低了冲突率,并结合隐式和显式对齐,旨在增强生成模型的能力。实验结果验证了其在三个推荐数据集上的有效性。
05
Mitigating Exposure Bias in Online Learning to Rank Recommendation: A Novel Reward Model for Cascading Bandits
发表:2024/10/20
在线推荐系统中的曝光偏差缓解线性级联赌博机基于曝光的奖励模型推荐系统中的反馈循环问题多样化推荐策略
本文探讨了推荐系统中的曝光偏差问题,提出了一种新型的曝光感知奖励模型,专注于在线学习排序的线性级联老虎机(CB)。该模型根据物品在推荐列表中的位置调整效用,显著提高推荐的曝光公平性,同时保留推荐准确性,实验证明优于现有基线。
03
Bandits with Ranking Feedback
发表:2024/1/1
带排名反馈的多臂赌博机无悔算法设计随机奖励机制对抗性环境中的赌博机优化悔恨界限
本文提出了一种新型多臂老虎机变体——带排名反馈的老虎机,提供基于历史表现的臂排名反馈,而非数值回报,适用于无法精确测量奖励的场景。研究了在随机和对抗环境下的无遗憾算法设计,证明了在实例相关情况下无法获得对数级遗憾,并提出了DREE和RLPE算法,以对应不同的遗憾界限。
03
Growth-coupled microbial biosynthesis of the animal pigment xanthommatin
发表:2025/11/3
微生物合成策略色素黄素生成异源天然产物路径工程生物合成反馈循环细菌生长驱动合成
本研究提出了一种生长耦合的生物合成策略,以解决异源天然产物通路在细菌中初始产量低的问题。通过将切除的C1基团作为细菌生长驱动,促进了复杂动物色素黄素的合成,实现了在土壤细菌Pseudomonas putida中有效生产,并展示了自适应实验室进化在生产优化中的应用潜力。
016
RL-PINNs: Reinforcement Learning-Driven Adaptive Sampling for Efficient Training of PINNs
发表:2025/4/17
基于强化学习的自适应采样物理信息神经网络偏微分方程求解单轮采样训练马尔可夫决策过程
本文提出了一种名为RLPINNs的强化学习驱动自适应采样框架,旨在提高物理信息神经网络(PINNs)的训练效率。通过将自适应采样形式化为马尔可夫决策过程,RL智能体能够在单轮采样中动态选择最佳训练点,避免了传统方法的多轮采样和冗余点问题。该方法显著提升了准确性和计算效率,尤其在高维和高阶问题中表现优秀。
02
HyPINO: Multi-Physics Neural Operators via HyperPINNs and the Method of Manufactured Solutions
发表:2025/9/5
多物理神经算子零样本泛化Swin Transformer超网络物理信息神经网络偏微分方程求解
本文提出了HyPINO,一种多物理场神经算子,旨在实现任务无关的零shot 泛化。通过结合Swin Transformer超网络与混合监督,使用制造解法和物理信息优化的样本,HyPINO有效处理多种偏微分方程,显著提高了七个基准问题的准确性。
06
MscaleFNO: Multi-scale Fourier Neural Operator Learning for Oscillatory Function Spaces
发表:2024/12/28
多尺度傅里叶神经算子高频映射学习海尔姆霍兹方程非线性映射谱偏差降低波散射问题
本文提出了一种多尺度傅里叶神经算子(MscaleFNO),旨在解决傅里叶神经算子在学习高频振荡函数映射时的光谱偏差问题。通过并行的缩放FNO,MscaleFNO能有效捕捉映射中的高频成分,在高频波散射问题上展示出显著的性能提升。
05
Pearl: A Review-driven Persona-Knowledge Grounded Conversational Recommendation Dataset
发表:2024/8/1
交互式推荐系统基于大语言模型的推荐数据集个性化推荐数据集用户偏好建模知识增强的对话推荐
本文提出了PEARL数据集,旨在解决对话推荐系统面临的用户偏好表达不具体及推荐解释不足的问题。PEARL结合用户画像和知识增强技术,通过真实评论生成超过5.7万个对话,使得推荐更具上下文相关性。实验表明,使用该数据集训练的模型在评估中表现优于基线模型,推动了个性化推荐的进展。
07
LightGCN: Simplifying and Powering Graph Convolution Network for Recommendation
发表:2020/2/6
图卷积网络推荐系统LightGCN模型邻居聚合用户-物品交互图协同过滤性能提升
本研究提出了LightGCN模型,以简化图卷积网络在推荐系统中的应用。我们发现GCN中常见的特征变换和非线性激活对协同过滤性能贡献不大,反而增加了训练难度。LightGCN专注于邻域聚合,通过线性传播用户和物品嵌入,实现了显著的性能提升,平均相对提升约16%。
04
Neural Graph Collaborative Filtering
发表:2019/5/20
神经图协同过滤用户行为建模图结构推荐系统高阶连接建模嵌入传播机制
本文提出了一种新的推荐框架——神经图协同过滤(NGCF),通过在用户项目图中传播嵌入,克服传统方法未能有效编码用户项目交互中的协同信号的问题。NGCF在多个基准数据集上取得了显著的改善,验证了其高阶连接性建模的有效性。
05
以中国数学史为主线的教学设计探索
以中国数学史为主线的教学设计
本研究探讨了如何在初中数学教学中将中国数学史有效融入课程设计。通过分析一位年轻教师围绕“勾股定理”的教学实践,展示了从简单资料整合到深入文化自信与核心素养培养的过程,明确了数学史作为探究源的重要性,从而实现德育与学科知识的双重目标。
05
Asking Clarifying Questions for Preference Elicitation With Large Language Models
发表:2025/10/14
基于大语言模型的用户偏好引导生成式推荐系统中的澄清问题生成扩散模型驱动的序列问题生成用户偏好挖掘方法多阶段用户偏好建模
本文提出了一种新方法,通过大型语言模型 (LLM) 生成澄清问题,以有效获取用户偏好,尤其在用户历史信息有限的情况下。该方法采用两阶段的扩散模型启发,分别生成并逐步去除问题中的信息,从而显著提升了 LLM 在引导用户偏好方面的能力。
03
Multi-Peptide: Multimodality Leveraged Language-Graph Learning of Peptide Properties
发表:2024/12/19
基于Transformer的肽属性预测图神经网络结合语言模型多模态学习在生物信息学中的应用对比损失框架肽特性数据集评估
本研究提出了方法,结合基于的语言模型与图神经网络,提升肽属性预测能力。通过对比损失框架对两种模态嵌入对齐,增强了预测准确性。在溶血性预测中达到88.057%的最先进准确率,展示了多模态学习在生物信息学中的潜力。
03
M2oE: Multimodal Collaborative Expert Peptide Model
发表:2024/12/3
多模态肽预测模型专家模型与交叉注意力机制肽结构与序列信息结合复杂任务预测
本研究提出了M2oE多模态协同专家肽模型,通过整合肽的序列和空间结构信息,并引入专家模型及交叉注意力机制,显著提升了在复杂任务中的预测性能。实验结果验证了该模型在功能性肽预测中的有效性。
02
Modelling Techniques to Improve the Quality of Food Using Artificial Intelligence
发表:2021/7/28
人工智能在食品质量改善中的应用食品安全与质量增强策略食品加工中的人工智能技术供应链优化中的人工智能食品质量改进的成本效益分析
本文综述了人工智能在提升食品安全和质量中的应用,系统分析了各类建模技术,并以粮食安全四大支柱为框架,探讨了人工智能的成本效益,旨在为政策制定者提供决策依据,帮助其应对人口增长与环境变化带来的挑战。
03
KungfuBot: Physics-Based Humanoid Whole-Body Control for Learning Highly-Dynamic Skills
发表:2025/6/15
人形机器人全身控制高动态动作模仿物理约束动态跟踪双层优化框架机器人技能学习
本文提出了一种名为的基于物理的类人机器人控制框架,旨在通过多步骤运动处理和自适应运动追踪,学习模仿高动态人类行为如功夫和舞蹈。通过双层优化动态调整追踪精度,显著降低跟踪误差并成功应用于机器人,展示出稳定而生动的表现。
03