AiPaper

论文

登录后可查看剩余解析次数。
标签筛选
STRATUS: A Multi-agent System for Autonomous Reliability Engineering of Modern Clouds
发表:2025/5/28
基于大语言模型的多智能体云可靠性工程自动化站点可靠性工程 (SRE)容错检测与诊断事务性无回归 (TNR) 安全规范AIOpsLab与ITBench基准测试
本文提出了STRATUS,一个基于大语言模型的多智能体系统,旨在实现现代云服务的自主可靠性工程(SRE)。STRATUS通过多个专业智能体进行故障检测与缓解,配合事务性无回归(TNR)安全规范,显著提高了故障缓解任务的成功率,表现超过现有SRE智能体1.5倍,为云可靠性工程的智能系统部署提供了新思路。
04
Fault detection of complicated processes based on an enhanced transformer network with graph attention mechanism
发表:2024/4/5
图注意力机制增强型 transformer 网络工业过程故障检测时空特征学习田纳西东曼化工过程
本文提出了一种增强型图注意力机制 Transformer 网络(GATran),用于复杂工业过程的故障检测。GATran 整合自注意力机制和多尺度卷积,实现了对时空特征的联合学习,并利用图注意力网络分析变量间的空间关系。研究证明其在田纳西—伊士曼化学过程中的有效性,克服了现有方法不足之处。
04
Counterfactual Reasoning for Retrieval-Augmented Generation
发表:2025/10/8
反事实推理增强的生成模型检索增强生成系统因果推理框架对抗性查询生成关联陷阱抗体机制
本论文提出反事实RAG (CFRAG) 框架,解决了检索增强生成系统中存在的相关性陷阱 (Correlation Trap) 問题,后者无法区分因果证据与误导性信息。CFRAG 通过生成反事实查询和使用并行仲裁机制,有效识别因果相关性,显著提升了系统鲁棒性,保持了与标准 RAG 相当的效率。
05
Agent Workflow Memory
发表:2024/9/12
Agent Workflow Memory在线任务工作流学习网页导航基准测试复杂动作轨迹优化经验驱动的代理决策
本文提出智能体工作流记忆(AWM),通过自动诱导并复用任务工作流,有效提升基于大型语言模型智能体在长时程复杂网络导航任务中的表现。在Mind2Web和WebArena两大基准上,AWM显著提高成功率并减少操作步骤,展现强泛化能力。
02
Synapse: Trajectory-as-Exemplar Prompting with Memory for Computer Control
发表:2023/6/13
基于增强记忆的计算机控制轨迹作为示例提示方法长时程决策支持任务普适性建模MiniWoB++ 任务评估
Synapse提出状态抽象、轨迹示例提示和示例记忆三大机制,有效解决LLM上下文受限、示例不完整及泛化差的问题。其在MiniWoB和Mind2Web基准上显著提升成功率,首次实现复杂任务长时序的显著进步。
01
Learning Relaxed Belady for Content Distribution Network Caching
发表:2020/1/1
内容分发网络缓存算法放松 Belady 算法机器学习缓存优化轻量级缓存原型Apache Traffic Server 实现
本文提出基于机器学习的宽松版Belady算法,用于CDN缓存替换,通过引入Belady边界和良好决策率,实现了高效端到端系统。LRB在6个真实CDN数据集上减少524%广域网流量,显著优于现有方法且具备可部署性。
03
Development of a machine learning-based predictor for identifying and discovering antioxidant peptides based on a new strategy
发表:2021/7/21
抗氧化肽分类模型伪氨基酸成分应用多功能肽挖掘机器学习抗氧化预测DPPH自由基捕获活性
研究基于伪氨基酸组合和肽模体,开发了PseAAC二肽模体混合机器学习模型预测抗氧化肽,AUC达0.939。以高精度筛选潜在肽,合成验证显示QCQ肽具显著抗氧化活性,提供了高效发现抗氧化肽的新工具。
04
GraphGPT: Graph Instruction Tuning for Large Language Models
发表:2023/10/19
图神经网络与大语言模型结合图指令微调零样本图学习自监督学习在图模型中的应用文本与图结构链接
本研究提出GraphGPT,通过图指令调优将大型语言模型与图结构知识结合,设计文本图结构连接和轻量级对齐投射器,实现了对复杂图结构的理解与泛化。该方法显著提升了模型在零样本和监督图学习任务中的性能,优于传统图神经网络。
02
DeepShop: A Benchmark for Deep Research Shopping Agents
发表:2025/6/3
深度研究购物代理基准查询复杂性演化在线购物代理评估以检索增强生成为基础的方法细粒度购物特征评估
DeepShop提出了一个针对深度研究购物智能体的基准,涵盖真实复杂购物场景的多维产品属性、搜索过滤和排序偏好。通过查询多样性和复杂度演化,分级测试智能体表现,并采用细粒度与整体评估框架,揭示RAG等方法在网页交互和复杂查询处理上的局限。
01
ProactiveEval: A Unified Evaluation Framework for Proactive Dialogue Agents
发表:2025/8/29
主动对话评估框架大语言模型主动对话能力目标规划与对话指导主动对话评估指标多领域评估环境
提出ProactiveEval统一框架,系统评估大型语言模型在主动对话中的目标规划和对话引导能力。设计328个跨领域评测环境,自动生成多样挑战数据。实验22种LLM,发现DeepSeekR1和Claude3.7Sonnet在相应任务表现突出,揭示推理能力对主动行为影响。
02
VitaBench: Benchmarking LLM Agents with Versatile Interactive Tasks in Real-world Applications
发表:2025/10/1
大语言模型代理评测基准多场景交互任务真实应用模拟环境工具调用与组合能力多轮对话中的意图追踪
本文提出VitaBench,一种涵盖外卖、旅游等真实应用场景的复杂LLM智能体评测基准。该基准包含66种工具,设计了跨场景及单场景多轮交互任务,要求智能体进行时空推理、工具调用和意图追踪。结果显示目前先进模型成功率不足50%。
02
Extracting building patterns with multilevel graph partition and building grouping
发表:2016/11/11
多级图划分算法建筑群分组遥感影像建筑模式提取城市空间结构分析城市形态识别
本文提出基于多级图分割和建筑分组的创新方法,从遥感影像中准确提取城市建筑模式。通过递归划分建筑足迹图并结合空间结构特征,该方法能高精度识别网格状、簇状及放射状等模式,为城市规划和灾害响应提供有力工具。
02
Recognizing Building Group Patterns in Topographic Maps by Integrating Building Functional and Geometric Information
发表:2022/6/1
建筑群模式识别拓扑地图分析建筑功能信息融合受限德劳内三角剖分图分割算法
提出将建筑功能与几何信息融合的建筑群识别方法,利用腾讯用户密度和兴趣点数据推断建筑功能,结合约束德劳内三角剖分提取空间指标,通过图分割实现建筑群提取。方法在案例中正确率超81%,显著优于仅基于几何特征的方法,提升地图综合的空间划分准确性。
04
De Novo Design of Protein-Binding Peptides by Quantum Computing
发表:2025/3/7
蛋白质结合肽设计量子退火计算多尺度计算框架物理驱动药物设计蛋白质-配体相互作用预测
本研究提出结合经典与量子计算的多尺度框架,利用量子退火器实现蛋白质结合肽段的从头设计,成功同时探索化学与构象空间。实验结果显示,设计的肽段化学多样且结合位点预测准确,体现量子计算在物理驱动药物设计中的潜力。
04
Research progress in the screening and evaluation of umami peptides
发表:2022/2/24
鲜味肽筛选技术分子对接应用机器学习在口味评估中应用仿生味觉传感器鲜味肽高通量筛选
本文综述了鲜味肽的筛选与评估进展,提出基于分子对接与机器学习的高通量筛选方法,以及利用仿生味觉传感器实现鲜味强度标准化评估,显著提升筛选效率和评价准确性,推动鲜味肽在调味品领域的应用发展。
04
OccWorld: Learning a 3D Occupancy World Model for Autonomous Driving
发表:2023/11/28
3D占用空间世界模型自动驾驶场景演变预测基于稀疏LiDAR的环境表示空间时间生成TransformernuScenes基准测试
本文提出OccWorld框架,通过3D占据空间学习自动驾驶世界模型,实现对自车运动及环境演变的细粒度预测。方法包括基于重建的场景分词器和时空生成Transformer,有效提升表达力和计算效率,无需实例或地图监督,能生成竞争力规划结果。
02
iTransformer: Inverted Transformers Are Effective for Time Series Forecasting
发表:2023/10/10
时间序列预测Transformer架构多变量时间序列建模变换维度注意力机制长时序依赖建模iTransformer模型
iTransformer提出将Transformer的注意力和前馈网络作用于倒置维度,将时间点嵌入变量令牌,提升多变量相关性建模与非线性表示学习能力。该方法有效解决大回溯窗口下的性能和计算问题,实现时间序列预测的最新性能和更强泛化。
02
Pharmacist: Safety Alignment Data Curation for Large Language Models against Harmful Fine-tuning
发表:2025/10/11
有害微调风险缓解大语言模型安全机制大语言模型微调
本文提出Pharmacist,一种针对大型语言模型有害微调的安全对齐数据筛选方法。通过训练数据选择器,Pharmacist优先挑选高质量且安全关键的对齐数据,显著提升防御效果与推理性能,同时减少训练时间,优于现有防御策略。
02
ADriver-I: A General World Model for Autonomous Driving
发表:2023/11/23
自动驾驶世界模型多模态大语言模型视觉语言动作模型Diffusion模型nuScenes数据集
提出ADriverI,一种基于多模态大语言模型与扩散技术的自动驾驶通用世界模型,通过交错视觉动作对统一视觉特征与控制信号格式,自回归预测控制动作并生成未来场景,实现迭代驱动,显著提升自动驾驶性能。
02
The potential of undenatured type II collagen against arthritis: a review
发表:2024/5/1
未变性II型胶原蛋白骨关节炎治疗类风湿关节炎治疗口服耐受机制骨关节疾病疗法
本文系统综述了未变性II型胶原蛋白(UCII)在关节炎治疗中的潜力,揭示其通过诱导口服耐受机制显著缓解骨关节炎和类风湿关节炎症状,强调其结构、提取及作用机制,并展望其临床应用前景。
08