AiPaper

论文

登录后可查看剩余解析次数。
标签筛选
GaussianObject: High-Quality 3D Object Reconstruction from Four Views with Gaussian Splatting
发表:2024/2/16
3D Gaussian Splatting 表示稀疏视角三维重建基于扩散模型的三维修复多视图一致性优化COLMAP-free 相机姿态估计
本文提出GaussianObject方法,利用高斯泼溅技术结合视觉外壳和漂浮物消除实现仅凭四张图像对三维物体进行高质量重建。通过基于扩散模型的高斯修复补全缺失信息,并设计无COLMAP相机姿态需求的变体,显著超越现有稀疏视角三维重建方法。
03
ReconViaGen: Towards Accurate Multi-view 3D Object Reconstruction via Generation
发表:2025/10/27
多视角三维重建三维扩散生成模型跨视图特征融合生成式三维重建先验局部细节一致性控制
ReconViaGen创新融合扩散3D生成先验与多视图重建,解决了交叉视图特征融合不足和局部细节去噪控制难题,有效生成与输入视图高度一致的完整3D模型,显著提升遮挡和稀疏视角下多视图3D重建的准确性与细节连贯性。
05
Cross-System Categorization of Abnormal Traces in Microservice-Based Systems via Meta-Learning
发表:2024/3/28
微服务系统异常轨迹分类元学习异常检测跨系统故障分类自动故障根因诊断少样本分类任务
本文提出TraFaultDia框架,利用元学习在微服务系统中实现异常调用链的少样本自动分类,准确识别故障类别及根因。该方法在两个开源微服务数据集上验证,提升了跨系统故障诊断的自动化和适应性。
02
G4Splat: Geometry-Guided Gaussian Splatting with Generative Prior
发表:2025/10/14
3D Gaussian Splatting 表示生成式先验多视角一致性建模基于扩散模型的3D重建平面结构几何引导
本文提出G4Splat方法,结合平面结构几何指导和生成先验,利用度量尺度深度图提供准确监督,解决了3D场景重建中多视图不一致及质量低下问题。实验证明其在已观测和未观测区域均优于现有方法,支持单视角和无姿态视频,泛化性能强。
03
Retargeting Matters: General Motion Retargeting for Humanoid Motion Tracking
发表:2025/10/3
人体动作重定向类人机器人运动追踪动作重定向质量评估强化学习动作模仿LAFAN1数据集
本文针对人形机器人运动跟踪中的具身差距问题,提出通用运动重定向(GMR)方法,有效减少足滑、自穿透等伪影,提升重定向数据质量。实验证明GMR在无过度奖励调整下,显著优于现有开源方法,提升了策略的鲁棒性和感知保真度。
08
OneLoc: Geo-Aware Generative Recommender Systems for Local Life Service
发表:2025/8/20
生成式推荐系统基于地理信息的推荐模型多目标强化学习优化本地生活服务场景推荐
OneLoc提出地理感知生成推荐系统,通过地理感知语义ID、自注意力和邻居感知提示融合地理与视频信息,并利用强化学习平衡用户兴趣、距离和商业目标。部署于快手本地生活服务,显著提升GMV和订单数。
04
VB ASE: Unifying Online Vector Similarity Search and Relational Queries via Relaxed Monotonicity
近似向量相似性搜索松弛单调性向量与关系查询融合高维向量索引优化在线复杂向量查询系统
VB ASE提出松弛单调性,统一了高维向量近似相似性搜索与关系查询,避免了传统TopK索引的局限,实现了复杂向量查询的高效支持。该系统在在线复杂查询中性能提升达三数量级,首次支持分析性相似性查询。
05
SensorMCP: A Model Context Protocol Server for Custom Sensor Tool Creation
传感器工具自动生成Model Context Protocol (MCP)基于大语言模型的传感器系统工具语言协同进化定制传感器工具框架
本文提出SensorMCP,一种基于模型上下文协议的服务器框架,结合工具语言协同开发流水线,实现了大语言模型动态生成和操控定制传感器工具。实验证明其在动物监控场景中成功率达95%,推动了传感器系统的可扩展定制与智能化。
04
A TastePeptides-Meta system including an umami/bitter classification model Umami_YYDS, a TastePeptidesDB database and an open-source package Auto_Taste_ML
味肽数据库鲜味与苦味分类模型梯度提升决策树分子描述符筛选味觉肽预测系统
本研究构建了味觉肽数据库TastePeptidesDB,筛选关键分子描述符,开发了准确率89.6%的鲜味/苦味分类模型UmamiYYDS,并通过感官验证,搭建预测网站及开源软件包AutoTasteML,促进味觉肽的快速识别和筛选。
04
DiffGRM: Diffusion-based Generative Recommendation Model
发表:2025/10/21
生成式推荐系统离散扩散模型平行语义编码置信度引导并行去噪
提出DiffGRM,一种基于掩码离散扩散的生成式推荐模型,通过并行语义编码解耦语义ID数字,实现对数字的任意顺序并行生成,克服自回归方法在项内一致性和跨位异质性上的限制,提升推荐效果及训练效率。
020
A step forward in food science, technology and industry using artificial intelligence
食品科学中的人工智能应用智能农业与作物分类电子鼻与机器视觉感官评估食品加工质量与安全保障营养成分估算与管理
本文系统探讨了人工智能在食品科学、技术及工业中的应用,涵盖农业改进、食品开发、感官评估、质量安全保障及供应链管理,提出构建智能“从农场到餐桌”系统,有效提升食品生产加工的效率与健康保障水平。
03
MMQ-v2: Align, Denoise, and Amplify: Adaptive Behavior Mining for Semantic IDs Learning in Recommendation
发表:2025/10/29
生成式推荐系统基于大语言模型的推荐系统自适应行为挖掘语义ID学习内容-行为多模态对齐
MMQv2提出了自适应行为内容对齐、去噪和放大机制,有效解决了推荐系统中长尾物品行为噪声和信号模糊问题,提升了语义ID的表达能力和泛化性能。实验证明其在大规模工业数据集上的推荐任务表现优越。
018
A Machine Learning Method to Identify Umami Peptide Sequences by Using Multiplicative LSTM Embedded Features
发表:2023/4/2
鲜味肽序列识别乘法LSTM特征嵌入深度学习肽序列表征Logistic回归分类器食品风味预测模型
提出基于乘法LSTM的深度预训练特征表示和逻辑回归的iUmamiDRLF方法,实现高效精准识别鲜味肽序列。该方法克服传统湿实验耗时昂贵,提升预测稳健性,有助于推动鲜味食物开发与营养研究。
03
Generative modeling and latent space arithmetics predict single-cell perturbation response across cell types, studies and species
单细胞扰动响应建模变分自编码器在单细胞分析中的应用潜空间向量算术跨物种细胞响应预测高维基因表达建模
本文提出scGen模型,结合变分自编码器与潜在空间向量运算,实现单细胞基因表达高维数据下的扰动响应预测。该模型跨细胞类型、研究和物种有效泛化,精准捕捉细胞及基因响应特征,为疾病与药物研究提供虚拟实验设计工具。
08
ZeRO-Infinity: Breaking the GPU Memory Wall for Extreme Scale Deep Learning
发表:2021/4/16
大规模深度学习模型训练ZeRO-Infinity 系统技术跨级存储层异构计算分布式训练优化超大参数模型微调
ZeROInfinity提出异构系统技术,整合GPU、CPU和NVMe内存,突破GPU内存瓶颈,实现万亿参数级超大模型训练和微调,无需重构模型代码。系统展现出高吞吐量和超线性可扩展性,基于DeepSpeed开源提供,极大提升极限规模深度学习的可及性与效率。
02
Back to the Drawing Board: A Critical Evaluation of Poisoning Attacks on Production Federated Learning
发表:2022/5/1
联邦学习投毒攻击分析生产环境联邦学习安全无针对性数据投毒攻击联邦学习防御机制评估联邦学习威胁模型建模
本文系统评估生产环境中联邦学习的投毒攻击,重点分析无目标攻击的威胁模型和攻击者能力。实验证明,联邦学习在简单防御下展现出较强鲁棒性,提出了先进的投毒攻击方法,但其实际效果有限,纠正了相关误解。
04
Label noise analysis meets adversarial training: A defense against label poisoning in federated learning
发表:2023/2/14
联邦学习中的标签噪声分析标签投毒防御对抗训练机制深度噪声标签分类器物联网入侵检测
本文结合对抗训练与标签噪声分析,设计生成对抗方案注入模拟后门和标签翻转攻击的标签噪声,构建噪声标签分类器,有效识别与抵御联邦学习中的标签投毒攻击。该框架在物联网入侵检测中验证了防御效果。
04
FlashVSR: Towards Real-Time Diffusion-Based Streaming Video Super-Resolution
发表:2025/10/15
扩散模型高效推理视频超分辨率稀疏注意力机制一阶段扩散模型蒸馏大规模视频超分辨率数据集
提出FlashVSR,一种基于扩散模型的实时流式视频超分辨率框架,通过三阶段蒸馏、局部稀疏注意力及轻量条件解码器实现高效超分辨率,在单A100 GPU上以约17FPS处理768×1408分辨率视频,同时构建大规模VSR120K数据集,显著提升速度与超高分辨率泛化能力。
04
Predicting cellular responses to perturbation across diverse contexts with STATE
发表:2025/6/27
细胞扰动响应预测基于Transformer的表型建模单细胞基因表达分析细胞异质性建模大规模单细胞数据集
本文提出基于Transformer的STATE模型,利用逾1亿细胞扰动表达数据,精准预测不同细胞背景下的扰动响应。模型提升效应区分度30%以上,准确识别差异表达基因,且能泛化到未见新背景的强扰动,推动可扩展虚拟细胞模型的发展。
05
Coordinated AI agents for advancing healthcare
发表:2025/4/1
医疗多智能体系统基于大语言模型的AI代理医疗AI任务协同多模态医疗数据推理医疗人工智能决策支持
本文提出医疗多智能体系统(MASH),通过多个专科AI智能体的去中心化协同,整合大语言模型,提升临床和运营效率,支持个性化医疗。该系统兼顾可解释性和问责制,有望成为分布式通用医疗AI新范式,重塑未来医疗服务流程。
05