论文

登录后可查看剩余解析次数。
标签筛选
The Efficacy of Conversational Artificial Intelligence in Rectifying the Theory of Mind and Autonomy Biases: Comparative Analysis
发表:2024/6/20
对话式人工智能在心理健康干预中的应用认知偏见校正疗愈聊天机器人效果评估人机交互中的情感识别通用语言模型与治疗模型比较
本研究评估了对话式人工智能(CAI)在纠正心智理论和自主性偏差方面的有效性,比较了治疗聊天机器人与通用语言模型。结果表明,通用聊天机器人在识别和纠正这些认知偏差、以及人机交互情感识别方面表现更佳,具有较高的治疗质量和 CBT 原则遵循率。
04
BOSS: Blocking algorithm for optimizing shuttling scheduling in Ion Trap
发表:2024/12/5
离子阱调度优化量子计算调度算法高保真量子门量子硬件性能提升高效调度算法
离子阱技术在量子计算中具有高保真度和长相干时间的优势,但穿梭操作影响系统效率。为此,开发了BOSS算法,显著提升穿梭效率,最大减少穿梭次数96.1%。实验结合同情冷却,提供更高保真度和准确执行时间估算。
09
From IDs to Semantics: A Generative Framework for Cross-Domain Recommendation with Adaptive Semantic Tokenization
发表:2025/11/11
跨域推荐系统生成式跨域推荐框架领域自适应标记化用户偏好建模多领域联合训练
本文提出了一种新颖的生成式跨域推荐框架GenCDR,针对传统方法依赖共享用户/物品ID的局限,利用领域自适应词元化模块生成解耦的语义ID,并通过跨域自回归推荐模块建模用户兴趣。在多个真实世界的数据集上,GenCDR显著优于现有基线,提升了推荐准确性与泛化能力。
08
Quantum-Inspired Evolutionary Algorithm for a Class of Combinatorial Optimization
发表:2002/12/1
量子启发的进化算法组合优化问题量子位表示准超位置状态背包问题优化
本文提出了一种新的量子启发式进化算法(QEA),该算法利用量子比特和叠加态的原理,在组合优化问题中取得显著效果。与传统遗传算法相比,QEA在小规模种群下表现出色,避免了早熟收敛,展示了量子计算在进化算法中的潜力。
04
SONIC: Supersizing Motion Tracking for Natural Humanoid Whole-Body Control
发表:2025/11/11
动作追踪基础模型自然人形机器人控件大规模动作捕捉数据集实时运动规划视觉-语言-动作模型
该研究提出SONIC框架,通过扩展模型容量、数据量和计算资源,实现自然人形机器人全身控制。利用多样化的动作捕捉数据进行密集监督,构建了一个具备实时运动规划和多接口支持的通用控制器,展示了规模化带来的显著性能提升。
08
Long-Sequence Recommendation Models Need Decoupled Embeddings
发表:2024/10/3
长序列推荐系统解耦注意力与表示嵌入推荐系统中的嵌入学习注意力机制在推荐中的应用行为序列搜索与聚合
现代推荐系统中,用户的长期行为序列至关重要。现有模型存在缺陷,单一嵌入难以同时处理注意力与表示。为此,作者提出了解耦注意力与表示嵌入(DARE)模型,分别学习两个独立的嵌入表,实现更准确的相关行为搜索,并在多个数据集上显著提高性能,且加速在线服务。
02
屠宰废水处理工程设计与调试
屠宰废水处理MBBR 池工艺人工湿地处理废水处理工程设计肉类加工水污染物排放标准
本文设计了一种屠宰废水处理工艺,包括粗格栅、隔油池和两级MBBR池等环节。研究发现,通过调节池设置较长的水力停留时间,有效解决了废水间歇排放与生化处理的矛盾,最终出水水质符合国家排放标准。
07
FlowRL: Matching Reward Distributions for LLM Reasoning
发表:2025/9/19
大语言模型强化学习训练流平衡优化方法奖励分布匹配基于KL散度的策略优化数学推理任务
本文提出了一种新方法FlowRL,通过流平衡匹配完整的奖励分布,以替代传统的奖励最大化策略。与传统方法不同,FlowRL促进多样化探索和更具泛化性的推理轨迹。在数学和代码推理任务的实验中,FlowRL分别比GRPO和PPO提高了10%和5.1%的性能,显示了奖励分布匹配在LLM强化学习中的关键作用。
03
A Token is Worth over 1,000 Tokens: Efficient Knowledge Distillation through Low-Rank Clone
发表:2025/5/19
低秩克隆模型小型语言模型知识蒸馏高效预训练方法知识转移优化激活克隆对齐
该研究提出了一种名为低秩克隆(LRC)的高效知识蒸馏方法,旨在优化小型语言模型(SLMs)的训练效率。通过压缩教师模型权重和对齐学生模型激活值,LRC显著提高知识迁移效率,实验证明仅用20亿词元即可与传统使用数万亿词元的模型相媲美。
07
Enhancing Graph Contrastive Learning with Reliable and Informative Augmentation for Recommendation
发表:2024/9/9
图对比学习强化推荐系统离散编码用户物品映射虚拟邻居增强策略多级向量量化基于邻里结构的对比视图生成
本文提出了CoGCL框架,通过离散编码增强图对比学习的推荐效果。该方法引入多级向量量化,将用户和物品映射为富有协同信息的离散编码,并通过虚拟邻居增强和语义相关性生成可靠的对比视图。实验证明了其在多个公开数据集上的有效性。
04
Interactive Recommendation Agent with Active User Commands
发表:2025/9/25
主动用户指令的互动推荐系统自然语言命令与推荐策略双代理架构推荐系统模拟增强知识蒸馏实时政策调整
本文提出了交互式推荐流(IRF)概念,允许用户通过自然语言指令主动调整推荐结果。开发的RecBot结合解析器和规划器,实时理解用户意图并优化推荐策略,解决了传统推荐系统基于被动反馈的局限。实验表明,该方法显著提高了用户满意度和商业指标。
02
Quantum thermodynamics and semi-definite optimization
发表:2025/5/7
量子热力学半正定优化自由能最小化梯度上升方法量子经典混合算法
本文探讨量子热力学中的能量最小化问题,提出通过最小化自由能而非直接能量,利用Jaynes的思维模式转化为对偶化学势最大化问题,采用随机梯度上升方法求解,确保快速收敛。此外,展示了如何应用于经典与混合量子经典算法,从而有效解决半正定规划问题。
02
WeatherDiffusion: Weather-Guided Diffusion Model for Forward and Inverse Rendering
发表:2025/8/9
天气引导的扩散模型自动驾驶场景逆向渲染合成与真实天气数据集内在图谱感知注意力机制扩散模型在自动驾驶中的应用
本文提出了一种新框架WeatherDiffusion,旨在解决自动驾驶中正向和逆向渲染的挑战,特别是在复杂天气和光照条件下。该方法通过引入内在图感知注意力机制,实现对材质属性、场景几何及光照的准确估计,并支持可控天气和光照编辑。同时,作者提供了两个数据集以测试和验证其方法的有效性,实验结果显示WeatherDiffusion优于现有最先进技术。
011
Olympian: Scheduling GPU Usage in a Deep Neural Network Model Serving System
多模型GPU调度深度神经网络服务系统公平资源共享Tensorflow-Serving扩展GPU资源使用建模
本文提出了系统Olympian,扩展了TensorFlowServing,以在低开销下实现多个深度神经网络(DNN)在单个GPU上公平共享。Olympian通过离线分析GPU资源使用模型,能够并发运行多个大型DNN,并保证每个实例在12毫秒内交错执行,从而大幅降低延迟和执行时间的不可预测性。
05
Gallant: Voxel Grid-based Humanoid Locomotion and Local-navigation across 3D Constrained Terrains
发表:2025/11/19
基于体素的类人动作规划三维约束环境导航LiDAR数据结构化感知高保真LiDAR仿真端到端优化控制策略
本文提出了Gallant,一个基于体素网格的人形机器人运动与局部导航框架,通过使用体素化LiDAR数据实现精确的环境感知。该系统采用z分组2D CNN映射到控制策略,支持端到端的优化,并在复杂地形中取得近100%的成功率,展示了其在三维受限环境中的广泛适用性。
04
Qwen2.5-Omni Technical Report
发表:2025/3/26
多模态大语言模型Thinker-Talker架构时间对齐多模态RoPE音频视频同步处理流式音频生成
本技术报告介绍了Qwen2.5Omni,这是一个端到端的多模态模型,能够感知文本、图像、音频和视频,同时以流式生成文本和自然语音。模型采用交错组织音视频序列与创新的位置嵌入TMRoPE,使用ThinkerTalker架构有效避免模态干扰,且在多模态基准测试中表现出色。
036
Temporally Averaged Regression for Semi-Supervised Low-Light Image Enhancement
发表:2023/6/1
半监督低光照图像增强多一致性正则化损失图像空间特征依赖学习图像增强网络逐步监督损失函数
本研究提出了一种深度学习模型,通过结合空间和层次依赖性,以应对低光照图像增强中的标注数据获取难题。引入的多一致性正则化损失和渐进式监督损失函数,有效提升了在半监督框架下的图像增强性能,表现出在少量标注数据条件下的显著效果。
02
Retinexformer: One-stage Retinex-based Transformer for Low-light Image Enhancement
发表:2023/3/13
低光图像增强基于Retinex的变换器光照引导模型长距离依赖建模图像质量评估
本文提出了一种新颖的单阶段Retinex框架(ORF),有效增强低光照图像。通过估算光照信息和恢复图像腐败,结合照明引导Transformer (IGT),该方法在非局部交互建模上表现出色。实验证明,Retinexformer在多个基准上显著超越现有最先进技术,展现了其实际应用价值。
02
Miriam: Exploiting Elastic Kernels for Real-time Multi-DNN Inference on Edge GPU
发表:2023/7/10
多深度神经网络推理边缘GPU任务协调框架弹性核生成器实时关键任务推理CUDA深度神经网络基准
本文提出了Miriam,一个针对边缘GPU的多DNN推理任务协调框架,以解决在资源有限环境下的任务协调问题。Miriam结合了弹性内核生成器和动态内核协调器两个组件,能够支持多种关键性任务的并发处理。实验证明,Miriam能够将系统吞吐量提高92%,且对关键任务的延迟开销小于10%。
03
NanoFlow: Towards Optimal Large Language Model Serving Throughput
发表:2024/8/23
高吞吐量大语言模型服务内设备并行处理框架纳米批处理优化LLaMA 模型服务评估异构资源利用
本文提出NanoFlow,一个优化大语言模型(LLM)服务吞吐量的新框架。通过在单个设备内实现异构资源的并行使用,NanoFlow将输入拆分为纳米批次,自动调整其数量、大小和顺序,显著提升了吞吐量,在现实工作负载下比最先进的系统高出1.91倍。
010