论文
登录后可查看剩余解析次数。
标签筛选
Distributed LLM Serving on Consumer-Grade GPUs by Reconciling Computation and Communication
发表:2025/1/1
基于消费者级GPU的分布式大语言模型服务MoLink 服务系统预填充请求传输调度算法大语言模型通信效率优化分布式推理计算架构
本文提出了MoLink,一个高效的分布式大型语言模型(LLM)服务系统,通过协调计算与通信,以消费级GPU降低LLM服务成本。它将预填充请求的数据流量拆分为较小的块,并优化传输调度,显著减少了首词元生成时间、每输出词元时间和延迟,相比现有系统最大降幅达46%。
05
Order-agnostic Identifier for Large Language Model-based Generative Recommendation
发表:2025/2/15
基于大语言模型的生成推荐系统订单无关标识符设计协同过滤与语义信息整合SETRec框架稀疏注意力机制
本文提出了一种基于大语言模型的无序标识符设计,用于生成式推荐,解决了现有标识符在效率和性能上的问题。通过整合协同过滤与语义信息,设计无序标识符并采用SETRec框架,利用稀疏注意力掩码和查询引导生成机制,显著提升了推荐效果和生成效率。
05
Comprehensive characterization and expression analysis of enzymatic antioxidant gene families in passion fruit (Passiflora edulis)
发表:2023/10/26
百香果抗氧化酶基因家族鉴定抗氧化基因表达分析抗氧化酶基因家族特征百香果温度胁迫抗性研究次生代谢产物研究
本研究全面鉴定和表征了百香果(Passiflora edulis)中的酶促抗氧化基因家族,共识别到7个家族的90个基因。系统发育分析表明,相同亚细胞定位的基因亲缘关系更近;高表达基因在花和果实中可能保护组织免受氧化损伤,且有望增强温度胁迫抗性。
02
DexFlyWheel: A Scalable and Self-improving Data Generation Framework for Dexterous Manipulation
发表:2025/9/28
机器人灵巧操作数据生成自我改善的数据生成框架模仿学习与强化学习数据多样性增强迭代循环数据生成
本文提出了DexFlyWheel,一个可扩展且自我改进的灵巧操作数据生成框架,旨在解决高质量、多样化训练数据匮乏的问题。通过模仿学习、残差强化学习、轨迹收集和数据增强等闭环管道,该框架在迭代中逐步增补数据,提高了模型的扩展性和泛化能力,实现持续的自我强化。
06
MoMaGen: Generating Demonstrations under Soft and Hard Constraints for Multi-Step Bimanual Mobile Manipulation
发表:2025/10/21
多步骤双手移动操作演示生成模仿学习机器人训练基于约束的优化数据生成人类演示数据集扩增移动操作可达性与可视性问题
本文提出MoMaGen,一种通过软硬约束优化生成多步双臂移动操作演示的方法。针对收集人类演示数据的高昂成本,该方法解决了基座放置与摄像头可视性两大挑战。实验结果表明,MoMaGen在多样性上显著优于现有方法,为未来高效学习提供了理论基础。
03
ThinkAct: Vision-Language-Action Reasoning via Reinforced Visual Latent Planning
发表:2025/7/23
视觉语言动作推理强化视觉潜在规划多模态大语言模型长时序规划机器人动作执行
本文提出了ThinkAct,一个双系统框架,通过强化视觉潜层规划连接高层推理与低层动作执行。该模型训练多模态大语言模型生成具身推理计划,并运用基于目标完成度和轨迹一致性的动作对齐视觉奖励,实现在复杂环境中的小样本适应、长时程规划和自我纠正能力。
02
Breaking the Bottleneck: User-Specific Optimization and Real-Time Inference Integration for Sequential Recommendation
发表:2025/8/3
序列推荐系统用户特定优化实时推理集成KL 散度优化深度学习序列方法
该论文针对序列推荐(SR)中的性能瓶颈问题,提出用户专属优化方法,针对每个用户独立分析其行为序列,并引入实时推理集成,以提升推理效率和模型稳定性。通过KL散度优化实现个别序列学习,从而克服固定数据集中的性能限制。
08
Robust deep learning–based protein sequence design using ProteinMPNN
发表:2022/9/15
基于深度学习的蛋白质序列设计ProteinMPNN蛋白质结构预测实验性蛋白质设计方法多链氨基酸耦合
本文提出了一种名为 ProteinMPNN 的基于深度学习的蛋白质序列设计方法,表现出卓越的性能,其序列恢复率为 52.4%,显著高于传统方法 Rosetta 的 32.9%。该方法能够处理单链和多链的氨基酸耦合问题,成功挽救了多种先前设计失败的蛋白,展示了其广泛的应用潜力和高精确度。
014
Generative Sparse-View Gaussian Splatting
发表:2025/6/10
生成稀疏视角高斯 Splatting3D/4D 场景重建图像扩散模型视图一致性增强有限观察生成模型
本文提出一种新方法"生成式稀疏视图高斯溅射(GSGS)",旨在提升在有限观测条件下的3D/4D场景重建质量。该方法利用预训练的图像扩散模型,通过迭代优化增强视图一致性,生成“幻觉”图像并确保语义对应,从而改善渲染效果并超越现有技术。
01
Personalized Safety in LLMs: A Benchmark and A Planning-Based Agent Approach
发表:2025/5/25
个性化大语言模型安全PENGUIN基准基于用户背景的安全增强RAISE代理框架安全性评估方法
本文提出了个性化安全的概念,并建立了基准测试,通过14,000个场景验证个性化用户信息可以提升安全评分43.2%。此外,开发了框架,通过两阶段的智能体设计,能在不再训练模型的情况下,提升安全评分31.6%,强调了在安全领域选择性信息收集的重要性。
014
探究老年糖尿病夜间低血糖的预防及护理
老年糖尿病护理低血糖预防措施夜间低血糖管理糖尿病临床治疗
本文探讨了老年糖尿病患者夜间低血糖的成因与护理措施,指出老年患者感知能力下降致使夜间低血糖风险增高。文章系统性地提出了六大成因及五个预防策略,旨在为临床医护人员提供可操作的管理框架。
04
Aligning LLMs with Individual Preferences via Interaction
发表:2024/10/4
大语言模型个性化对齐多轮对话偏好学习个性化用户行为建模个性化偏好数据集基于交互的LLM微调
本研究提出了一种新方法,通过多轮对话使大语言模型(LLMs)与个体偏好对齐。构建了包含3310个用户角色的多样化画像池,并利用多模型协作创建了3000多条对话数据集。通过监督微调和强化学习来提升模型适应能力,实验结果显示该方法有效实现了个性化对齐。
03
老年糖尿病患者夜间低血糖的识别与护理防范措施
老年糖尿病患者夜间低血糖管理低血糖识别与护理策略血糖监测与个体化治疗老年病人护理干预措施
本文探讨了老年糖尿病患者夜间低血糖的临床特征及识别方法,结合实践与文献分析了导致夜间低血糖的危险因素。研究发现,通过加强血糖监测、个体化用药、饮食管理及健康教育等综合护理策略能显著降低发生风险,强调建立系统化的护理防范措施对提升患者生活质量和减少并发症的重要性。
03
Dynamic Discounted Counterfactual Regret Minimization (CFR) is a family of iterative algorithms showing promising results in solving imperfect-information games. Recent novel CFR variants (e.g., CFR+, DCFR) have significantly improved the convergence rate of the vanilla CFR. The key to these CFR variants’ performance is weighting each iteration non-uniformly, i.e., discounting earlier iterations. However, these algorithms use a fixed, manually-specified scheme to weight each iteration, which eno
动态折扣反事实遗憾最小化马尔可夫决策过程中的策略优化不完全信息博弈求解迭代算法收敛性提升动态权重学习
本文提出了动态折扣反事实遗憾最小化(DDCFR),这是首个通过动态学习方法对迭代进行折扣的框架。通过将CFR迭代过程形式化为马尔可夫决策过程,DDCFR实现了更快的收敛速度和更高的性能,具备强大的泛化能力,显著提升了解决不完全信息博弈的效率和潜力。
05
STUDY OF HYPOGLYCEMIA IN ELDERLY DIABETES MELLITUS PATIENTS
发表:2022/2/5
老年糖尿病患者低血糖研究糖尿病管理临床药理学低血糖症状磺脲类药物使用
本研究聚焦入住拉贾·穆提亚医学院的老年糖尿病患者低血糖情况。发现用于降糖的磺脲类药物中,格列美脲使用最为普遍,且超过30%的患者在低血糖发作时没有表现出任何症状,揭示了该人群监测低血糖的挑战。
01
EchoMind: An Interrelated Multi-level Benchmark for Evaluating Empathetic Speech Language Models
发表:2025/10/26
同理心对话评测基准语音语言模型能力评估语音内容理解与非语言线索多层次对话能力评测情感智能对话系统
本文提出了EchoMind,一个多层次的基准,旨在评估共情语音语言模型(SLMs)。该基准通过模拟情感对话的认知过程,整合了口语理解、语音线索感知、推理和响应生成。研究显示,即使是先进模型在共情响应方面也存在显著弱点,强调了对语言内容与多样化语音线索整合的必要性。
03
CosyVoice 2: Scalable Streaming Speech Synthesis with Large Language Models
发表:2024/12/16
流式语音合成大型语言模型应用多语言数据集语音生成模型优化渐进语义解码
本文介绍了CosyVoice 2,一个改进的流式语音合成模型,基于有限标量量化优化词元利用率,并简化文本语音模型架构以利用预训练的大型语言模型,结合块感知因果流匹配模型实现了接近人类水平的自然度和几乎无损的合成质量。
08
5G Vehicle-to-Everything Services: Gearing Up for Security and Privacy
发表:2019/11/13
5G车联网安全与隐私车辆与一切通信5G网络服务与应用车载传感器网络低延迟通信
本文全面综述了5G车联网服务的安全性与隐私问题,分析了5G V2X的架构、用例及潜在的信任和安全威胁。探讨了保护5G V2X服务的最新策略,并指出了未来研究方向,以推动此领域的深入发展和广泛应用。
08
A Component Architecture for the Internet of Things
发表:2018/9/1
物联网组件架构并发时间戳离散事件语义异步原子回调机制安全群体工具包代理与服务交互
本文提出了一种面向物联网的组件化软件架构,设计了称为“访问器”的代理实体,它们在并发的、带时间戳的离散事件语义下进行交互。通过结合异步原子回调(AAC)和演员模型,该架构支持多个并发请求,提升了网络交互的效率和安全性。
04
UniMMVSR: A Unified Multi-Modal Framework for Cascaded Video Super-Resolution
发表:2025/10/9
级联视频超分辨率多模态视频生成潜在视频扩散模型条件注入策略多模态条件利用
本论文提出了UniMMVSR,一个统一的多模态视频超分辨率框架,可处理文本、图像和视频等多种输入条件。研究团队探索了条件注入策略和数据混合技术,实验结果显示该框架在视频细节和多模态条件一致性上显著优于现有方法,支持4K视频生成。
01
……