论文

登录后可查看剩余解析次数。
标签筛选
Miriam: Exploiting Elastic Kernels for Real-time Multi-DNN Inference on Edge GPU
发表:2023/7/10
多深度神经网络推理边缘GPU任务协调框架弹性核生成器实时关键任务推理CUDA深度神经网络基准
本文提出了Miriam,一个针对边缘GPU的多DNN推理任务协调框架,以解决在资源有限环境下的任务协调问题。Miriam结合了弹性内核生成器和动态内核协调器两个组件,能够支持多种关键性任务的并发处理。实验证明,Miriam能够将系统吞吐量提高92%,且对关键任务的延迟开销小于10%。
03
NanoFlow: Towards Optimal Large Language Model Serving Throughput
发表:2024/8/23
高吞吐量大语言模型服务内设备并行处理框架纳米批处理优化LLaMA 模型服务评估异构资源利用
本文提出NanoFlow,一个优化大语言模型(LLM)服务吞吐量的新框架。通过在单个设备内实现异构资源的并行使用,NanoFlow将输入拆分为纳米批次,自动调整其数量、大小和顺序,显著提升了吞吐量,在现实工作负载下比最先进的系统高出1.91倍。
010
LightenDiffusion: Unsupervised Low-Light Image Enhancement with Latent-Retinex Diffusion Models
发表:2024/7/12
无监督低光图像增强潜在-瑞丁模型内容转移分解网络自我约束一致性损失低光特征引导恢复
本文提出了一种名为LightenDiffusion的无监督低光照图像增强框架,结合了可解释的Retinex理论与扩散模型。核心方法是使用内容转移分解网络在潜在空间中进行Retinex分解,从无配对的低光和正常光照图像中提取反射图和照明图,并提出自约束一致性损失以提高恢复质量。实验结果显示,该方法在性能上优于现有无监督竞争者,且具有更强的场景泛化能力。
08
MuxServe: Flexible Spatial-Temporal Multiplexing for Multiple LLM Serving
发表:2024/4/2
基于大语言模型的服务系统多模型高效调度空间-时间复用算法适应性批处理调度策略大语言模型资源管理
本文提出了MuxServe,一个灵活的时空复用系统,旨在高效服务多个大型语言模型(LLMs)。通过根据流行度将LLMs并置,该系统能够复用内存和计算资源,同时采用新颖的放置算法和自适应批调度策略,最终实现高达1.8倍的吞吐量提升或处理2.9倍的请求,显著提高资源利用率。
02
DEL-ToM: Inference-Time Scaling for Theory-of-Mind Reasoning via Dynamic Epistemic Logic
发表:2025/1/1
理论心智推理动态逻辑推理动态认知逻辑过程信念模型大型语言模型推理增强
本研究提出DELToM框架,通过推理时缩放提升大型语言模型(LLMs)在理论心智(ToM)任务上的表现。与架构修改不同,该方法基于动态认知逻辑分解ToM任务为信念更新序列,并使用过程信念模型评分,确保推理过程的透明性。实验表明,DELToM在多个模型规模和基准上的性能持续改善,验证了信念监督对ToM能力的显著增强。
02
USB-Rec: An Effective Framework for Improving Conversational Recommendation Capability of Large Language Model
发表:2025/9/21
大语言模型强化学习训练对话式推荐系统基于大语言模型的推荐系统用户模拟器基础框架偏好优化数据集构建
本文提出USBRec框架,旨在提升大语言模型在对话式推荐系统中的能力。通过基于用户模拟器的偏好优化数据集构建和自增强策略,可以有效增强模型在训练和推理阶段的表现。实验证明,该方法在多种数据集上均优于以往的最先进技术。
04
FASTER: Toward Powerful and Efficient Autoregressive Vision–Language–Action Models with Learnable Action Tokenizer and Block-wise Decoding
自回归视觉语言动作模型灵活动作序列令牌化块状自回归解码残差向量量化机器人操作任务
FASTER(灵活的动作序列分词技术)提出了一种基于向量量化的可学习动作分词器,旨在解决自回归视觉语言动作模型中的重建精度与推理效率的权衡。通过结合Transformer网络与残差向量量化,FASTER在动作块特征表示中实现了灵活编码和高效推理。基于此,FASTerVLA模型进一步提升了性能和推理速度,超越了现有的最先进VLA模型。
05
Back to Basics: Let Denoising Generative Models Denoise
发表:2025/11/18
去噪生成模型图像 Transformer高维数据去噪低维流形假设无预训练生成模型
本文提出回归根本的去噪生成模型方法,强调直接预测清晰图像而非噪声。作者基于流形假设,展示了一个简化的无预训练、无分词器的Transformer模型JiT,证明其在高维数据上表现优越,能有效生成高质量图像。
012
Is it harmful or helpful? Examining the causes and consequences of generative AI usage among university students
发表:2024/2/16
大学生生成式人工智能使用影响ChatGPT使用量表开发与验证学业负担与时间压力对AI使用的影响生成式AI对学业表现的影响延迟与记忆丧失的关联性
本研究探讨生成式人工智能(如ChatGPT)对大学生的使用及其影响,采用两个研究样本。研究1开发了一项量表,验证了ChatGPT的使用情况;研究2进一步分析学业负担和时间压力对使用的影响,发现高负担时使用增加,但对奖励敏感的学生反而更少使用。同时,使用ChatGPT存在导致拖延和记忆丧失的风险。
02
Polyclonal-to-monoclonal transition in colorectal precancerous evolution
发表:2024/10/30
肠道肿瘤发生过程中的单克隆转变基因组测序在肠道肿瘤模型中的应用高分辨率单细胞谱系分析多克隆起源与肠道腺瘤形成肠道肿瘤进展的细胞谱系分析
本研究利用基于碱基编辑的DNA条形码系统,揭示了结直肠癌前病变的起源与演变,显示出多克隆向单克隆的转变过程。高分辨率单细胞谱系分析发现,肿瘤中存在多个独立细胞谱系并行扩增,这为结直肠癌的早期干预提供了新见解。
03
Early diagnosis model of mycosis fungoides and five inflammatory skin diseases based on multi-modal data-based convolutional neural network
多模态数据卷积神经网络癣菌病早期诊断五种炎症性皮肤疾病皮肤疾病诊断模型
本研究提出了一种创新的早期诊断模型,用于识别蕈样肉芽肿及五种常见炎症性皮肤病。该模型基于卷积神经网络,整合多模态数据,包括患者信息及影像,旨在提高诊断精准度,改善患者预后,解决临床诊断中的挑战。
05
A Grover-Based Quantum Algorithm for Solving Perfect Mazes via Fitness-Guided Search
发表:2025/7/29
量子路径规划算法Grover算法适应性搜索策略完美迷宫求解量子计算路径查找
本文提出了一种基于 Grover 算法的量子迷宫求解方法,通过量子叠加编码所有可能路径,并利用可逆适应度算子评估路径与目标的接近程度。结合特定的预言机和自适应截止策略,该算法展示了在迷宫及路径长度方面的高效扩展性,为量子混合寻路与规划奠定了基础。
05
InfiniteWorld: A Unified Scalable Simulation Framework for General Visual-Language Robot Interaction
发表:2024/12/8
视觉语言机器人交互统一可扩展仿真框架机器人动作学习基准3D资产构建方法环境理解与任务规划
本论文提出了InfiniteWorld,一个基于Nvidia Isaac Sim的统一可扩展模拟框架,旨在提高具身智能领域的研究效率。该框架整合了3D资产生成、自动化标注及统一处理方法,并建立四个新基准,旨在全面评估机器人在环境理解和任务执行中的能力。
05
LoRA: Low-Rank Adaptation of Large Language Models
发表:2021/6/18
大语言模型低秩适配Transformer架构大语言模型微调参数效率优化RoBERTa及衍生模型
论文提出了一种名为LoRA的低秩适配方法,旨在解决大型语言模型的微调问题。该方法通过冻结预训练模型权重并在每层注入可训练的秩分解矩阵,显著减少了需要训练的参数数量,其效果在RoBERTa、DeBERTa、GPT2及GPT3模型上表现优异。
02
One Small Step in Latent, One Giant Leap for Pixels: Fast Latent Upscale Adapter for Your Diffusion Models
发表:2025/11/14
扩散模型超分辨率轻量级潜在上采样适配器Swin 风格骨干网络高保真图像合成潜在空间图像生成
本文提出了一种轻量级的潜在上采样适配器(LUA),在扩散模型的潜在编码上直接进行超分处理,无需修改基础模型和额外扩散阶段。LUA可将图像分辨率的生成时间缩短近3倍,同时保证与高分辨率生成相当的感知质量,易于部署,使得现代扩散模型实现高保真合成成为可能。
02
NoMaD: Goal Masked Diffusion Policies for Navigation and Exploration
发表:2023/10/12
目标驱动导航与探索扩散政策模型大规模 Transformer 策略机器人导航任务无关探索
本论文提出了一种名为NoMaD的统一扩散策略,能够同时处理机器人在未知环境中的任务导向导航和任务无关探索。与传统方法分开处理两种任务不同,NoMaD通过大规模变换器和扩散模型解码器,灵活应对目标条件和无目标导航,实现了在达到视觉目标时的优越性能。
03
Characteristics Matching Based Hash Codes Generation for Efficient Fine-grained Image Retrieval
发表:2024/6/16
细粒度图像检索哈希编码生成方法特征学习与效率跨层语义信息传递多区域特征嵌入
针对细粒度图像检索中哈希模型设计中的固有矛盾,本文提出了一种基于特性匹配的哈希码生成方法。结合跨层语义信息传递和多区域特征嵌入模块,该方法有效捕获细微差异,提升检索效率。在广泛实验中表明,该方法显著优于现有研究。
02
PhysHSI: Towards a Real-World Generalizable and Natural Humanoid-Scene Interaction System
发表:2025/10/13
人形机器人场景交互系统对抗运动先验政策学习真实世界部署系统粗细结合的物体定位模块多任务机器人交互验证
本文提出了物理世界仿人场景交互系统PhysHSI,旨在让仿人机器人在真实环境中执行多样化的交互任务。该系统结合了对抗性运动先验的策略学习和粗到精的物体定位模块,能够实现自然逼真的动作和鲁棒的场景感知,在多个任务中展示了高效的成功率。
03
RankMixer: Scaling Up Ranking Models in Industrial Recommenders
发表:2025/11/8
工业推荐系统的模型扩展硬件感知推荐模型设计Transformer架构的高效特征交互稀疏混合专家机制动态路由策略
为解决工业推荐系统中训练成本和效率低下的问题,本文提出了RankMixer,采用硬件感知设计,优化特征交互架构。RankMixer替代了自注意力机制,提高了模型浮点运算利用率,支持一亿参数的稀疏专家变体。实验表明,RankMixer在大规模数据集上的表现显著提高了推荐系统的有效性和可扩展性。
05
FogBus: A Blockchain-based Lightweight Framework for Edge and Fog Computing
发表:2019/4/13
边缘计算与雾计算集成区块链在物联网中的应用多应用执行资源管理物联网设备的安全性跨平台接口设计
FogBus是一个基于区块链的轻量级框架,旨在促进边缘、雾和云计算的集成,以支持延迟敏感和计算密集型的物联网应用。该框架提供平台独立的接口,帮助开发者构建和多应用执行,同时通过认证和加密技术保护敏感数据,具有易部署和经济高效的优势。
04