论文
登录后可查看剩余解析次数。
标签筛选
UniWorld-V1: High-Resolution Semantic Encoders for Unified Visual Understanding and Generation
发表:2025/6/3
统一视觉理解与生成模型高分辨率语义编码器基于对比语义编码的生成框架图像理解与生成多模态大语言模型
UniWorldV1 是一个创新的生成框架,结合了高分辨率语义编码器,专注于视觉理解与生成。该模型利用从大规模多模态语言模型和对比学习提取的语义特征,并在仅有 270 万训练数据的情况下,实现了图像理解、生成和操作等任务的卓越性能。
01
ImgEdit: A Unified Image Editing Dataset and Benchmark
发表:2025/5/27
ImgEdit数据集图像编辑基准测试视觉语言模型应用复杂图像编辑任务多轮编辑评估
论文提出了图像编辑数据集,包含120万个精心设计的编辑对,涵盖了复杂的单轮和多轮任务,旨在弥补开源模型在质量数据和基准测试上的不足。通过使用,训练了模型,并设计了基准,展示了其在多个任务上的优越性能。
03
AnyKey: A Key-Value SSD for All Workload Types
发表:2025/2/6
通用键值 SSD键值存储应用元数据优化固态驱动器性能评估不同行业工作负载
本文提出了AnyKey,一种新型键值对固态硬盘(KVSSD)设计,旨在解决现有KVSSD在较大键的工作负载下性能下降的问题。通过优化元数据的大小,AnyKey在多种不同类型的工作负载中表现优于当前先进的KVSSD设计。
01
Enhancing Embedding Representation Stability in Recommendation Systems with Semantic ID
发表:2025/4/3
推荐系统中的语义ID嵌入嵌入表示稳定性增强尾部ID建模优化基于内容的ID聚类注意力模型集成
随着在线内容的爆炸性增长,推荐系统面临ID模型的挑战。本文提出一种名为语义ID前缀Ngram的新参数化技术,通过基于内容的聚类方法显著提升嵌入稳定性,优化了ID模型的性能,克服了共享嵌入导致的数据污染问题。
01
Enzyme specificity prediction using cross-attention graph neural networks
发表:2025/10/8
交叉注意力图神经网络酶特异性预测SE(3)不变图神经网络酶-底物相互作用数据库高精度酶底物识别
本文开发了名为的交叉注意力图神经网络架构,用于预测酶底物特异性。通过在全面的酶底物相互作用数据库上训练,该模型在识别反应底物时达到了91.7%的准确率,显著优于现有方法,推动了生物催化和药物发现的实际应用。
11
Analysis of effects to scientific impact indicators based on the coevolution of coauthorship and citation networks
发表:2024/4/19
共著关系与引用网络共演进科学影响指标分析期刊影响因子与h-index优先附加建模方法科学计量学模拟方法
本研究利用优先附着模型建立了共同作者和引文网络,探讨其对科学影响力指标的影响。通过模拟分析发现,增加参考文献数量或缩短论文生命周期会显著提升期刊影响因子和h指数,而不引入新作者的团队扩展则增加平均h指数。这些结果强调了科学影响力指标的动态性及参数操纵的重要性。
02
Freezing-based Memory and Process Co-design for User Experience on Resource-limited Mobile Devices
发表:2025/1/18
资源有限移动设备用户体验优化内存与进程协同管理应用冻结机制LRU列表优化移动设备性能提升
本文提出了框架,通过综合内存与进程管理,优化资源有限移动设备的用户体验。研究发现,后台进程的内存活动严重影响前台应用性能。框架可识别并冻结易引起重fault的后台进程,并在内存条件允许时解冻,从而显著提升用户体验,帧率提高1.57倍,进一步优化后帧率提升达5.14%。
01
SSEmb: A joint embedding of protein sequence and structure enables robust variant effect predictions
发表:2024/11/7
序列-结构嵌入模型变体效应预测图表示的蛋白质结构Transformer模型与序列对齐蛋白质-蛋白质结合位点预测
本文提出了SSEmb(序列结构嵌入),一种将蛋白质序列和结构信息整合于单一模型的方法。通过结合结构的图表示与Transformer模型处理多序列比对,SSEmb实现了强有力的变异效应预测,尤其在序列信息有限的情况下表现尤为出色,且同样适用于预测蛋白质蛋白质结合位点等任务。
05
InterPLM: Discovering Interpretable Features in Protein Language Models via Sparse Autoencoders
发表:2024/11/13
蛋白质语言模型特征提取稀疏自编码器应用蛋白质生物学解释性人类可理解的潜在特征ESM-2模型分析
本文提出了一种利用稀疏自编码器从蛋白质语言模型(PLM)中提取可解释特征的新方法。通过分析ESM2模型的嵌入,发现多达2548个人类可解释的潜在特征,这些特征与143个生物学概念高度相关。研究表明,PLM能够编码丰富的生物学信息,且可应用于蛋白质数据库补全和序列生成。
04
SCALING LARGE LANGUAGE MODELS FOR NEXT-GENERATION SINGLE-CELL ANALYSIS
发表:2025/4/17
大语言模型微调单细胞RNA测序细胞文本建模生物信息合成多细胞上下文推理
本研究提出了一种基于Cell2Sentence框架的新方法,将单细胞RNA测序数据转化为文本“细胞句子”,并在超过十亿个标记的语料库上训练大型语言模型。通过将模型规模扩展至270亿参数,观察到在多细胞信息整合及高级下游任务中的持续性能提升,最终为下一代单细胞分析和“虚拟细胞”的开发奠定了基础。
03
RaC: Robot Learning for Long-Horizon Tasks by Scaling Recovery and Correction
发表:2025/9/10
长时序任务的机器人学习人机交互回滚与修正机器人策略微调双手控制任务效率提升与鲁棒性增强
这篇论文提出了一种名为的方法,旨在通过扩展机器人学习中的恢复和纠正行为,提高其在长时程任务中的效率和鲁棒性。通过人类干预的训练阶段,利用人类操作者的干预轨迹对机器人策略进行微调,增强了机器人的重试和适应能力,显著提升了在复杂任务上的表现。
03
ShiDianNao: Shifting Vision Processing Closer to the Sensor
图像应用专用神经网络加速器卷积神经网络优化近感知器架构设计高能效神经网络加速器65纳米布局设计
本文提出了一种名为ShiDianNao的卷积神经网络加速器,置于CMOS或CCD传感器旁,消除DRAM访问并优化数据访问模式,使能效提高60倍,速度比高端GPU快约30倍,面积仅为4.86mm²,功耗320mW,推动了图像应用的性能提升。
03
INT v.s. FP: A Comprehensive Study of Fine-Grained Low-bit Quantization Formats
发表:2025/10/29
低位量化格式细粒度量化比较浮点与整数量化AI硬件优化细粒度INT训练
本研究系统比较了低位量化格式中的浮点数(FP)和整数(INT),填补了行业内缺乏统一对比的空白。结果显示,对于8位细粒度格式,MXINT8在算法精度和硬件效率上优于FP;而在4位格式中,FP常具精度优势,但结合异常值缓解技术后,NVINT4表现更佳。引入的对称裁剪方法有效解决了细粒度INT训练中的梯度偏差问题,挑战了FP的广泛使用,证明细粒度INT格式在未来AI加速器设计中更具潜力。
04
A genome-to-proteome map reveals how natural variants drive proteome diversity and shape fitness
发表:2025/10/9
基因组-蛋白质组映射自然变异与蛋白质组多样性自然遗传变异影响酵母菌株遗传研究基因型-表型关系研究
本研究首次绘制出自然、核苷酸分辨率的基因组到蛋白质组图谱,揭示了自然遗传变异如何显著驱动蛋白质组的多样性和适应性。研究通过分析不同酵母菌株的减数分裂后代,展示了微小变异与复杂选择机制的相互作用,强调了高分辨率图谱在基因型表型研究中的重要性。
03
DaDianNao: A Machine-Learning Supercomputer
发表:2014/12/1
机器学习超级计算机卷积神经网络加速器深度神经网络架构多芯片系统设计高性能计算优化
本文介绍了机器学习超级计算机DaDianNao的设计,该系统针对CNN和DNN优化,展示了在64芯片系统中相较于GPU可实现450.65倍的加速,并降低150.31倍能耗,从而有效应对机器学习对计算和内存的高需求。
02
Physics-Based Dexterous Manipulations with Estimated Hand Poses and Residual Reinforcement Learning
发表:2020/8/7
基于残差的强化学习与模仿学习3D手势估计与物理模拟虚拟环境中的灵巧操作基于手势的对象交互物理引导的目标姿势重映射
本文提出了一种新型的残差强化学习方法,使得智能体能在虚拟环境中进行灵巧操控,依据估计的手部姿态映射到目标姿态,克服了物理反馈缺失的问题。通过3D手部姿态估计奖励,该模型在处理复杂手物体交互和运动重建时显著提高了准确性和灵活性。
02
DreamControl: Human-Inspired Whole-Body Humanoid Control for Scene Interaction via Guided Diffusion
发表:2025/9/18
基于扩散模型的机器人控制全身人形机器人动作学习人类运动数据指导的强化学习模拟到真实的动作转移Unitree G1 机器人任务执行
本文提出了DreamControl,一种新的全身人形机器人技能学习方法。该方法结合了受人类运动数据训练的扩散模型和强化学习,能够引导机器人完成复杂任务,如打开抽屉和物体交互,且有效促进仿真到真实世界的迁移。
03
Omnigrasp: Grasping Diverse Objects with Simulated Humanoids
发表:2024/7/16
基于模拟人形机器人的抓取控制多样物体抓取与移动人形运动表示学习不需要配对数据集的训练方法物体轨迹跟随任务
本文提出了一种名为Omnigrasp的方法,用于控制模拟人形机器人抓取和移动多样物体。该方法通过学习一套人形运动表示来增强机器人控制精度,支持1200多种物体沿随机轨迹移动。训练过程中无需配对数据,仅依靠简单的奖励和状态表示,展现出卓越的可扩展性与性能。
02
Stable-Predictive Optimistic Counterfactual Regret Minimization
发表:2019/2/14
反事实悔恨最小化稳定预测悔恨最小化大规模博弈求解收敛速率优化决策树中的稳定性
本文提出了一种新型的反事实遗憾最小化(CFR)变体,显著提高了大规模扩展形式博弈(Nash均衡)的收敛速率,达到了。通过结合预测性和稳定性遗憾最小化的进展,引入"稳定预测性"概念,为决策树中的每个最小化器设置了稳定性,使算法表现优于传统CFR。
02
Learning Smooth Humanoid Locomotion through Lipschitz-Constrained Policies
发表:2024/10/16
Lipschitz约束政策腿部机器人的平稳运动控制强化学习与仿真到现实转移机器人平滑行为开发低通滤波与平滑奖励
本文提出了一种通过Lipschitz约束策略(LCP)来提升类人机器人运动控制的有效方法。LCP在强化学习框架中强制实施平滑行为,取代了传统的平滑奖励和低通滤波器,并且易于与自动微分集成。实验表明,LCP生成的控制器在模拟和现实世界中具有良好的平滑性和鲁棒性。
02
…