论文
登录后可查看剩余解析次数。
标签筛选
CosyVoice 2: Scalable Streaming Speech Synthesis with Large Language Models
发表:2024/12/16
流式语音合成大型语言模型应用多语言数据集语音生成模型优化渐进语义解码
本文介绍了CosyVoice 2,一个改进的流式语音合成模型,基于有限标量量化优化词元利用率,并简化文本语音模型架构以利用预训练的大型语言模型,结合块感知因果流匹配模型实现了接近人类水平的自然度和几乎无损的合成质量。
08
5G Vehicle-to-Everything Services: Gearing Up for Security and Privacy
发表:2019/11/13
5G车联网安全与隐私车辆与一切通信5G网络服务与应用车载传感器网络低延迟通信
本文全面综述了5G车联网服务的安全性与隐私问题,分析了5G V2X的架构、用例及潜在的信任和安全威胁。探讨了保护5G V2X服务的最新策略,并指出了未来研究方向,以推动此领域的深入发展和广泛应用。
08
A Component Architecture for the Internet of Things
发表:2018/9/1
物联网组件架构并发时间戳离散事件语义异步原子回调机制安全群体工具包代理与服务交互
本文提出了一种面向物联网的组件化软件架构,设计了称为“访问器”的代理实体,它们在并发的、带时间戳的离散事件语义下进行交互。通过结合异步原子回调(AAC)和演员模型,该架构支持多个并发请求,提升了网络交互的效率和安全性。
04
UniMMVSR: A Unified Multi-Modal Framework for Cascaded Video Super-Resolution
发表:2025/10/9
级联视频超分辨率多模态视频生成潜在视频扩散模型条件注入策略多模态条件利用
本论文提出了UniMMVSR,一个统一的多模态视频超分辨率框架,可处理文本、图像和视频等多种输入条件。研究团队探索了条件注入策略和数据混合技术,实验结果显示该框架在视频细节和多模态条件一致性上显著优于现有方法,支持4K视频生成。
01
iBitter-SCM: Identification and characterization of bitter peptides using a scoring card method with propensity scores of dipeptides
发表:2020/3/28
苦味肽预测模型评分卡方法氨基酸倾向性评分膳食药物开发机器学习分类器对比
iBitterSCM是一种新提出的计算模型,能够基于氨基酸序列预测苦味肽。该模型利用评分卡方法,结合氨基酸和二肽的倾向性评分,实现了高效的苦味肽识别。在独立数据集上,其准确率达到84.38%,显著优于其他机器学习分类器,为药物开发和营养研究提供了重要工具。
02
Hotspot-Driven Peptide Design via Multi-Fragment Autoregressive Extension
发表:2024/11/26
热点驱动肽设计自回归生成模型肽药物开发基于片段的肽生成能量密度模型
本文提出了PepHAR,一个热点驱动的自回归生成模型,用于设计针对特定蛋白质的肽。通过聚焦具有更高相互作用潜力的热点残基,并结合片段扩展与优化,PepHAR可以有效生成具有正确几何结构的肽,从而推动肽类药物开发。
03
From prediction to design: Revealing the mechanisms of umami peptides using interpretable deep learning, quantum chemical simulations, and module substitution
可解释深度学习模块替代策略鲜味肽设计量子化学模拟虚拟水解
本研究采用可解释深度学习模型与模块替代策略有效筛选和设计鲜味肽,模型准确率达0.94,领先29%。通过虚拟水解与感官评估识别出多种鲜味肽,探讨模块替代机制,揭示与T1R1/T1R3受体的相互作用,氨基酸D、E、Q、K、R关键助力鲜味肽设计。
04
Mip-Splatting: Alias-free 3D Gaussian Slatting
3D高斯Splatting高频伪影消除Mip滤波器三维平滑滤波
本文提出的3D平滑滤波器有效解决了3D高斯泼溅中的伪影问题,通过根据最大采样频率约束3D高斯基元的尺寸,消除放大时的高频伪影。同时,采用的2D Mip滤波器替代了传统的2D膨胀滤波器,显著缓解了混叠和膨胀问题。
04
Mip-Splatting: Alias-free 3D Gaussian SRecently, 3D Gaussian Splatting has demonstrated impressive novel view synthesis results, reaching high fidelity and efficiency. However, strong artifacts can be observed when changing the sampling rate, e.g., by changing focal length or camera distance. We find that the source for this phenomenon can be attributed to the lack of 3D frequency constraints and the usage of a 2D dilation filter. To address this problem, we introduce a 3D smoothing filter which
3D高斯插值渲染无别名三维滤波器视图合成高频伪影消除三维频率约束
本文提出了一种名为3D平滑滤波器的创新方法,通过约束3D高斯基元的大小来消除在新颖视角合成中因焦距或相机距离变化而产生的高频伪影。同时,替代2D膨胀滤波器的2D Mip滤波器有效缓解了混叠和伪影问题,提升了合成效果。
05
Inference Performance of Large Language Models on a 64-core RISC-V CPU with Silicon-Enabled Vectors
大语言模型推理能力增强基于RISC-V的硬件优化硅启用向量计算能源效率计算架构矩阵乘法性能基准
本研究探讨了在64核RISCV CPU上配备硅增强向量的LLM推理性能。通过对Llama2模型的基准测试,结果表明SEV在吞吐量和能量效率上显著超过传统架构,尤其在小模型上效果更佳。研究提供了针对未来异构计算平台部署LLMs的实用见解。
07
Privacy-Preserving Action Recognition via Motion Difference Quantization
发表:2022/8/4
隐私保护的人类动作识别运动差异量化对抗训练优化计算机视觉私隐安全问题图像模糊与差分处理
本文提出了一种名为BDQ(模糊、差分和量化)的隐私保护编码器,旨在增强人体动作识别的隐私保护。该模型通过模糊处理、连续帧像素差分以及运动帧量化三个步骤有效抑制隐私信息,同时保持动作识别性能。实验结果在三个基准数据集上显示出其先进的性能。
019
X-VLA: Soft-Prompted Transformer as Scalable Cross-Embodiment
Vision-Language-Action Model
发表:2025/10/12
视觉语言动作模型跨体态学习软提示学习通用机器人平台大规模异构数据集
本文提出了XVLA,一个基于软提示的变压器架构,旨在构建可扩展的视觉语言动作(VLA)模型。通过引入可学习的嵌入,用于不同机器人数据源的跨具身学习,XVLA在多个仿真和真实机器人上实现了先进的性能,展现了对不同任务和环境的灵活适应能力。
02
Deciphering the biosynthetic potential of microbial genomes using a BGC language processing neural network model
发表:2025/4/10
微生物基因组生物合成潜力分析生物合成基因簇预测模型基于Transformer的基因位置关系捕获超高通量BGC筛选工具微生物次级代谢产物研究
本研究介绍了一种名为BGCProphet的变压器基础语言模型,用于预测和分类微生物基因组中的生物合成基因簇(BGC)。该模型通过捕捉基因间的空间依赖关系,显著提升了效率和准确性,分析了85203个基因组和9428个宏基因组,揭示了BGC在不同类群中的分布及其环境影响,为微生物次级代谢物的研究和合成生物学应用提供了新工具。
03
StreamDiffusionV2: A Streaming System for Dynamic and Interactive Video
Generation
发表:2025/11/11
视频扩散模型实时交互视频生成流媒体内容创作低延迟视频生成多GPU实时流媒体服务
本文提出了StreamDiffusionV2,一个用于动态和交互式视频生成的流式系统,旨在解决现有直播模型在时间一致性和低延迟方面的瓶颈。该系统集成了SLO感知的批处理调度器、块调度器以及其他优化,支持无训练的实时流媒体服务,显著提升用户交互体验。
010
Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal
Locomotion Control
发表:2024/1/30
动态双足机器人控制深度强化学习应用机器人适应性与鲁棒性多样化行动技能双历史结构控制架构
本文通过深度强化学习开发了适用于双足机器人的动态运动控制器,超越了单一运动技能的限制,采用创新的双历史架构,利用长期和短期的输入/输出历史,提升了适应性与鲁棒性。该控制器在多种动态技能中表现优异,并在真实机器人上成功验证,推动了双足机器人的运动能力。
02
ExBody2: Advanced Expressive Humanoid Whole-Body Control
发表:2024/12/18
人形机器人全身控制表达性动态动作生成基于人体动作捕捉的控制策略机器人运动学自适应优化全身运动跟踪算法
本文提出了一种先进的人形机器人全身控制方法ExBody2,旨在实现动态与表现力兼备的全身运动,同时保持稳定性与鲁棒性。该方法通过训练并转移人类运动捕捉与模拟数据,结合了对全身速度与身体关键点的解耦,最终生成可执行行走、蹲下和跳舞的控制策略,并探讨了多功能性与特定运动表现之间的权衡。
03
SIDA: Social Media Image Deepfake Detection, Localization and Explanation with Large Multimodal Model
社交媒体图像深伪检测大规模多模态模型深伪定位与解释深伪检测数据集图像真实性鉴别
本文提出了SIDA框架,利用大型多模态模型,实现社交媒体图像深度伪造的检测、定位和解释。同时,创建了社交媒体图像检测数据集SIDSet,包含30万张多样化的合成和真实图像,具有高真实性和全面注释,显著提高了深度伪造检测的效果。
011
FoldamerDB: a database of peptidic foldamers
发表:2019/10/17
折叠聚合物数据库抗菌与抗癌折叠聚合物生物活性折叠聚合物可公开访问的化合物信息库折叠聚合物结构与序列信息
FoldamerDB是一个开放源代码的肽折叠聚合物数据库,完全标注且经人工策划,包含1319种折叠聚合物的序列、结构与生物活性信息,来源于160多篇论文。其用户友好的界面支持多种搜索和筛选功能,填补了肽折叠聚合物领域公开资源的空白。
05
Explainable Machine Learning and Deep Learning Models for Predicting TAS2R-Bitter Molecule Interactions
发表:2025/10/9
解释性机器学习模型苦味分子与TAS2R相互作用预测深度学习用于肽配体识别G蛋白偶联受体功能研究分子特征与药物设计
本研究开发了可解释的机器学习和深度学习模型,用于预测苦味分子与TAS2R受体的相互作用。模型基于实验验证数据,具有高性能和易用性,能够辅助配体选择并增强对苦味受体功能的理解,对于药物设计和疾病研究具有重要意义。
02
Identifying Sequential Residue Patterns in Bitter and Umami Peptides
发表:2022/11/9
苦味和鲜味肽的序列模式识别肽序列空间粗粒化味觉特征的定量结构-活性关系氨基酸模式提取苦味和鲜味肽的特征系统改进
本研究探讨肽的氨基酸序列如何影响味觉,通过提取氨基酸序列模式,提出了一种粗粒度化肽序列空间的方法,系统识别苦味和鲜味肽的最佳模式:分别为一个疏水性后跟四个极性残基及两个负电荷后跟三个极性残基,结果显示实现了比随机模式和基线模式更好的改进。
07
……