AiPaper

论文

登录后可查看剩余解析次数。
标签筛选
DreamClear: High-Capacity Real-World Image Restoration with Privacy-Safe Dataset Curation
发表:2024/10/24
现实场景图像修复Diffusion Transformer隐私安全数据集构建文本到图像扩散模型多模态大语言模型辅助修复
本文提出GenIR数据策划流程,通过双提示词学习生成百万级隐私安全图像数据集,解决现有数据集容量和版权问题。同时引入基于扩散Transformer的DreamClear模型,结合生成先验与多模态大语言模型,实现对多样真实降解的高效自适应图像修复,显著提升恢复效果。
06
Effective Diffusion Transformer Architecture for Image Super-Resolution
发表:2024/9/29
Diffusion模型图像超分辨率Diffusion Transformer多尺度层次特征提取频率自适应时步条件模块
提出DiTSR扩散Transformer架构,采用U型多尺度层次特征提取和统一各向同性设计,提升计算资源利用效率。引入频率自适应时间步条件模块,强化不同时间步频率信息处理能力。在无预训练下达到并超越先验方法的超分辨率效果。
05
Residual corrective diffusion modeling for km-scale atmospheric downscaling
发表:2025/2/24
残差校正扩散模型千米尺度大气降尺度生成式扩散模型区域气象模拟多尺度气象数据融合
本文提出结合确定性模型与生成式扩散模型的两步法,实现从25公里再分析数据到台湾地区2公里业务天气模型的高效降尺度。该方法恢复气象数据的幂律关系,提升天气现象梯度锐度和台风强度,展现出良好确定性与概率性技能,拓展了全球到区域机器学习模拟的应用前景。
03
DiT4SR: Taming Diffusion Transformer for Real-World Image Super-Resolution
发表:2025/3/31
Diffusion模型扩散 transformer真实世界图像超分辨率低分辨率图像嵌入交互跨流卷积层设计
本文提出DiT4SR,通过将低分辨率图像嵌入集成到扩散变换器的注意力机制,实现生成潜在特征与低分辨率特征的双向交互。结合跨流卷积层补充局部信息捕获,显著提升真实世界图像超分辨率性能,验证了扩散变换器在该任务中的有效性。
09
Continual Learning for Time Series Forecasting: A First Survey
发表:2024/7/17
时间序列预测持续学习概念漂移数据漂移时间序列回归
本文首次综述了持续学习在时间序列预测中的应用,聚焦数据和概念漂移问题,探讨模型如何在非稳态环境中实现可塑性与稳定性的平衡,以应对动态数据需求和计算约束,填补该领域研究空白。
06
Characterizing Interest Aggregation in Content-Centric Networks
发表:2016/3/26
内容中心网络兴趣聚合待处理兴趣表分析LRU缓存机制建模离散事件网络仿真内容缓存网络性能分析
本文通过数学分析与离散事件仿真,提出了一个精确建模内容中心网络中LRU缓存兴趣聚合的框架,并开发迭代算法评估互连缓存网络中聚合效益。研究发现,实际应用中只有极少兴趣因聚合受益,质疑PIT作为核心机制的有效性。
09
*Thinking...*
发表:2011/1/1
高带宽存储器(HBM)时序分析实时系统内存性能嵌入式系统内存隔离实时系统最坏情况延迟优化高带宽存储器与DRAM比较
本文首次系统分析高带宽内存(HBM)在实时系统中的时序特性,揭示其相比传统DRAM的结构优势,重点提升任务隔离性和降低最坏情况延迟,满足关键嵌入式系统对内存性能的严格要求。
03
EcoServe: Enabling Cost-effective LLM Serving with Proactive Intra- and Inter-Instance Orchestration
发表:2025/4/25
大语言模型推理能力增强基于大语言模型的推理调度多实例协同调度部分解耦推理策略大规模GPU集群服务
EcoServe提出部分解耦策略,结合时间解耦和滚动激活,主动协调实例内外调度,显著减少预填充与解码干扰,提升吞吐和降低延迟。通过自适应调度和分裂扩容,实现经济高效的LLM集群服务,实测在NVIDIA L20 GPU集群上性能显著优于现有方案。
04
Large Language Diffusion Models
发表:2025/2/14
大语言模型扩散模型自回归扩散模型大语言模型微调Transformer架构概率推断生成方法
本文提出LLaDA,一种基于扩散模型的大型语言模型,通过前向掩码和逆向生成用Transformer预测词元,优化似然下界,实现概率推断。在多任务与上下文学习中表现优异,突破自回归模型限制,展现扩散模型在大规模语言建模中的潜力。
03
KORE: Enhancing Knowledge Injection for Large Multimodal Models via Knowledge-Oriented Augmentations and Constraints
发表:2025/10/22
多模态大语言模型大语言模型知识利用知识注入方法知识适应与保留灾难性遗忘缓解
提出了KORE方法,通过知识导向增强和约束,有效向大型多模态模型注入新知识并保留旧知识。KORE将知识结构化处理,精确适配模型,同时利用线性层激活协方差矩阵的零空间初始化适配器,缓解遗忘问题,提升知识持续获取能力。
09
The conceptual structure of human relationships across modern and historical cultures
发表:2025/3/13
人类社会关系认知结构跨文化关系研究自然语言处理在社会科学中的应用多维关系表示空间历史与现代文化比较
本研究结合在线调查、认知实验与自然语言处理,跨越20余个现代文化与逾3000年历史古文化,揭示人类关系的五大维度与三大核心类别,构建统一的关系概念表征空间,深化了对人类社会性认知结构及其文化差异的理解。
08
LLaDA 1.5: Variance-Reduced Preference Optimization for Large Language Diffusion Models
发表:2025/5/26
大语言模型强化学习训练Masked Diffusion Models方差减少优化LLaDA模型
LLaDA 1.5提出了方差降低偏好优化(VRPO)方法,通过理论分析ELBO估计器方差并引入无偏方差降低策略如最优蒙特卡洛预算分配和对偶采样,显著提升了掩码扩散模型的人类偏好对齐效果,在数学、代码和对齐基准上均超越前代模型。
05
dLLM-Cache: Accelerating Diffusion Large Language Models with Adaptive Caching
发表:2025/5/17
Diffusion模型微调扩散模型高效推理大语言模型推理能力增强无训练加速方法自回归扩散模型
本文针对扩散大语言模型(dLLMs)推理延迟高问题,提出未经训练的自适应缓存框架dLLMCache。其结合长间隔提示缓存与基于特征相似性的部分响应更新,实现了对中间计算的高效重用,在LLaDA 8B和Dream 7B上最高加速9.1倍,同时保证输出质量。
04
A Survey on Proactive Dialogue Systems: Problems, Methods, and Prospects
发表:2023/5/4
主动对话系统综述对话系统策略设计目标导向对话会话代理动机机制对话系统应用挑战
本文综述了主动对话系统,系统分析其核心问题、策略设计与激励机制,强调主动引导对话以提升用户参与度与任务效率。通过总结当前先进方法与挑战,论文为实现更复杂、战略性交互的对话智能体提供全面视角,推动对话式人工智能发展。
04
UMI-on-Air: Embodiment-Aware Guidance for Embodiment-Agnostic Visuomotor Policies
基于大语言模型的动作规划机器人多模态学习多模态动作表示与建模大规模机器人演示数据集通用机器人策略
提出UMIonAir框架,结合通用操作接口UMI采集的人类示范训练与具体形态无关的视觉运动策略。通过形态感知扩散策略(EADP)在推理阶段融合形态特定控制器,有效引导轨迹生成,提高受限机器人形态(如空中机械手)操作的成功率、效率和鲁棒性,实现跨形态即插即用部署。
03
UMI on Legs: Making Manipulation Policies Mobile with Manipulation-Centric Whole-body Controllers
发表:2024/7/15
机器人动作学习多体态跨环境动作表示全身控制器动态机器人操作零样本跨平台部署
UMIonLegs框架结合手持抓取器数据采集与仿真全身控制器训练,通过任务坐标系末端执行器轨迹接口,实现跨实体零样本部署。该方法在多种动态操控任务中成功率超70%,为四足机器人动态操控技能学习提供可扩展方案。
06
A cross entropy test allows quantitative statistical comparison of t-SNE and UMAP representations
发表:2023/1/1
单细胞高维数据降维t-SNE与UMAP比较交叉熵统计检验Kolmogorov-Smirnov检验生物数据定量分析
本文提出基于单细胞交叉熵分布的KolmogorovSmirnov统计检验方法,实现了tSNE和UMAP降维结果的定量比较。该方法稳健识别生物变异,提供有效数据集距离度量,推动单细胞高维数据分析超越可视化范畴。
02
WorldVLA: Towards Autoregressive Action World Model
发表:2025/6/27
视觉语言动作模型自回归动作世界模型动作序列生成环境物理规律建模注意力掩码策略
WorldVLA提出了一个集成视觉语言动作与世界模型的自回归框架,通过互补增强提升动作与图像生成预测能力。针对动作序列自回归产生的误差传播,设计注意力掩码策略显著提升动作块生成性能。
02
QiMeng-Xpiler: Transcompiling Tensor Programs for Deep Learning Systems with a Neural-Symbolic Approach
发表:2025/5/4
张量程序自动迁移神经符号程序合成跨深度学习系统编译大语言模型辅助编译异构加速器代码转换
QiMengXpiler结合大语言模型与符号程序合成,实现深度学习系统张量程序的自动跨平台转编译。通过多阶段AI辅助编译和符号修复,降低人工成本,提高代码正确性和性能,推动“一次编写,到处运行”目标。
08
Follow Me: Conversation Planning for Target-driven Recommendation Dialogue Systems
发表:2022/8/6
目标驱动推荐对话系统对话规划框架推荐系统中的对话生成用户引导策略
本文提出目标驱动推荐对话系统范式,通过设计目标驱动对话规划(TCP)框架,主动规划对话动作与话题,逐步引导用户接受推荐目标。该方法有效提升系统的主动性与推荐质量,实验验证其显著性能优化。
02