AiPaper

论文

登录后可查看剩余解析次数。
标签筛选
Contrastive Test-Time Composition of Multiple LoRA Models for Image Generation
发表:2024/3/29
低秩适配微调方法图像生成LoRA模型组合测试时对比融合注意力机制调整
本文提出CLoRA,一种无需训练的测试时方法,动态调整多个LoRA模型的注意力图并生成语义掩码,有效融合多概念图像特征,解决了现有方法中注意力重叠、属性绑错和概念遗漏问题。实验证明CLoRA显著提升多LoRA组合生成图像的准确性和质量。
010
FreeFuse: Multi-Subject LoRA Fusion via Auto Masking at Test Time
发表:2025/10/28
多主体LoRA融合无训练融合方法跨注意力动态掩码文本到图像生成扩散模型推理优化
提出FreeFuse,通过测试时自动生成上下文感知动态掩码,实现多主体LoRA融合,无需额外训练或辅助模型。该方法直接应用于交叉注意力权重,有效提升多主体文本到图像生成的质量与实用性,简化流程并优于现有技术。
03
Smoothing Grounding and Reasoning for MLLM-Powered GUI Agents with Query-Oriented Pivot Tasks
发表:2025/3/1
多模态大语言模型基于大语言模型的动作规划图形用户界面(GUI)代理查询导向推理坐标定位与推理对齐
本文提出查询推理作为坐标导向定位与动作导向推理之间的桥梁,显著提升了资源受限条件下MLLM驱动GUI智能体的性能。该方法用极少训练数据实现了超越大型定位模型的效果,且融合额外语义信息可进一步增强推理能力。
01
CrAM: Credibility-Aware Attention Modification in LLMs for Combating Misinformation in RAG
发表:2025/4/11
大语言模型微调检索增强推理大语言模型安全机制可信度感知注意力修改大语言模型推理能力增强
本文提出可信度感知注意力修改(CrAM)方法,通过调整大型语言模型关键注意力头的权重,减少低可信度文档对检索增强生成(RAG)的负面影响。实验证明,CrAM在多种模型和数据集上显著提升了对错误信息的抵抗力,优于监督微调。
03
K-LoRA: Unlocking Training-Free Fusion of Any Subject and Style LoRAs
发表:2025/2/26
LoRA融合方法无训练LoRA合成扩散模型条件控制风格与内容联合生成注意力层动态选择机制
本文提出KLoRA,一种免训练的LoRA融合方法,通过在注意力层动态选取TopK元素,实现任意主题与风格LoRA的最优融合,兼顾内容与风格特征。实验显示KLoRA在保持原始信息完整性的同时,优于现有训练方法。
03
TidyBot++: An Open-Source Holonomic Mobile Manipulator for Robot Learning
发表:2024/12/12
机器人动作学习模仿学习移动机械臂设计全向运动底盘基于大语言模型的动作规划
本文提出开源且廉价的全向移动机械臂TidyBot,采用动力万向轮实现底盘的三自由度独立运动,大幅提升机动性,简化移动操作任务。结合手机遥操作界面,支持高效人类示范数据采集,成功训练家庭场景下的移动操作策略。
03
Knowledge-aware Graph Neural Networks with Label Smoothness Regularization for Recommender Systems
发表:2019/5/11
知识图谱嵌入图神经网络推荐系统标签平滑正则化冷启动推荐知识感知推荐方法
本文提出KGNNLS模型,通过训练可辨识用户相关的知识图谱关系,将知识图谱转化为用户特定加权图,并结合标签平滑正则提升边权质量,实现端到端训练。该方法有效提升冷启动推荐性能,并具备良好扩展性,在多数据集上优于现有最优方法。
02
DreamAnime: Learning Style-Identity Textual Disentanglement for Anime and Beyond
发表:2024/5/7
文本到图像生成风格与身份表征解耦动漫角色生成文本嵌入空间学习少样本概念学习
DreamAnime提出通过少量示例图像,在文本到图像模型嵌入空间创建风格与身份解耦的独立词元,实现动漫角色及艺术风格的灵活组合和创意生成。实验证明其在准确捕获复杂概念及多场景应用中优于现有方法。
03
SeedVR2: One-Step Video Restoration via Diffusion Adversarial Post-Training
发表:2025/6/6
扩散模型高效推理视频扩散模型视频恢复一阶段视频恢复模型自适应窗口注意力机制
提出SeedVR2,实现高分辨率视频修复的一步扩散模型。通过对抗性后训练和自适应窗口注意力机制,动态调整窗口规模,解决高分辨率处理中的不一致性,显著提升恢复质量并降低推理成本。验证多种损失函数以稳定训练。
03
SeedVR: Seeding Infinity in Diffusion Transformer Towards Generic Video Restoration
发表:2025/1/3
Diffusion Transformer视频修复长序列视频建模时空窗口注意力机制因果视频自编码器
SeedVR通过引入扩散转换器及移位窗口注意力机制,实现对任意长度与分辨率视频的高效恢复。其支持空间和时间维度的变大小窗口,突破传统注意力限制,结合因果自编码器和混合训练策略,在合成与真实视频恢复任务中表现优异。
04
Knowledge Graph Convolutional Networks for Recommender Systems
发表:2019/3/19
基于知识图谱的推荐系统图卷积网络推荐系统冷启动问题高阶结构信息建模邻居采样机制
本文提出知识图卷积网络(KGCN),通过邻居采样构建多跳感受野,有效捕获知识图谱中实体间高阶结构与语义信息,缓解推荐系统的稀疏性和冷启动问题。KGCN在电影、图书和音乐推荐中表现优异,支持大规模数据处理。
01
Disentangling Style and Content in Anime Illustrations
发表:2019/5/26
动漫插画风格与内容解耦生成对抗网络解耦模型双条件生成器动漫风格迁移多艺术家风格建模
本文提出生成对抗解耦网络,通过双条件生成器实现动漫插画中风格与内容的有效分离。该方法支持千余艺术家风格的高保真动漫肖像生成及风格迁移,优于现有技术,突破了风格与内容协同训练的难题。
11
AICHRONO L ENS: Advancing Explainability for Time Series AI Forecasting in Mobile Networks
时间序列AI预测可解释性移动网络流量预测长短期记忆网络应用时间特征关联解释方法移动通信资源管理
本文提出AICHRONO L ENS工具,将传统XAI方法与时间序列输入特性结合,实现对移动网络中LSTM预测模型的深度可解释性。该方法不仅揭示模型行为及错误原因,还提升了32%的预测性能,推动了时间序列AI预测的实用部署。
03
AgentA/B: Automated and Scalable Web A/BTesting with Interactive LLM Agents
发表:2025/4/14
基于大语言模型的用户行为模拟自动化网页A/B测试系统交互式大语言模型代理多步骤用户交互模拟大语言模型在产品实验中的应用
本文提出AgentA/B系统,利用交互式大语言模型代理自动模拟用户多步骤网页操作,实现规模化A/B测试。通过与真实用户行为对比,验证了其在电商场景中模拟用户行为的有效性,显著提升测试自动化与效率。
01
Visual Programming for Zero-shot Open-Vocabulary 3D Visual Grounding
发表:2023/11/27
零样本开放词汇3D视觉定位基于大语言模型的3D视觉推理视觉编程框架语言-对象关联模块开放词汇3D目标检测
本文提出基于视觉编程的零样本开放词汇三维视觉定位方法,结合对话式大语言模型构建理解框架,设计视角无关、相关及功能性模块协同推理,并创新语言物体关联模块扩展检测器词汇,实现无监督场景下优于部分监督基线的定位性能。
01
PersonaAgent: When Large Language Model Agents Meet Personalization at Test Time
发表:2025/6/7
大语言模型代理人个性化个性化记忆模块测试时个性化调整用户偏好对齐策略个性化动作模块
PersonaAgent提出了首个测试时个性化的大型语言模型智能体框架,结合个性化记忆模块和动作模块,实现基于用户偏好动态调整系统提示与行动。通过测试时间用户偏好对齐策略,显著提升了个性化响应和工具使用能力,展现优于传统方法的应用潜力。
022
Artificial intelligence in food science and nutrition: a narrative review
发表:2022/4/14
人工智能在食品科学中的应用食物营养分析免疫增强食品研究肠道微生物组分析食品成分毒性预测
本文综述了人工智能在食品科学与营养领域的历史、现状及关键应用,涵盖农业、免疫促进食品、膳食评估、肠道微生物组分析及食品成分毒性预测,揭示AI技术助力健康食品研发和精准营养的巨大潜力。
03
Artificial intelligence in food bioactive peptides screening: Recent advances and future prospects
发表:2024/12/13
食品源生物活性肽筛选人工智能高通量筛选分子特征表征与预测深度学习肽活性预测多功能生物活性肽分析
本文综述了人工智能在食品源生物活性肽筛选中的应用,详细介绍了基于数据、分子特征表示和深度学习模型构建的高通量筛选流程,取得抗炎、抗菌等功能性肽的筛选进展,同时指出抗肥胖和抗疲劳肽研究尚处早期,未来需发展多尺度化学特征的通用深度学习框架及高通量筛选策略。
03
Artificial intelligence assisted food science and nutrition perspective for smart nutrition research and healthcare
发表:2023/8/9
智能营养研究人工智能在营养健康中的应用机器学习辅助营养诊断自然语言处理在健康管理中的应用
该论文系统综述了人工智能在食品科学与营养领域的应用,重点分析了机器学习和自然语言处理如何提升营养诊断、个性化治疗和健康管理效率。研究指出,AI虽无法替代医护人员的情感关怀,但通过提升精准度和降低成本,推动医疗营养服务普及,同时强调伦理考量的重要性。
04
Generative Sequential Recommendation with GPTRec
发表:2023/6/20
序列推荐系统基于大语言模型的推荐系统GPT-2架构推荐模型子ID分词算法Next-K生成式推荐策略
本文提出基于GPT2的GPTRec生成式序列推荐模型,采用SVD子ID词元化减少大词汇表问题,并引入NextK生成策略优化推荐列表的复杂目标。实验表明,GPTRec在MovieLens1M上推荐质量与SASRec相当,嵌入表规模缩小40%。
02