AiPaper

论文

登录后可查看剩余解析次数。
标签筛选
$\text{S}^{3}$Mamba: Arbitrary-Scale Super-Resolution via Scaleable State Space Model
发表:2024/11/16
任意尺度超分辨率可扩展状态空间模型隐式神经表示尺度感知自注意力机制线性复杂度超分辨率模型
本文提出S³Mamba,采用可扩展状态空间模型和尺度感知自注意力机制,实现任意尺度图像超分辨率,突破传统方法计算复杂度高、长距离依赖建模差的瓶颈。该模型实现线性复杂度连续表示,提升了合成及真实数据上的性能和泛化能力。
07
LinearSR: Unlocking Linear Attention for Stable and Efficient Image Super-Resolution
发表:2025/10/10
图像超分辨率线性注意力机制感知失真权衡优化Early-Stopping Guided Fine-tuningSNR驱动混合专家架构
LinearSR框架首次系统解决线性注意力在图像超分辨率中训练不稳定、感知失真权衡和引导效率低的问题。通过早停引导微调、基于信噪比的专家混合和轻量级指导策略,实现了领先的感知质量与高效推理速度,推动真实感超分辨率技术发展。
07
A Rapid Sand Gradation Detection Method Based on Dual-Camera Fusion
发表:2025/7/9
双摄像头融合颗粒级配检测时序间隔采样策略轻量级图像分割算法制造砂质量在线检测
提出基于双摄像头融合和时间间隔采样策略的砂级配快速检测方法,结合广角与高倍率相机捕捉全粒径信息,利用轻量几何分割与正态分类器实现粒径识别。测试表明该方法处理快速且误差小,适合在线实时质控。
04
LinVideo: A Post-Training Framework towards O(n) Attention in Efficient Video Generation
发表:2025/10/9
视频扩散模型线性注意力机制后训练稀疏注意力优化高效视频生成分布匹配目标函数
LinVideo提出一种无需数据的后训练框架,通过选择性转换机制自动将预训练视频扩散模型中的部分自注意力层替换为线性注意力,并用任意时刻分布匹配目标有效保持性能,实现最高15.92倍延迟降低和1.252倍加速。
08
The Devil in Linear Transformer
发表:2022/10/19
Transformer架构长上下文建模稀疏注意力效率提升基于 transformer 的高效前向预测
本文针对线性Transformer在长序列建模中性能下降的两大瓶颈——梯度无界和注意力稀释,提出创新性的NormAttention归一化机制替代传统缩放操作以稳定训练梯度,同时引入早期层对角注意力限制邻近词元关注范围。基于此设计的新模型TransNormer显著提升了收敛稳定性和局部结构捕捉能力,在文本分类、语言建模及长程竞技场基准上均超越标准Transformer及现有线性变体,兼具更优的效率和效果。
02
CatVTON: Concatenation Is All You Need for Virtual Try-On with Diffusion Models
发表:2024/7/21
虚拟试穿扩散模型轻量级扩散模型网络参数高效训练简化推理流程
CatVTON提出了一种基于扩散模型的虚拟试穿新方法,通过空间拼接服装与人物图像,构建轻量级网络,移除多余模块,实现参数高效训练和简化推理。该方法显著降低计算资源需求,训练数据量适中,展现出优越的视觉质量和泛化能力。
02
Kaiwu: A Multimodal Manipulation Dataset and Framework for Robot Learning and Human-Robot Interaction
发表:2025/3/7
多模态机器人操作数据集机器人学习框架人机交互数据采集精细动作标注多传感器融合
Kaiwu数据集提供了一个多模态机器人操作数据框架,汇集20名受试者对30种物体的11,664次操作演示,包含手势、压力、声音、多视角视频、运动捕捉、眼动及肌电信号,配以精细时序标注。该数据集促进机器人学习、精巧操作和人机协作研究。
04
OneSearch: A Preliminary Exploration of the Unified End-to-End Generative Framework for E-commerce Search
发表:2025/9/3
生成式推荐系统多视角用户行为序列建模端到端电商搜索框架层次量化编码偏好感知奖励系统
论文提出OneSearch,统一端到端生成式电商搜索框架,通过关键词增强层次化量化编码、多视角用户行为序列模型和偏好感知奖励系统,实现查询与商品更精准匹配。在线A/B测试显著提升点击率和订单量,同时降低75%以上运营成本,已部署于快手。
08
Toward Effective Tool-Integrated Reasoning via Self-Evolved Preference Learning
发表:2025/9/27
大语言模型推理能力增强基于大语言模型的动作规划自演化偏好学习多阶段微调策略信息熵引导采样
本文提出ToolLight框架,通过信息熵分析工具调用影响,结合自演化采样与多阶段微调,实现大型语言模型工具集成推理的高效准确,显著缓解工具滥用与不足问题,提升推理链稳定性与性能。
05
LLMs Reproduce Human Purchase Intent via Semantic Similarity Elicitation of Likert Ratings
发表:2025/10/9
大语言模型微调基于大语言模型的推荐系统语义相似度评分方法Likert量表模拟消费者行为建模
本文提出语义相似度评级(SSR)方法,通过对大语言模型生成文本与参考陈述的嵌入相似度映射,实现对人类购买意图的高效仿真。SSR在包含9300人类响应的大规模个人护理产品调查中达成90%重测信度,保持响应分布真实性及可解释性,促进可扩展消费者研究。
09
Customer-R1: Personalized Simulation of Human Behaviors via RL-based LLM Agent in Online Shopping
发表:2025/10/9
大语言模型强化学习训练基于大语言模型的动作规划个性化用户行为模拟在线购物行为建模基于奖励信号的行为生成
本文提出CustomerR1,基于强化学习的大语言模型智能体,针对在线购物环境中用户个性画像,实现个性化逐步行为模拟。方法结合用户画像信息,通过动作正确性奖励优化行为生成,在OPeRA数据集上显著优于提示和监督微调方法,提升个性化行为预测准确性和保真度。
019
R4ec: A Reasoning, Reflection, and Refinement Framework for Recommendation Systems
发表:2025/7/23
生成式推荐系统大语言模型强化学习训练序列推荐系统基于大语言模型的推荐系统推理反思与精炼框架
本文提出R4ec框架,结合推理、反思和精炼,引入行动者模型和反思模型迭代优化推荐结果,实现类似系统2的思维方式。实验证明该方法在多个公开数据集及大规模广告平台中提升推荐性能及收益。
03
LMAgent: A Large-scale Multimodal Agents Society for Multi-user Simulation
发表:2024/12/12
多模态大语言模型大规模多智能体系统多用户行为模拟电商场景模拟自洽提示机制
LMAgent提出基于多模态大语言模型的大规模多智能体社会,实现超万智能体在电商场景下的真实多用户行为模拟。创新性地引入自洽性提示机制增强决策能力,结合小世界模型快速记忆机制提升效率,展现出人类般行为和羊群效应,验证了模拟可信性。
010
Shop-R1: Rewarding LLMs to Simulate Human Behavior in Online Shopping via Reinforcement Learning
发表:2025/7/24
大语言模型强化学习训练大语言模型推理能力增强基于大语言模型的动作规划模拟人类行为在线购物行为建模
本文提出ShopR1框架,通过强化学习分别奖励推理生成和行动预测两个阶段,利用模型内信号和层次化难度感知奖励,显著提升LLM在线购物行为的模拟能力,实验显示性能较基线提升65%以上。
016
Can LLM Agents Simulate Multi-Turn Human Behavior? Evidence from Real Online Customer Behavior Data
发表:2025/3/27
大语言模型微调大语言模型强化学习训练序列策略优化基于大语言模型的动作规划真实用户行为模拟
本文首次基于3.1万真实购物会话大规模量化评估了LLM Agent多轮模拟人类行为的能力,发现基于提示的模型准确率仅11.86%。通过微调及合成推理轨迹增强,Qwen2.57B模型准确率提升至17.26%,显著改进了行为预测的实际准确性。
03
MimicGen: A Data Generation System for Scalable Robot Learning using Human Demonstrations
发表:2023/10/27
机器人动作学习模仿学习机器人演示数据集生成多任务机器人学习自动化数据合成系统
MimicGen系统通过少量人类演示自动生成大量多样化机器人数据,实现数据扩增。其生成的5万多演示覆盖18个任务,训练出的机器人在复杂长时程任务表现优异,显示出与额外人类演示相媲美的效能,为机器人学习提供经济高效的扩展方案。
02
Chameleon
发表:1999/1/1
侧信道攻击数据集真实硬件侧信号隐藏侧信道泄漏分割RISC-V SoC功率迹线侧信道隐藏技术评估
Chameleon数据集基于真实RISCV SoC,收录了应用动态频率缩放、随机延迟、变形和掺杂等四种隐藏技术的混淆功耗轨迹。其独特元数据支持加密操作的精准分割与攻击研究,填补了真实隐藏侧信道测量评估的空白,推动对隐藏对策脆弱性的深入揭示。
03
The youth mental health crisis: analysis and solutions
发表:2025/1/21
青少年心理健康危机公共卫生心理学社会经济因素与心理健康心理健康预防与早期干预全球健康政策
本文系统分析了自20世纪中期以来青少年精神健康危机的多因影响,揭示全球政治经济大趋势及疫情加剧了精神障碍和自残问题,强调全球需优先推进预防、早期干预与创新服务,同时强化现有体系资源以应对紧急需求。
02
Large Language Model Agent: A Survey on Methodology, Applications and Challenges
发表:2025/3/27
大语言模型代理系统综述大语言模型强化学习训练基于大语言模型的动作规划大语言模型推理能力增强多模态大语言模型
本文系统综述大型语言模型代理,从方法论出发构建分类体系,解析其架构、协作与演化机制,统一零散研究,揭示设计原则与复杂环境中行为的内在联系,涵盖评估、工具及应用,指明未来发展方向。
09
Elo-Evolve: A Co-evolutionary Framework for Language Model Alignment
发表:2025/10/8
大语言模型对齐序列策略优化多智能体博弈训练Elo排名机制基于比较的奖励学习
EloEvolve提出一种协同进化框架,通过直接利用成对输赢结果和基于Elo评分的动态对手选择,实现对大型语言模型的高效对齐。理论与实验表明该方法大幅降低噪声,提升样本利用率和训练稳定性,在多基准测试上优于传统绝对评分方法。
08