AiPaper

论文

登录后可查看剩余解析次数。
标签筛选
S0007125020001592jra 158..164
广泛性焦虑障碍管理成人精神健康 (18+)英国THIN数据库研究焦虑抑郁流行趋势分析抗焦虑药物使用模式
本研究基于英国THIN数据库分析19982018年初级保健中广泛性焦虑症的记录趋势,发现年轻女性及男性1824岁组焦虑诊断显著增加,老年人保持稳定。诊断后近半数患者接受SSRI治疗,苯二氮卓类药减少,反映焦虑症诊疗负担上升。
05
主客观赋权专家推理的滚磨光整加工工艺要素决策
主客观赋权专家推理滚磨光整加工工艺要素决策分级分类规则构建专家系统决策模型表面完整性加工工艺
本文提出基于主客观赋权专家推理的滚磨光整加工工艺要素决策模型,构建分级分类规则库,提升对滚抛磨块、光整设备和磨液的决策准确率。该模型有效解决了信息不完整下的决策难题,实验验证了其鲁棒性与实用价值。
03
Unsupervised Learning of Visual Features by Contrasting Cluster Assignments
发表:2020/6/17
无监督视觉特征学习对比式聚类学习SwAV算法多裁剪数据增强ResNet-50图像分类
提出SwAV无监督视觉特征学习方法,通过对比不同增强视图的聚类分配实现特征一致性,避免了成对特征比较的计算开销。结合多尺度裁剪数据增强,SwAV在无需记忆库和动量网络的条件下高效训练,显著提升无监督学习性能。
01
Deep Clustering for Unsupervised Learning of Visual Features
发表:2018/7/15
视觉特征无监督学习深度聚类方法端到端视觉表征学习大规模图像数据集训练基于 k-means 的特征学习
本文提出DeepCluster方法,通过迭代的kmeans聚类,将网络生成的特征簇分配作为伪标签,联合训练神经网络,实现大规模无监督视觉特征学习。该方法在ImageNet等数据集上显著优于同期无监督学习技术。
02
Towards Calibrated Deep Clustering Network
发表:2024/3/4
深度聚类校准置信度校准机制双头深度聚类模型伪标签自训练网络初始化策略
本文针对深度聚类中过度自信问题,提出基于双头结构的可校准深度聚类框架。校准头调整聚类头的置信度,自适应选择伪标签样本进行自训练,并结合新的网络初始化策略,提升训练效率与模型鲁棒性,理论实验证明效果显著。
01
PhysVLM: Enabling Visual Language Models to Understand Robotic Physical Reachability
发表:2025/3/11
视觉语言动作模型机器人物理可达性表示多机器人多模态数据集Phys100K机器人视觉语言推理环境感知与空间表示
本文提出PhysVLM模型,结合空间物理可达性图(SP Map)统一表示多种机器人物理可达性,突破视觉语言模型缺乏物理约束的瓶颈。该方法通过额外编码器融合可达性特征,实现具身视觉推理能力提升,且验证于大规模多机器人数据集Phys100K。
05
Flexible sensors for force detection: A review
发表:2025/8/6
柔性力传感器多轴力检测仿生微结构传感器可降解柔性材料传感器结构设计
本文综述了用于力检测的柔性传感器,涵盖电阻、磁性和光学等多种传感机制,重点介绍了仿生微结构、可降解材料及抗弯曲设计等结构创新。评析不同机制性能,探讨其在智能穿戴、机器人及医疗假肢中的应用前景与挑战。
04
Integrating large language models with explainable fuzzy inference systems for trusty steel defect detection
发表:2025/3/20
钢铁缺陷检测大语言模型解释性模糊推理系统局部训练全局预测方法遗传算法优化
提出LEFIS方法,结合大型语言模型与可解释模糊推理系统,通过局部训练全局预测策略进行钢铁缺陷检测,利用遗传算法优化模糊系统参数,并用LLMs解释结果,实现高效、透明且可信的工业缺陷识别。
01
Hunyuan3D 2.5: Towards High-Fidelity 3D Assets Generation with Ultimate Details
发表:2025/6/20
高保真3D资产生成3D扩散模型形状基础模型LATTICE物理渲染纹理生成多视角纹理生成架构
Hunyuan3D 2.5通过引入参数达百亿的LATTICE形状基础模型和基于物理渲染的多视角纹理生成架构,实现了高保真、细节丰富且纹理真实的三维资产生成,有效缩小了生成形状与手工制作之间差距,性能超越先前方法。
05
Hunyuan3D 2.1: From Images to High-Fidelity 3D Assets with Production-Ready PBR Material
发表:2025/6/18
高质量3D资产生成基于扩散Transformer的3D形状生成PBR材质合成3D生成模型训练流程游戏与工业设计中的3D内容创作
Hunyuan3D 2.1提出了一个端到端高保真3D资产生成系统,结合基于扩散变换器的形状生成与生产级PBR纹理合成,实现从单张图像自动生成高质量带纹理的3D网格。该系统公开了完整训练与评估流程,推动3D AIGC应用于游戏、虚拟现实及工业设计。
03
Robust Speech Recognition via Large-Scale Weak Supervision
发表:2022/12/9
大规模弱监督语音识别多语言多任务语音模型零样本迁移学习无微调语音识别互联网音频转录数据
本文通过大规模弱监督训练多语言多任务模型,使用68万小时互联网音频转录数据,实现了无微调下的零样本迁移语音识别。模型在多个基准测试中表现优异,鲁棒性和准确度接近人类水平,推动了开箱即用的鲁棒语音识别技术发展。
04
Experimental investigation on effect of ion cyclotron resonance heating on density fluctuation in SOL at EAST
发表:2021/7/19
电离回旋共振加热刮除层湍流波动EAST托卡马克实验湍流斑块结构抑制Er×B剪切流增强
首次在EAST超导托卡马克实验中发现,ICRF加热能全局抑制刮削层(SOL)中高强度blob结构,降低湍流波动。其机制或为ICRF增强了SOL中的Er×B剪切流,改变电位剖面,从而抑制湍流输运,提高等离子体约束性能。
05
Animate3D: Animating Any 3D Model with Multi-view Video Diffusion
发表:2024/11/6
多视角视频扩散模型3D模型动画生成4D Score Distillation Sampling时空注意力机制多视角视频数据集
提出Animate3D框架,利用多视角视频扩散模型(MVVDM)和大规模多视角视频数据集,结合重建与四维得分蒸馏采样,实现对任意静态三维模型的高一致性动画生成。设计新型时空注意力模块,强化时空连续性并保持模型身份特征。
07
Training LLM Agents to Empower Humans
发表:2025/10/8
大语言模型微调基于大语言模型的动作规划无训练加速方法强化学习保持先验能力机制
本文提出一种基于最大化人类赋能的LLM微调方法,仅依赖离线文本数据,无需额外人类反馈,实现智能体更有效辅助人类。用户研究及编码环境评测显示,该方法显著提升用户接受度和编码任务成功率,缓解智能体过度独立完成任务的问题。
012
Self-Improving LLM Agents at Test-Time
发表:2025/10/8
大语言模型微调大语言模型强化学习训练大语言模型推理能力增强大语言模型置信度校准自我增强大语言模型
本文提出测试时自改进方法,通过不确定性检测、自我数据增强和测试时微调三步,实现大型语言模型智能体即时强化。TTSI显著提升准确率并大幅降低训练样本需求,TTD进一步优化复杂情境表现,展现了低成本高效自演化智能体新范式。
09
Spinning Straw into Gold: Relabeling LLM Agent Trajectories in Hindsight for Successful Demonstrations
发表:2025/10/8
大语言模型微调序列策略优化大语言模型强化学习训练长时序一致性建模大语言模型推理能力增强
本文提出事后监督学习(HSL)框架,通过辅助LLM重新标记智能体轨迹中的实际达成目标,结合不相关动作掩蔽和样本重加权,提升长时程部分可观环境中LLM智能体的微调效果。实验在ALFWorld和WebShop验证了HSL的高数据效率和兼容性,显著优于传统方法。
03
WebWatcher: Breaking New Frontiers of Vision-Language Deep Research Agent
发表:2025/10/8
多模态大语言模型视觉语言动作模型大语言模型强化学习训练复杂信息检索基准视觉语言推理
WebWatcher提出一种多模态深度研究智能体,结合视觉语言推理能力,通过高质量合成轨迹冷启动训练和强化学习提升泛化性能。提出BrowseCompVL基准测试,验证其在复杂视觉文本信息检索中的领先表现,突破了传统文本中心限制。
01
ATLAS: Actor-Critic Task-Completion with Look-ahead Action Simulation
发表:2025/10/8
基于Actor-Critic的任务完成环境认知地图构建动作前瞻模拟无微调适应性网络WebArena-Lite基准测试
提出了ATLAS,一种结合记忆增强和前瞻动作模拟的ActorCritic智能体,通过构建认知地图并基于环境模型在认知空间中模拟动作后果,实现无微调适应新环境。在WebArenaLite基准中,成功率达63%,显著优于现有方法。
03
RLPIR: Reinforcement Learning with Prefix and Intrinsic Reward
发表:2025/10/8
大语言模型强化学习训练序列策略优化无训练加速方法大语言模型推理能力增强
RLPIR提出一种无需验证器的强化学习框架,通过前缀推演和组内一致性奖励减少训练时长和推理序列长度。在数学与通用基准测试中,达到与依赖真实标注RLVR相当的效果,训练效率提升近7倍,显著优化大型语言模型推理性能。
01
JURY-RL: Votes Propose, Proofs Dispose for Label-Free RLVR
发表:2025/10/8
大语言模型强化学习训练无训练加速方法强化学习数学推理序列策略优化
JURYRL提出一种无标签可验证奖励强化学习框架,通过模型投票生成答案候选,由Lean定理证明器验证并决定奖励,结合ResZero机制处理不可验证情况,避免虚假共识,提升训练稳定性和推理性能,在数学推理和代码生成等任务上优于无标签基线,媲美甚至超越监督训练。
03