论文

登录后可查看剩余解析次数。
标签筛选
Leveraging LLMs for Collaborative Ontology Engineering in Parkinson Disease Monitoring and Alerting
发表:2025/12/16
大语言模型在本体工程中的应用帕金森病监测与警报本体人机协作本体构建一键提示与连锁思维提示技术X-HCOME与SimX-HCOME+方法论
本文探讨了利用大型语言模型(LLMs)构建帕金森病监测与警报本体的四种方法,包括一次性提示和思维链提示。结果表明,尽管LLMs能自主生成本体,但效果不佳;采用XHCOME与SimXHCOME的混合方法则通过人机协作显著提升本体的完整性与准确性,强调了人LLM协作在复杂领域的应用潜力。
02
HiMaCon: Discovering Hierarchical Manipulation Concepts from Unlabeled Multi-Modal Data
发表:2025/10/13
无监督层次操控概念学习多模态数据关联分析跨模态感知网络机器人操作策略优化层次时间抽象建模
本文提出HiMaCon框架,通过自监督学习从无标注的多模态机器人演示中发现分层操控概念。方法结合跨模态相关网络和多时域未来预测器,有效捕捉不同场景中的感知运动关系,显著提升模仿学习策略在新环境中的泛化能力。
02
VGGT4D: Mining Motion Cues in Visual Geometry Transformers for 4D Scene Reconstruction
发表:2025/11/25
4D场景重建动态对象分割VGGT基础模型全局动态线索挖掘训练无关优化方法
本文提出了VGGT4D,一个无需训练的新框架,用于动态4D场景重建。通过挖掘VGGT内部全局注意力层编码的动态线索,采用Gram相似度和投影梯度策略生成掩码,成功解耦静态背景和动态物体,提升了姿态估计和几何重建精度,实验表明在多个数据集上表现优异。
03
The Surprising Effectiveness of Negative Reinforcement in LLM Reasoning
发表:2025/6/2
大语言模型强化学习训练负强化学习机制数学推理数据集正负样本强化学习推理能力提升策略
本文探讨了具有可验证奖励的强化学习(RLVR)的机制,将学习信号分解为正样本强化(PSR)和负样本强化(NSR)。研究发现,仅通过负样本训练模型,显著提升了多样性和推理能力,超越了传统的PPO和GRPO算法。基于此,提出了WeightedREINFORCE算法,有效提升数学推理任务的表现。
011
On the Interplay of Pre-Training, Mid-Training, and RL on Reasoning Language Models
发表:2025/12/9
大语言模型强化学习训练大语言模型推理能力增强序列策略优化长上下文建模强化学习数学推理
本文研究强化学习(RL)是否真正扩展了语言模型的推理能力,提出一个透明的合成推理框架,分析预训练、中期训练和RL的因果贡献。主要发现包括:RL仅在模型能力边缘时有效提升能力,且仅需1%的预训练种子数据即可实现跨场景迁移,而中期训练显著优于纯RL,并有效降低奖励作弊。
04
RELIC: Interactive Video World Model with Long-Horizon Memory
发表:2025/12/4
交互式世界模型长时序记忆自回归视频生成实时内容检索视频扩散蒸馏
论文提出了RELIC,一个统一的交互式视频世界模型,能同时解决实时长时程生成、一致的空间记忆和精确的用户控制三大挑战。它通过压缩的历史潜在词元编码相对动作和相机位姿,支持高效的三维一致内容检索,以实现长期连贯性。
03
新课标理念下基于UbD理论的小学数学单元整体教学设计研究——以“综合与实践”为例
UbD理论在小学数学教学中的应用小学数学综合与实践单元设计逆向设计教学策略多元理解性探究小学数学教学质量提升
本文分析了基于UbD理论的小学数学“综合与实践”单元整体教学设计,强调其整体性与逆向设计的特点,提出教师应以学情为基础,科学设计学习活动并重视评价,以提高教学质量。研究结果显示UbD理论与新课标理念具有高度契合性。
02
UbD理论下小学数学综合与实践教学设计探究——以“节约用水”课程为例
UbD逆向教学设计小学生数学综合教学实践教学设计多学科融合学习节约用水课程
本文探讨了如何在小学数学综合与实践模块中应用UbD理论,提高教学质量。通过合理设计评估,整合多学科学习和真实情境,利用信息技术,促进学生从接受性学习转向理解性学习,提升知识迁移与应用能力。
02
UniTok: A Unified Tokenizer for Visual Generation and Understanding
发表:2025/2/28
统一 tokenizer视觉生成与理解多代码簿量化机制VQVAE与CLIP结合视觉语言模型
本文提出了UniTok,一个统一的视觉生成和理解分词器,利用新颖的多码本量化机制解决了VQVAE和CLIP训练目标结合中的损失冲突问题。UniTok在ImageNet上实现了0.38的rFID和78.6%的零样本准确率,且能够无缝集成至多模态大语言模型,显著提升生成和理解性能。
02
RICL: Adding In-Context Adaptability to Pre-Trained Vision-Language-Action Models
发表:2025/8/4
视觉语言动作模型的上下文适应性无参数微调的新任务学习机器人示范数据集上下文学习注入多任务机器人操作
本文提出RICL框架,通过特定微调方案为预训练视觉语言动作(VLA)模型注入上下文自适应能力,允许用户仅用1020个演示任务提升模型性能,而不需进行参数微调,显著降低了用户的使用门槛。
02
Neural Machine Translation by Jointly Learning to Align and Translate
发表:2014/9/2
神经机器翻译编码器-解码器模型软对齐方法英语到法语翻译机器翻译性能优化
本论文提出了一种新颖的神经机器翻译方法,结合对齐与翻译的过程,通过扩展编码器解码器架构,允许模型自动软对齐源句的相关部分,从而提升翻译性能。在英法翻译任务中,该方法达到了与当时最先进的翻译系统相当的效果。
02
SkyNet: Analyzing Alert Flooding from Severe Network Failures in Large Cloud Infrastructures
发表:2025/8/27
大规模云基础设施故障分析警报洪水检测网络故障管理云计算安全性评估高可用性网络设计
本文提出了SkyNet系统,针对大型云基础设施中因严重网络故障引发的警报洪泛问题,通过整合多监控数据源并使用统一输入格式,显著提高了监控的全面性。该系统能有效分组警报、评估严重性与过滤无关警报,降低了网络故障的平均缓解时间,运行一年半未出现假阴性。
03
CameraCtrl II: Dynamic Scene Exploration via Camera-controlled Video Diffusion Models
发表:2025/3/14
摄像机控制的视频扩散模型动态场景探索动态内容生成广角视点生成视频生成数据集构建
本文提出了CameraCtrl II框架,利用相机控制的视频扩散模型实现大规模动态场景探索。该模型克服了以往视频动态性减弱和视角限制的问题,通过增强单个视频片段的动态内容和允许用户自定义相机轨迹,显著扩展了场景探索范围。
02
The Effect of TiO2 Addition on Low-temperature Sintering Behaviors in a SnO2-CoO-CuO System
发表:2024/4/30
低温烧结行为TiO2添加对SnO2的影响SnO2基材料气体传感器应用晶界扩散机制
本研究探讨了通过添加二氧化钛(TiO2)在低温(950°C)下实现二氧化锡(SnO2)钴氧化物(CoO)铜氧化物(CuO)系统的有效烧结。TiO2的添加显著改善了样品的致密化行为,主要的传质机制为晶界扩散。这一方法可为气体传感器材料提供合适的多孔微观结构与机械强度。
02
The Effect of Sm2O3 on the Sintering and Grain Growth Behaviors of SnO2-Based Ceramics
发表:2019/6/1
掺铈氧化物对SnO2陶瓷烧结的影响SnO2基陶瓷微观结构研究SnO2陶瓷的晶粒生长行为共沉淀法制备SnO2陶瓷铈掺杂对陶瓷特性的影响
本文研究了氧化钐(Sm2O3)对掺钴和掺铌的SnO2基陶瓷的烧结、微观结构与晶粒生长行为的影响。研究表明,Sm2O3的掺杂显著抑制了晶粒在烧结最后阶段的过度生长,使平均晶粒尺寸从2.70μm降至0.887μm,主要归因于其在晶界处的偏析作用。
02
Densification of 0·99SnO2–0·01CuO Mixture: Evidence for Liquid Phase Sintering
液相烧结机制铅锡氧化物混合物高密度材料制造烧结温度与时间优化铜离子电气行为
本研究探讨了 0.99extSnO20.01extCuO0.99 ext{SnO}2 0.01 ext{CuO} 混合物在 1150ext°C1150^{ ext{°C}} 空气中烧结的行为,观察到高达 98.7%98.7\% 的致密化。结果显示,液相烧结机制是主要的致密化途径,铜离子的溶解与材料电学特性相符,靠近间隙位置。
02
CameraCtrl: Enabling Camera Control for Text-to-Video Generation
发表:2024/4/3
视频生成控制摄像机轨迹参数化扩散模型摄像机控制文本到视频生成可控视频生成
本文介绍了CameraCtrl,一种实现视频生成中相机姿态精确控制的方法。通过有效的相机轨迹参数化和即插即用的控制模块,CameraCtrl能够在不影响基础模型其他模块的情况下,增强用户对视频生成的可控性与创意表达。实验结果表明,其有效性显著提升了生成视频的叙事能力。
02
Color image information transmission in plasma sheath turbulence based on orbital angular momentum mode
发表:2025/4/29
等离子体罩湍流中的彩色图像传输轨道角动量模式高斯涡旋光束自由空间光通信信噪比与误比特率分析
本研究通过数值模拟探讨了在等离子体鞘层湍流中,利用高斯涡旋光束的轨道角动量模式进行彩色图像传输的特性。分析了折射率波动方差、外尺度和各向异性参数对图像质量的影响,结果显示在不同湍流条件下,图像传输的峰值信噪比逐渐降低,而误比特率有所增加,验证了提出的编码解码方案的可行性。
02
Robust transmission of pin-like vortex beams in plasma sheath turbulence
发表:2025/7/25
光束传输特性等离子体鞘层湍流针状涡旋光束拉盖尔–高斯光束比特错误率
本研究采用随机相位屏法探讨针状涡旋光束(PLVBs)在等离子体鞘层湍流中的传播特性。结果显示,PLVBs在传播距离为0.1至0.4m时,与传统拉盖尔高斯光束相比,检测概率提高9%至12.5%,误比特率降低0.03至0.067,且信道容量更强,证明其在湍流中具有优越的鲁棒性,对光学通信具有潜力。
023
What Is That Talk About? A Video-to-Text Summarization Dataset for Scientific Presentations
发表:2025/2/12
视频到文本摘要数据集多模态学习科学演示视频AI会议记录提取摘要生成质量评估
本文提出了针对科学演讲的视频到文本摘要数据集,包含18,599个AI会议演讲视频及其论文摘要。研究基准测试了最先进的大型多模态模型,应用了计划式框架以提高摘要质量和事实一致性。尽管有进展,模型与人类表现之间仍有显著差距,强调了该数据集的挑战性和平滑未来研究的潜力。
02