标签筛选：模型驱动强化学习 - 论文列表

登录后可查看剩余解析次数。

分析完成后邮件通知提交成功后加入收藏夹不公开给未提交本论文的用户（仍保存为个人默认精读）

模型驱动强化学习

100K视频语义对照数据集

18岁以上成人精神健康

2D高斯表面元表示

360°全景图像处理

3D Gaussian Splatting 表示

3D-aware transformer结构

3D内容生成模型

3D几何与材质生成

3D分布评分蒸馏

3D占用空间世界模型

3D变分自编码器

3D因果变分自编码器

3D基础模型对齐

3D开放世界任务执行

3D形状变分自编码器

3D形状快速生成

3D形状神经场表示

3D手势估计与物理模拟

3D数据合成管线

3D模型动画生成

3D生成模型训练流程

3D资产构建方法

3D重建伪训练视图净化

3D高斯插值渲染

4-UPU+2-P 串并混联机构

4-bit NormalFloat 量化

4D Gaussian Splatting 表示

4D Score Distillation Sampling

4D感知视觉表示

5G网络服务与应用

5G车联网安全与隐私

65纳米布局设计

6G边缘计算资源调度

6自由度姿态估计

6自由度控制的对称性分析

AIOpsLab与ITBench基准测试

AI中的形式推理

AI伦理设计原则

AI增强学习模型

AI对学习影响的类型

AI模型训练故障诊断系统

AI辅助学习效果评估

AI辅助药物设计

ARC-AGI数据集评测

Agent Workflow Memory

Agentic RAG架构综述

Amazon评论情感分类

Apache Traffic Server 实现

Attention-Sink-Free 设计

Autoregressive矢量图序列建模

BAIR 机器人数据集

BDD100K 数据集应用

BERT与GPT-2模型扩展

BERT与视觉transformer优化

BGP路由异常检测

BLIP-2预训练策略

BaZi人物模拟基准

BatmanNet 图形变换自编码器

Bayer 图像上采样

Bibliometrix 统计分析方法

Bradley-Terry模型理论基础

CKKS同态加密乘法优化

CLIP多语言词表扩展

CLIP模型在动作生成中的应用

CNN与Transformer互补网络

COCO目标检测与分割

COLMAP-free 相机姿态估计

COVID-19对学生幸福感的影响

CRISPR/Cas9细胞谱系追踪

CUDA执行速度提升

CUDA深度神经网络基准

Chain-of-Frame推理

Chain-of-Tool-Thought 方法

ChatGPT-4在学校心理咨询中的应用

ChatGPT使用量表开发与验证

ChatGPT在推荐系统中的应用

ChatGPT在精神健康中的应用

ChemDisGene与CDR数据集评测

Click-Through Rate 预测

C到Rust代码迁移

DP-means聚类算法扩展

DPPH自由基捕获活性

DSLR图像质量提升

DenseNet121在医学图像分析中的应用

DiT模型在图像生成中的应用

Diffusion Transformer

Diffusion Transformers

Diffusion Transformer优化

Diffusion 模型 KV 缓存优化

Diffusion 模型微调

Diffusion模型微调

Dilated Refinement Attention Module

Dirichlet过程混合模型

DrawBench基准测试

Drivelology语言现象研究

Dual-LoRA微调方法

E-commerce平台推荐

EAST托卡马克实验

EXPRESS-Bench 数据集

Early Fault Tolerance 阶段量子算法

Early-Stopping Guided Fine-tuning

Ego-R1 视频问答数据集

EgoSchema与NExT-QA基准

Embodied Visual Tracking Benchmark (EVT-Bench)

Embodied视觉追踪

Er×B剪切流增强

Eventful Transformers 模型

FaaS工作负载优化

FaceInstruct-1M 数据集

Fine-EQA 混合探索模型

Flow Matching 方法

Frankencerts生成方法

Fresnel数判定光传播模式

GBC-100K 行为计划数据集

GPT-2与TinyLLAMA实验

GPT-2架构推荐模型

GPT与程序分析结合

GPT风格因果建模

GPU 高效利用策略

GPU优化推荐系统

GPU加速家庭助手基准

GPU友好页面缓存

GPU实时性能观测

GPU文件系统接口

GPU资源使用建模

GPU通信带宽增强

Group Relative Policy Optimization

G蛋白偶联受体功能研究

H* Bench基准测试

HGEMM CUDA内核自动优化

Helmholtz方程求解

Humanoid-Gym强化学习框架

IFEval-Audio评估数据集

INT8权重激活量化

INT8混合精度训练

ImageNet 256×256 生成

ImageNet 单机训练

ImageNet100 数据集

ImageNet1K 数据集

ImageNet数据集评估

InstructS2S-200K 数据集

Isaac Gym与Mujoco仿真集成

Item-ID 表示学习

Jina-VDR检索基准

KVCache中心调度策略

Kimi Delta Attention模块

Kinetics-600基准测试

Kolmogorov-Smirnov检验

Kronecker积矩阵优化

K均值聚类在教育中的应用

LGBTQ+ 青少年心理健康干预

LGBT群体心理健康需求

LLM性能自动评估指标

LLM推理轨迹优化

LLM驱动的评估指标设计

LLM高阶协作知识捕获

LLaMA 模型服务评估

LLaMA-3-70B模型评估

LLaMA-Omni 语音模型架构

LMM推理系统设计

LRU缓存机制建模

Latent Diffusion模型

LiDAR数据结构化感知

LibriSpeech基准测试

LibriSpeech数据集

Lie代数标准化方法

LightGBM算法在苦味肽识别中的应用

Lipschitz约束政策

Logistic回归分类器

Lyapunov稳定性准则

MATLAB/Simulink模拟实验

MITgcm LLC4320模拟数据

MME-CoF基准数据集

MS COCO数据集评测

ManiSkill基准测试

Margin Disparity Discrepancy 界

Masked Diffusion Models

Masked Vector-Quantized Tokenizer

MeViS挑战赛解决方案

Memory-Augmented Planning

MiniWoB++ 任务评估

Mixture-of-Experts 强化学习

Mixture-of-Experts 推理加速

Mixture-of-Experts 模型分析

Mixture-of-Experts视觉编码器

Mixture-of-Experts路由

Mixture-of-Transformers专家体系结构

ModRWKV多模态框架

Model Context Protocol (MCP)

Multi-Task Attention Network (MTAN)

NISQ 器件量子电路评估

NLP 任务性能提升

NTIRE 2025 挑战赛

Neumann级数神经算子

Next-K生成式推荐策略

OCR高压缩率解码

Objaverse-XL 数据集

Objectron基准测试