论文
登录后可查看剩余解析次数。
标签筛选
ImageNet 数据集
Self-Supervised Learning from Images with a Joint-Embedding Predictive Architecture
发表:2023/1/20
图像自监督学习图像联合嵌入预测架构视觉 TransformerImageNet 数据集语义图像表示
本文提出了一种新的自监督学习模型——图像基础联合嵌入预测架构(IJEPA),通过从单一上下文块预测同一图像中多个目标块的表征,实现高效的表征学习。IJEPA无需手工数据增强,借助一个特定的遮蔽策略显著提升了在ImageNet上的表现,展现出极佳的计算效率和广泛的适用性。
02
Q-DiT: Accurate Post-Training Quantization for Diffusion Transformers
发表:2024/6/25
扩散模型量化后训练量化视觉 transformer动态激活量化ImageNet 数据集
本文提出了一种新方法QDiT,用于精确量化Diffusion Transformers(DiTs),针对其在权重和激活中的空间及时间方差问题。通过自动量化粒度分配和样本级动态激活量化,QDiT显著降低模型计算成本,同时在ImageNet上实现了高保真度的图像和视频生成,建立了新基准。
03