Compact and Wide-FOV True-3D VR Enabled by a Light Field Display Engine with a Telecentric Path
TL;DR 精炼摘要
本文提出一种基于光场显示引擎的真3D虚拟现实显示系统,通过生成具有计算焦距线索的中间图像,实现高分辨率显示。引入远心光学路径有效缓解了像差造成的视场减小问题,实验结果表明,该系统可生成清晰的3D图像并实现超过60度的宽视场。
摘要
This paper presents a true-3D VR display using a light field display (LFD) engine that generates intermediate images with computational focus cues. A field-sequential-color micro-LCD provides high resolution. The aberration-induced FOV reduction in LFDs is mitigated by a telecentric optical path. Experiments demonstrate clear 3D images with a FOV of over 60 degrees.
思维导图
论文精读
中文精读
1. 论文基本信息
1.1. 标题
Compact and Wide-FOV True-3D VR Enabled by a Light Field Display Engine with a Telecentric Path (采用带远心光路的光场显示引擎实现紧凑型宽视场真3D VR)
1.2. 作者
Qimeng Wang, Yi Liu, Xinni Xie, Yaya Huang, Hao Huang, Hanlin Hou, and Zong Qin 隶属于中山大学 (Sun Yat-Sen University) 电子与信息技术学院。
1.3. 发表期刊/会议
该论文发表于一个学术会议或研讨会,具体信息如DOI或出版商名称未在摘要中明确给出,但根据其内容,应属于光学、显示技术或虚拟现实相关领域。
1.4. 发表年份
2024年
1.5. 摘要
本文提出了一种利用光场显示 (Light Field Display, LFD) 引擎实现真3D虚拟现实 (Virtual Reality, VR) 显示的方案。该LFD引擎能够生成具有计算焦距线索 (computational focus cues) 的中间图像。通过采用场序彩色微型LCD (field-sequential-color micro-LCD, FSC-LCD),系统实现了高分辨率显示。为了缓解LFD中由像差引起的视场 (Field of View, FOV) 减小问题,论文引入了远心光学路径 (telecentric optical path)。实验结果表明,该系统能够生成清晰的3D图像,并实现了超过60度的宽视场。
1.6. 原文链接
/files/papers/693e2cf4a078743fa50a04b5/paper.pdf (此链接为PDF文件路径,表明论文已发布)
2. 整体概括
2.1. 研究背景与动机
虚拟现实 (VR) 显示技术在教育、游戏和医疗保健等领域展现出巨大的潜力。当前主流的VR头显通常采用Pancake光学方案,通过折叠光路实现紧凑轻量化设计,并支持大视场 (FOV),这对于提供沉浸式VR体验至关重要。
然而,现有的Pancake VR头显大多只能支持固定虚拟图像距离,这会导致辐辏-调节冲突 (Vergence-Accommodation Conflict, VAC)。VAC是人眼在观察近距离3D物体时,眼睛的辐辏(双眼聚焦到同一物体)和调节(晶状体改变焦距以使物体在视网膜上成像清晰)机制不匹配的现象。这种不匹配会引起眼睛疲劳、眩晕,并影响3D感知的真实性,因此无法满足真3D显示的需求。
为了解决VAC问题,业界尝试了多种方案:
- 机械移动透镜: 这种方法复杂、响应速度慢,且不支持场景中多个焦平面的显示。
- 插入变焦元件: 例如液晶透镜 (LC lens),虽然可以调整屈光度,但无法呈现真正的3D场景,并且会增加系统的复杂性。
- Maxwellian View显示: 这种方法通过将图像直接投射到视网膜上来确保图像始终清晰,但其对固定瞳孔位置的依赖极大地限制了眼盒 (eyebox) 大小。
- 全息显示: 能够记录和再现波前以恢复相位信息,但通常需要相干光源,这与近眼显示器对紧凑性的要求相矛盾。尽管近期有结合AI驱动数字全息和超表面波导的突破,但仍需要更经济的VAC-free VR解决方案。
- 传统光场显示 (LFD): LFD通过微透镜阵列 (Microlens Array, MLA) 和微显示器生成计算焦距线索,硬件可行且体积小。但直接用LFD作为近眼显示器会面临以下问题:
-
分辨率急剧下降: 短焦距MLA会显著放大像素,导致视觉分辨率降低。
-
视场受限: MLA的像差 (aberration) 严重限制了视场。
本文的切入点是结合Pancake光学方案与光场显示技术,旨在构建一个既紧凑、具有宽视场,又能解决VAC问题的真3D VR显示系统。
-
2.2. 核心贡献/主要发现
本文的核心贡献在于提出了一种利用光场显示 (LFD) 引擎实现VAC-free Pancake VR头显的方案,并有效解决了传统LFD作为近眼显示器时面临的分辨率和视场问题。
主要发现和贡献如下:
- VAC-free Pancake VR头显设计: 首次提出了将LFD作为图像引擎与Pancake光学模块结合,实现能够提供计算可变深度中间图像,并通过Pancake模块生成多虚拟图像深度以实现真3D显示的VR头显。
- 高分辨率显示方案: 采用2.1英寸、2.3K×2.3K分辨率的场序彩色微型LCD (field-sequential-color micro-LCD, FSC-LCD)。FSC-LCD通过移除传统LCD的彩色滤光片阵列,利用迷你LED RGB背光和人眼视觉暂留效应,实现三倍于传统子像素LCD的分辨率,并显著提高了光学效率,弥补了Pancake光学的效率损失。
- 宽视场实现: 创新性地在LFD引擎中引入了远心光学路径 (telecentric optical path)。通过将孔径光阑 (aperture stop) 放置在Pancake透镜模块的像方焦点,确保主光线垂直于LFD引擎的物体平面,使得所有微透镜在近似近轴光线条件下工作,有效抑制了MLA在大视场下引入的像差,从而实现了宽视场显示。
- 图像质量匹配优化: 详细分析了Pancake模块在不同虚拟图像距离下的调制传递函数 (Modulation Transfer Function, MTF) 变化,以及LFD引擎在不同重建深度平面 (Reconstructed Depth Plane, RDP) 下的图像质量变化。通过将LFD引擎的中心深度平面 (Central Depth Plane, CDP) 有意放置在Pancake模块的一个相对较差的物体平面上,实现了两者的图像质量平衡匹配,以获得跨多个深度平面的最佳综合图像质量。
- 原型验证与性能评估: 构建了原型机,并实验验证了系统能够清晰地显示具有不同深度的物体,成功实现了计算可调的虚拟图像距离,证实了真3D显示功能。测量结果显示,该原型机实现了68.6度的宽视场,显著优于单独使用LFD引擎。
3. 预备知识与相关工作
3.1. 基础概念
3.1.1. 虚拟现实 (Virtual Reality, VR)
概念定义: 虚拟现实是一种可以创建和体验虚拟世界的计算机仿真系统。它利用计算机生成一个模拟环境,使用户沉浸其中,并通过各种交互设备(如头戴式显示器、手柄等)与虚拟环境进行实时交互。用户在VR环境中感受到的是三维空间的深度、距离和方向,如同身临其境。 目的: VR技术旨在为用户提供高度沉浸式的体验,广泛应用于游戏、教育、医疗、工程设计和军事训练等领域。
3.1.2. 辐辏-调节冲突 (Vergence-Accommodation Conflict, VAC)
概念定义: VAC是VR和AR显示中一个核心问题,指的是人眼在观察虚拟3D图像时,眼睛的辐辏 (Vergence) 和调节 (Accommodation) 机制之间出现的不匹配。
- 辐辏: 双眼转动以使视线交汇于观察物体上,从而判断物体距离的过程。
- 调节: 眼睛晶状体改变形状以调整焦距,使物体在视网膜上清晰成像的过程。 在真实世界中,辐辏距离和调节距离通常是一致的。然而,在大多数传统VR显示中,图像通常显示在一个固定距离的2D平面上,即使内容呈现出3D深度信息,人眼也总是聚焦在显示面板的物理距离上(即调节距离固定),而辐辏距离则根据虚拟物体的深度信息而变化。这种固定的调节距离与变化的辐辏距离之间的不一致,导致了VAC。 影响: VAC会引起眼睛疲劳、不适、视觉模糊、眩晕,并削弱3D感知的真实性。
3.1.3. Pancake 光学 (Pancake Optics)
概念定义: Pancake光学是一种为VR头显设计的光学系统,它通过折叠光路实现紧凑型和轻量化设计。其工作原理通常涉及偏振片、四分之一波片 (Quarter-Wave Plate, QWP) 和半反射镜等光学元件,使光线在透镜模组内部多次反射,从而在物理尺寸较小的情况下实现较长的有效焦距和宽视场。 优势: 紧凑、轻量、大视场。 劣势: 传统Pancake光学通常只能提供固定虚拟图像距离,导致VAC。光路中多次反射和偏振光的操作会带来一定的光效率损失。
3.1.4. 光场显示 (Light Field Display, LFD)
概念定义: 光场显示是一种能够再现光线方向和强度信息(即光场)的显示技术,从而实现真3D显示,无需佩戴特殊眼镜。它通常通过结合微显示器(Microdisplay)和微透镜阵列 (Microlens Array, MLA) 来工作。每个微透镜下方的一组像素(即元素图像)控制通过该微透镜的光线的方向。通过精心设计的元素图像阵列 (Elemental Image Array, EIA),LFD可以在空间中生成具有真实深度和视点依赖性的3D图像,提供计算焦距线索 (computational focus cues)。 优势: 提供真3D显示,解决VAC,无需眼镜。 劣势:
- 分辨率损失: 由于像素需要编码空间和角度信息,导致显示分辨率低于同等物理像素数量的传统2D显示器。
- 视场限制: 微透镜阵列在大视场下容易产生像差,限制了显示系统的视场。
- 计算复杂性: 元素图像阵列的生成需要复杂的图像渲染算法。
3.1.5. 远心光路 (Telecentric Optical Path)
概念定义: 远心光路是一种特殊的光学设计,其特点是主光线 (chief rays) 与光轴平行。根据远心光路的作用位置,可以分为物方远心 (Object-Space Telecentric)、像方远心 (Image-Space Telecentric) 和双远心 (Bi-Telecentric)。
- 物方远心: 物方主光线平行于光轴,这意味着物体的放大倍率不随物体距离变化,消除透视误差。
- 像方远心: 像方主光线平行于光轴,这意味着图像尺寸不随像面距离变化,消除聚焦误差。
- 双远心: 物方和像方主光线都平行于光轴。 在本文中的作用 (物方远心): 对于LFD而言,当其作为近眼显示器时,如果光线以大角度(斜射光线)通过微透镜阵列,会导致严重的像差,从而限制视场。物方远心光路通过确保来自物体(在这里是LFD引擎生成的中间图像)的主光线垂直于物体平面,即平行于光轴进入MLA,从而使MLA在接近近轴光线 (paraxial rays) 的条件下工作。这极大地减少了斜射光线引起的像差,从而扩展了系统的视场。
3.1.6. 场序彩色微型LCD (Field-Sequential-Color Micro-LCD, FSC-LCD)
概念定义: FSC-LCD是一种高分辨率的显示技术,通过在时间上序列显示红、绿、蓝(RGB)三种基色图像,并结合人眼视觉暂留效应来呈现全彩色图像,而不是像传统LCD那样在空间上使用子像素 (subpixel) 排列和彩色滤光片 (color filter array)。 工作原理: FSC-LCD移除了传统的彩色滤光片阵列,显示面板本身只显示灰度图像。全彩色是通过快速切换背光颜色(例如,使用迷你LED RGB背光)并同步显示对应颜色的灰度图像来实现的。例如,先显示红色内容,然后是绿色内容,最后是蓝色内容,这三个“亚帧 (subframes)”在极短时间内快速切换,人眼会将其融合为一张全彩色图像。 优势:
- 分辨率提升: 由于不再需要为每个颜色设置单独的子像素,单个像素可以用于显示任意颜色,从而在相同物理尺寸下实现三倍于传统LCD的有效分辨率。
- 光学效率高: 消除了彩色滤光片阵列带来的光吸收损耗,显著提高了光线通过显示面板的效率。 挑战: 需要极高的刷新率来避免色分现象 (color breakup),即人眼在快速移动或扫视时看到彩色图像分离成红、绿、蓝分量。
3.1.7. 调制传递函数 (Modulation Transfer Function, MTF)
概念定义: MTF是衡量光学系统(包括显示器)传递对比度能力的一个关键指标,用于评估图像质量。它描述了光学系统在不同空间频率下(即不同精细度图案下)再现物体对比度的能力。 解释:
- 空间频率 (Spatial Frequency): 指图像中细节的精细程度,通常以每毫米线对数 (lp/mm) 或每度像素数 (pixels per degree, PPD) 表示。高空间频率对应精细的细节,低空间频率对应粗大的结构。
- 对比度 (Contrast): 图像中亮暗区域的差异。 MTF曲线通常表示为对比度再现率(通常归一化到1)随空间频率变化的函数。MTF值越高,表示系统在特定空间频率下再现细节的能力越强,图像越清晰。当MTF为0时,表示系统无法分辨该空间频率下的细节。 在本文中的应用: 本文使用MTF来评估Pancake模块在不同虚拟图像距离下以及LFD引擎在不同重建深度平面下的图像质量。通过比较MTF曲线,可以了解系统在不同深度下图像细节的再现能力。
3.2. 前人工作
- Pancake光学在VR中的应用:Pancake光学是当前VR头显的主流方案,通过折叠光路实现紧凑轻量化设计,并支持大视场 [1]。然而,其主要局限性在于通常只支持固定虚拟图像距离,导致VAC。
- 解决VAC的尝试:
- 机械移动透镜:通过机械方式调整透镜位置来改变焦距,实现深度可变。但这种方法复杂,响应速度慢,且不支持多个焦平面 [2]。
- 插入变焦元件:如液晶透镜 (LC lens),可以调整屈光度,但无法呈现真正的3D场景,且增加了复杂性 [2]。
- Maxwellian View显示:通过将图像直接投射到视网膜,确保图像始终清晰,但对瞳孔位置敏感,眼盒小 [3]。
- 全息显示:通过再现光波前实现真3D显示,但需要相干光源,光学系统复杂,难以满足近眼显示器的紧凑性要求。近期研究有利用AI驱动数字全息和超表面波导实现AR眼镜的突破 [4]。
- 光场显示 (LFD) 在近眼显示中的挑战:LFD通过MLA和微显示器生成计算焦距线索,硬件可行且体积小 [5]。但直接作为近眼显示器存在以下问题:
- 分辨率下降:短焦MLA会显著放大像素,导致视觉分辨率下降 [6]。
- 视场限制:MLA的像差导致视场受限 [7]。
- LFD视场扩展方案:Hua et al. 提出结合自由曲面棱镜和可调透镜来扩展LFD的视场 [8],但这种方案可能导致比Pancake更庞大的体积。
- LFD分辨率增强技术:包括机械抖动微显示器或MLA [9],以及作者团队之前提出的光学超分辨率方法 [6],但都有其局限性。
- 场序彩色 (FSC) 显示技术:通过时间复用方式显示红绿蓝三色,替代空间上的彩色滤光片,从而提高分辨率和光学效率。作者团队在FSC微型LCD技术及抑制色分现象方面已有研究 [10, 11]。
- LFD图像形成模型和渲染:作者团队在LFD的图像形成建模分析 [12] 和加速渲染方法 [13] 方面也有相关工作。
3.3. 技术演进
VR显示技术从最初的固定焦距2D-in-3D显示,逐渐向追求真3D、解决VAC的方向演进。Pancake光学代表了紧凑型、大视场VR头显的主流趋势,但其固定焦距的限制催生了对深度可变显示的需求。光场显示作为一种能够提供计算焦距线索的真3D技术,被认为是解决VAC的有效途径。然而,LFD自身在分辨率和视场方面的局限性阻碍了其直接应用于近眼显示。为了克服这些挑战,研究者们探索了各种分辨率增强(如FSC-LCD)和视场扩展(如自由曲面光学、远心光路)的技术。本文的工作正是在这一技术演进背景下,将FSC-LCD带来的高分辨率和Pancake光学提供的远心光路设计相结合,旨在解决LFD在近眼显示中的关键瓶颈,实现兼具紧凑、宽视场和真3D特性的VR体验。
3.4. 差异化分析
本文的方法与相关工作中的主要方法相比,核心区别和创新点在于:
- 结合LFD与Pancake光学: 现有Pancake方案受限于固定虚拟图像距离,而LFD直接作为近眼显示器则存在分辨率和视场限制。本文首次提出将LFD作为图像引擎与Pancake模块结合,利用LFD提供多深度信息,再通过Pancake模块实现紧凑、大视场。
- 利用Pancake的远心光路特性解决LFD视场问题: 传统的LFD视场受限于MLA的像差。本文发现并利用了现代Pancake光学通常采用的物方远心光路特性。这种设计使得光线以近乎垂直的角度进入MLA,极大地抑制了MLA在大视场下的像差,从而实现了LFD引擎的宽视场。这与Hua et al. [8] 使用自由曲面棱镜和可调透镜来扩展视场的方法不同,本文利用了Pancake自身的光学特性,可能在体积控制上更具优势。
- FSC微型LCD提供高分辨率和高效率: 针对LFD固有的分辨率损失问题,本文采用了高分辨率的FSC微型LCD [10]。FSC-LCD通过去除彩色滤光片实现三倍分辨率提升和更高的光学效率,这对于弥补Pancake光学的光效率损失尤为重要。这比传统的机械抖动或光学超分辨率方法 [6, 9] 更能提供原生的分辨率优势。
- LFD与Pancake的图像质量匹配优化: 本文不仅简单地将两者结合,还考虑了LFD和Pancake模块在不同深度下的图像质量变化,并通过有意的匹配配置(LFD的中心深度平面与Pancake的特定物体平面匹配)来优化整体系统的图像质量平衡,以在多个深度平面上提供更好的视觉体验。
4. 方法论
本文提出了一种VAC-free Pancake VR头显,其核心思想是利用光场显示 (LFD) 引擎生成具有计算焦距线索 (computational focus cues) 的中间图像,然后由Pancake模块进行中继,从而实现多虚拟图像深度和真3D显示。
4.1. 微显示面板
LFD的一个固有挑战是分辨率的牺牲,因为显示面板上的像素需要同时编码角度和空间信息。为了解决这一问题,论文采用了高分辨率的微显示面板。
4.1.1. 场序彩色微型LCD (FSC-LCD)
论文选择了一款2.1英寸、2.3K×2.3K分辨率的场序彩色微型LCD (FSC-LCD) [10],如下图Figure 4(a) 所示。FSC-LCD相对于传统子像素 (subpixel-based) LCD的优势在于其分辨率和光学效率的提升。

该图像是图表,展示了2.1英寸FSC微型LCD的细节(图4(a))以及子像素LCD(图4(b))和FSC-LCD(图4(c))的工作原理,分析了其在空间和时间上对人眼信息处理的影响。
Fig.4. (a) The 2.1-inch FSC micro-LCD. (b) Subpixelbased LCD and (c) FSC-LCD.
- 传统子像素LCD的工作原理 (Figure 4(b)): 每个像素点由红 (R)、绿 (G)、蓝 (B) 三个独立的子像素组成,每个子像素都有自己的彩色滤光片。要显示一个全彩色像素,需要三个子像素各自发出对应颜色的光,并通过调整亮度来混合颜色。这种方式下,每个颜色通道的有效分辨率仅为总分辨率的三分之一。
- FSC-LCD的工作原理 (Figure 4(c)): FSC-LCD移除了彩色滤光片阵列。它通过一个迷你LED RGB背光,在极短的时间内快速切换红、绿、蓝三种颜色的背光。显示面板同步显示对应颜色的灰度图像。由于人眼的视觉暂留效应,用户会将这些快速切换的单色图像融合为全彩色图像。
- 分辨率优势: 移除彩色滤光片意味着每个物理像素都可以用于显示任何一种颜色,从而实现了三倍于传统LCD的有效分辨率。对于2.3K×2.3K的面板,这意味着每个颜色通道都能达到2.3K×2.3K的独立分辨率。
- 光学效率优势: 消除了彩色滤光片阵列带来的光吸收损耗,显著提高了光线通过显示面板的效率。这对于本身光效率较低的Pancake光学系统而言尤其有益。
- 挑战与解决方案: FSC-LCD的主要挑战是色分现象 (color breakup)。作者团队先前通过深度学习方法显著抑制了这一现象 [11],使得FSC-LCD在高分辨率LFD中的应用成为可能。
4.2. 扩展视场 (Expanded FOV)
直接将微显示面板与微透镜阵列 (MLA) 结合作为近眼光场显示器会面临严重的视场 (FOV) 限制。这是因为在大视场下,光线会以非常倾斜的角度穿过MLA,而MLA通常具有规则的球面轮廓,导致严重的像差 (aberrations)。
4.2.1. 传统LFD视场受限的模拟
如下图Figure 5所示,直接近眼LFD的仿真模型显示,视网膜点扩散函数 (retinal PSF) 随着视场角的增大而迅速退化。当单边视场超过10度时,甚至无法形成图像。这直观地展示了像差对视场的严重限制。

该图像是图表,展示了直接近眼光场显示(LFD)的仿真模型(a),不同视场随视觉分辨率变化的曲线(b),以及不同视场下的点扩散函数(PSF)示意图(c)。该数据显示,随着视场的增大,视觉分辨率显著降低,12°时分辨率降至0.7 PPD。
Fig. 5. (a) Simulation model of a directly near-eye LFD; (b) visual resolution decreased with field to demonstrate the FOV limited by aberration; (c) PSFs of different fields.
4.2.2. 远心光路的应用 (Telecentric Optical Path)
为了解决这一问题,本文借鉴了光学系统中常用的物方远心 (object-space telecentric) 光路策略。
-
原理: 物方远心光路确保主光线 (chief rays) 垂直于物体平面。在Pancake光学中,实现远心光路通常是通过将孔径光阑 (aperture stop) 定位在透镜模块的像方焦点 (image-space focal point)。
-
Pancake与远心光路: 现代Pancake光学通常采用物方远心光路来高效利用微显示器的光线。当LFD引擎生成的中间图像作为Pancake模块的“物体”时,这种远心光路的设计能够发挥关键作用。 如下图Figure 6所示,当Pancake模块具有物方远心光路时,来自LFD引擎的光线将以近乎平行的主光线进入Pancake模块,进而通过MLA。这意味着所有微透镜都将在接近近轴光线 (near-paraxial rays) 的条件下工作。
-
优势: 在近轴光线条件下,MLA的像差会大大降低,即使在大视场下也能保持较低的像差水平。这使得LFD引擎能够在保证图像质量的同时,实现更大的视场。
该图像是示意图,展示了FSC-LCD的物体空间传递路径及其如何通过Pancake光学组件生成中间图像,图中标示了不同颜色光线的传播轨迹。该设计旨在抑制由MLA引起的像差。
Fig. 6. The object-space telecentric path of Pancake and its benefit in suppressing the aberrations induced by oblique rays through MLA in the LFD engine.
4.3. Pancake与LFD引擎的匹配 (Matching between Pancake and the LFD engine)
Pancake模块通常针对特定的虚拟图像距离进行优化,因此当LFD引擎调整中间图像的位置(从而改变虚拟图像距离)时,可能会出现残余像差。LFD引擎本身在不同深度平面上的图像质量也会发生变化。因此,需要对两者进行精细匹配以实现平衡的图像质量。
4.3.1. Pancake模块的图像质量特性
- MTF随虚拟图像距离的变化: 论文通过Zemax仿真了Pancake模块在不同虚拟图像距离下的调制传递函数 (MTF),如下图Figure 7(a) 所示。结果显示,MTF随图像深度的变化是不可忽略的。
- 实验测量MTF: 考虑到商用Pancake模块的精确建模难度,论文通过将微显示器放置在Pancake的原生物体平面 (native object plane) 左侧并改变其位置来获取MTF。Figure 7(b) 中的蓝色实线展示了MTF及其对应的刀口函数 (knife edges)。对于原生物体平面右侧的情况,由于微显示器无法“浸入”Pancake模块内部,因此其MTF是通过预测得到的(蓝色虚线)。
4.3.2. LFD引擎的图像质量特性
-
分辨率与深度关系: 根据高斯公式,LFD引擎重建深度平面 (Reconstructed Depth Plane, RDP) 在微透镜阵列 (MLA) 的原生像平面 (native image plane) 处(称为中心深度平面 (Central Depth Plane, CDP))具有最高分辨率。当RDP远离CDP时,MLA的散焦会降低图像质量。
-
横向放大率影响: 横向放大率也会影响RDP上的体素 (voxel) 大小。
-
LFD确定的MTF公式: 综合考虑散焦和放大率的影响,LFD引擎的MTF由以下公式给出:
其中:
- : 调制传递函数。
- : 经过相位调制后的瞳孔函数。
P ( s , t ): 瞳孔函数 (pupil function),表示光学系统的孔径。- : 由于散焦引入的相位因子。
- : 虚数单位。
- : 波数, ,其中 是光的波长。
- : 中心深度平面 (Central Depth Plane) 到MLA的距离。
- : 重建深度平面 (Reconstructed Depth Plane) 到MLA的距离。
s, t: 瞳孔坐标 (pupil coordinates) 在MLA平面上的分量。
- : 卷积运算符。
- : 由像素离散化和横向放大率引入的sinc函数项。
- : MLA的微透镜间距 (pitch)。
- : 微显示面板的像素间距 (pixel pitch)。
- : 重建深度平面 (Reconstructed Depth Plane) 到MLA的距离。 上述公式描述了LFD引擎在不同深度下的MTF,如图Figure 7(b) 中的红色曲线所示。
4.3.3. 图像质量匹配策略
由于LFD和Pancake模块的图像质量都随深度而变化,为了在多个深度平面上实现平衡的图像质量,论文提出了一种妥协的配置 (compromised configuration)。如Figure 7(b) 所示,LFD引擎的CDP被有意地配置在Pancake模块的一个相对较差的物体平面上。这意味着在LFD引擎自身性能最好的深度上,它可能与Pancake模块性能不是最优的深度相匹配。这种策略是为了确保在整个深度范围内,系统整体的图像质量波动最小,而不是只追求某个深度上的峰值性能。

该图像是图表,展示了不同虚拟图像距离下调制传递函数(MTF)与空间频率的关系(图7(a)),以及在各种条件下的分辨率变化情况(图7(b))。图中展示的MTF曲线反映了从0.1m到2m等距离下的性能。
Fig. 7. (a) MTF varying with the virtual image distance
4.4. LFD引擎的图像渲染 (Image rendering for the LFD engine)
为了调整重建深度平面 (RDP) 的深度,需要对元素图像阵列 (Elemental Image Array, EIA) 进行渲染。
- 视点基投影 (Viewpoint-based Projection): 这是一种典型的渲染方法,其中每个微透镜 (lenslet) 被视为一个虚拟相机,用于捕捉目标场景。当生成的EIA在微显示器上显示时,微透镜阵列 (MLA) 会操纵光线的方向,将元素图像反向投射到特定的深度平面上,从而在空间中重建出3D场景。
- 加速渲染方法: 作者团队之前也报告了一种加速渲染方法 [13],以提高渲染效率。
5. 实验设置
5.1. 原型机构建
论文构建了一个原型机来验证所提出的方法。
-
FSC微型LCD: 采用了一个1500 ppi (pixels per inch) 的场序彩色微型LCD,该LCD基于迷你LED背光技术 [10]。
-
微透镜阵列 (MLA): 使用了一个微透镜间距为1毫米 (1-mm lens pitch) 的MLA。
-
Pancake模块: 采用了一个商用Pancake模块。
-
光路配置: Pancake模块的设计物体平面被放置在距离LFD的中心深度平面 (CDP) 6毫米处,以实现最佳图像质量。这种配置导致了2.1厘米的额外光学路径 (optical track),这对于近眼显示器来说被认为是可接受的。
该图像是示意图,展示了实验设置(a)、样本场景的ElA(b),以及在两个深度平面上的重建图像(c和d),并标明测得的视场(FOV)为68.6°。
Fig. 8. (a) Experimental setup; (b) ElA of the sample scene; (c) and (d) reconstructed images on two depth planes and the measured FOV.
- 实验设置 (Figure 8(a)): 显示了原型机的实验装置图。
5.2. 样本场景与元素图像阵列 (EIA)
- 样本场景: 实验场景包含两个放置在不同深度的物体。
- 元素图像阵列 (Figure 8(b)): 展示了用于该样本场景的EIA。
- 重建深度平面 (RDP) 设置:
- 第一个中间图像平面(前景物体)设置在距离MLA 9.7毫米处,这同时也是LFD的CDP。
- 第二个图像平面(背景物体)设置在距离MLA 16毫米处。
5.3. 评估指标
5.3.1. 图像清晰度 (Image Sharpness)
概念定义: 图像清晰度是衡量图像细节是否分明、边缘是否锐利的重要指标。在3D显示中,清晰度直接影响用户对深度信息的感知和视觉舒适度。当图像清晰时,用户可以更容易地分辨物体的细节和轮廓。 评估方式: 论文通过智能手机相机捕获虚拟图像,并通过观察不同深度平面上物体的视觉清晰度来主观评估。当相机聚焦于某一深度的物体时,该物体应显得锐利,而其他深度的物体则应模糊,这符合人眼在真实世界中的焦点调节机制,从而验证了真3D显示能力。
5.3.2. 视场 (Field of View, FOV)
概念定义: 视场是指用户通过显示设备能够看到的虚拟世界的范围,通常以角度(度)表示。宽广的视场对于提供沉浸式VR体验至关重要,因为它能让用户感觉自己被虚拟环境完全包围。 数学公式: 虽然论文中未直接给出FOV的计算公式,但通常FOV可以通过以下几何关系计算: 其中:
- : 图像传感器上捕获到的图像宽度(或高度)。
- : 捕获图像的相机的焦距。 符号解释:
- : 视场,通常以度 (degrees) 为单位。
- : 反正切函数。
- : 智能手机相机图像传感器上捕获到的虚拟图像的尺寸。例如,如果图像宽度是像素,每个像素的物理尺寸是,则 。
- : 用于捕获虚拟图像的智能手机相机的有效焦距。 评估方式: 论文使用智能手机相机(焦距:5.5毫米)捕获虚拟图像,并通过相机的规格和图像传感器上图片尺寸来计算测得的FOV。
5.3.3. 光学路径 (Optical Track)
概念定义: 光学路径指的是光线从显示面板到最终出瞳之间的物理长度,通常直接对应于VR头显的厚度或尺寸。紧凑的光学路径是VR头显设计中追求的目标之一,因为它有助于减轻头显的重量和体积,提高佩戴舒适度。 评估方式: 论文通过测量LFD引擎引入的额外物理长度来评估其对系统紧凑性的影响。
5.4. 对比基线
本文的实验主要围绕验证所提出的LFD引擎与Pancake模块结合方案的有效性及其性能提升,而非直接与具体的其他基线模型进行量化对比。然而,论文通过以下方式间接与“基线”进行了比较:
-
与传统Pancake VR头显的对比: 强调了传统Pancake头显只能支持固定虚拟图像距离,导致VAC的局限性,从而突出了本文VAC-free的优势。
-
与直接近眼LFD的对比: 论文通过仿真展示了直接近眼LFD在视场上的严重限制(图5),以此作为本文解决方案(引入远心光路)在扩展视场方面的“基线”参照。
-
与传统子像素LCD的对比: 采用了FSC-LCD,通过理论分析和提及作者团队之前的研究,暗示了FSC-LCD在分辨率和光学效率上优于传统LCD。
因此,本文的对比主要体现在对现有技术局限性的克服,以及在关键性能指标(如VAC、FOV、分辨率)上的提升。
6. 实验结果与分析
6.1. 核心结果分析
本研究通过构建原型机,验证了采用LFD引擎结合Pancake光学方案的VAC-free真3D VR显示系统的性能。
6.1.1. 真3D显示功能验证
- 实验设置: 实验中,LFD引擎生成了包含两个位于不同深度物体的元素图像阵列 (ElA),如Figure 8(b)所示。一个物体(前景)被重建在距离MLA 9.7毫米的CDP上,另一个物体(背景)被重建在距离MLA 16毫米处。
- 观察结果 (Figure 8(c) 和 Figure 8(d)):
- 当智能手机相机(模拟人眼)聚焦于前景物体时(Figure 8(c)),前景物体显示出清晰的细节,而背景物体则显得模糊,并能观察到明显的子视角图像 (subviews) 效应。
- 当相机重新聚焦于背景物体时(Figure 8(d)),背景物体变得清晰,而前景物体则变得模糊。
- 分析: 这种随着相机焦点变化而清晰度随之变化的现象,精确模拟了人眼在真实世界中调节晶状体以聚焦不同深度物体的行为。这有力地证明了该系统能够提供计算可调的虚拟图像距离 (computationally adjustable virtual image distances),从而实现了真3D显示 (true-3D feature),成功解决了辐辏-调节冲突 (VAC)。
6.1.2. 图像质量优化验证
- 背景物体清晰度: 值得注意的是,即使背景物体被重建在距离MLA 16毫米处(一个相对远离CDP的深度,LFD引擎自身的图像质量可能有所下降),它仍然能呈现出清晰的图像。
- 分析: 这验证了论文所提出的图像质量匹配策略 (image quality matching strategy)。即LFD引擎的CDP被有意地放置在Pancake模块的一个相对较差的物体平面上,而背景物体所在的RDP则可能被放置在Pancake模块具有更好MTF(调制传递函数)的物体平面上。这种“妥协配置”确保了在不同深度平面上都能获得平衡且可接受的图像质量。
6.1.3. 宽视场 (FOV) 性能
- 测量结果: 使用相机的规格和图像传感器上捕获的图片尺寸,测量得到该原型机的视场为 68.6度。
- 分析: 这个68.6度的视场接近于所使用的商用Pancake模块的原始视场。更重要的是,它显著大于单独使用LFD引擎时的视场(根据图5的仿真结果,直接近眼LFD在单边10度时就已无法成像,总视场远小于20度)。这充分验证了通过在LFD引擎中引入Pancake模块的远心光学路径 (telecentric optical path),成功地抑制了由MLA在大视场下引入的像差,从而实现了宽视场显示。
6.1.4. 系统紧凑性评估
-
额外光学路径: LFD引擎的引入导致了2.1厘米的额外光学路径。
-
分析: 论文认为这2.1厘米的额外光学路径对于近眼显示器来说是可接受的。这意味着在实现真3D和宽视场的同时,系统仍然保持了相对紧凑的设计,符合VR头显对便携性的要求。
该图像是示意图,展示了实验设置(a)、样本场景的ElA(b),以及在两个深度平面上的重建图像(c和d),并标明测得的视场(FOV)为68.6°。
Fig. 8. (a) Experimental setup; (b) ElA of the sample scene; (c) and (d) reconstructed images on two depth planes and the measured FOV.
6.2. 数据呈现 (表格)
论文中未提供表格形式的实验结果。所有的实验结果都通过文字描述和图片(Figure 8(c) 和 Figure 8(d))进行呈现和分析。
6.3. 消融实验/参数分析
论文中未明确进行消融实验或参数分析。然而,对LFD引擎与Pancake模块的图像质量匹配(Section 2.3)的讨论,可以看作是对不同配置下系统性能的参数分析。通过仿真MTF并提出“妥协配置”,表明了作者对系统参数(如CDP与Pancake物体平面的相对位置)的优化考量,以达到平衡的图像质量。
7. 总结与思考
7.1. 结论总结
本文成功地提出并实现了一种紧凑型、宽视场、VAC-free的真3D VR头显。该系统创新性地将光场显示 (LFD) 引擎与Pancake光学模块结合。核心技术点包括:
- 采用场序彩色微型LCD (FSC-LCD) 确保了高分辨率和高光学效率,克服了LFD固有的分辨率损失问题。
- 通过利用Pancake模块的远心光学路径 (telecentric optical path),有效抑制了微透镜阵列 (MLA) 在大视场下的像差,将视场扩展到68.6度以上。
- 精心设计了LFD引擎与Pancake模块之间的图像质量匹配策略,实现了在多个深度平面上平衡且清晰的图像显示。 原型机实验验证了系统能够生成具有计算可调虚拟图像距离的清晰3D图像,证明了其真3D显示能力。尽管引入LFD引擎增加了2.1厘米的光学路径,但其在实现真3D、高分辨率和宽视场方面的优势,使得这一牺牲是值得的。
7.2. 局限性与未来工作
论文中未明确指出自身的局限性,但从其描述和技术挑战来看,以下方面可能存在局限性并是未来研究方向:
- 光学路径的进一步优化: 尽管2.1厘米的额外光学路径被认为是可接受的,但VR头显对轻薄化的追求是无止境的。未来可以研究更紧凑的LFD引擎设计或Pancake-LFD集成方案,以进一步减小系统体积。
- FSC-LCD的色分现象: 尽管作者团队已通过深度学习抑制了色分现象 [11],但在极端运动或高对比度场景下,其表现仍可能是一个挑战。未来可以继续优化FSC-LCD的驱动算法和面板刷新率,以彻底消除色分现象。
- 图像质量的量化评估: 论文主要通过主观视觉观察和MTF仿真来评估图像质量。未来可以引入更全面的客观量化指标(如感知图像质量指标),并进行用户研究来评估长期佩戴的舒适度和视觉效果。
- 计算渲染效率: LFD的图像渲染(元素图像阵列生成)通常计算量较大。尽管提到了加速渲染方法 [13],但对于实时、高帧率、复杂场景的渲染,仍需要进一步优化算法和硬件加速。
- MLA制造精度和成本: MLA的制造精度直接影响LFD的图像质量。随着技术发展,更低成本、更高精度的MLA制造是关键。
- 亮度均匀性与对比度: Pancake光学通常会损失一定的光效率,FSC-LCD虽然提高了效率,但整体系统的亮度均匀性和对比度在大视场下仍需优化。
7.3. 个人启发与批判
7.3.1. 个人启发
这篇论文提供了一个非常清晰且实用的VR显示技术融合思路。它没有盲目追求单一技术的极致,而是巧妙地结合了现有成熟技术的优势,并针对性地解决了各自的痛点:
- 工程智慧: 论文最启发人的一点在于,它没有试图从零开始解决所有问题,而是利用了Pancake光学已有的物方远心光路这一特性,巧妙地解决了LFD在近眼显示中最大的痛点——视场受限。这种将现有设计优势进行功能“再利用”的思路,是高效工程创新的典范。
- 分辨率与效率的平衡: FSC-LCD在提高分辨率的同时,也提升了光学效率。这对于光效率相对较低的Pancake系统来说,是一个完美的匹配,展现了系统级优化的重要性。
- 系统级图像质量管理: 对LFD和Pancake模块的图像质量进行匹配分析,并提出“妥协配置”的策略,表明了在复杂光学系统中,需要考虑不同组件性能曲线的相互作用,以实现整体最优,而非局部最优。这对于设计复杂的显示系统具有普遍指导意义。
- 真3D的重要性: 再次强调了VAC是VR沉浸感和舒适度的核心障碍,而LFD这种提供计算焦距线索的真3D技术是未来VR发展的必然方向。
7.3.2. 批判
尽管论文提出了一个令人兴奋的解决方案,但仍有一些可以批判或改进的地方:
-
缺乏量化的用户体验评估: 论文主要通过相机拍摄和物理测量来验证系统性能,但缺乏对用户主观体验的量化评估,例如VAC缓解程度的量化指标、长时间佩戴的舒适度、视觉疲劳程度等。毕竟VR设备最终是面向用户的产品,用户体验是核心。
-
“妥协配置”的具体影响: 虽然“妥协配置”旨在平衡图像质量,但其对不同深度下图像细节的实际影响有多大?是否存在某些深度区域的图像质量仍然显著低于其他区域?论文可以通过更详细的MTF曲线分析和用户感知测试来量化这种妥协的效果。
-
额外光学路径的实际感受: 2.1厘米的额外光学路径被认为是“可接受的”,但这只是一个工程师视角的判断。在实际产品中,这可能意味着头显厚度的显著增加,从而影响佩戴的重心和舒适度。未来的研究或产品化应更严格地评估这一参数的用户接受度。
-
亮度、对比度与色彩表现: FSC-LCD虽然效率高,但在快速切换彩色帧时,对背光同步和驱动芯片的要求很高。论文未详细讨论其在亮度、对比度、色彩还原度以及动态范围等方面的具体性能表现,这些都是影响沉浸感的重要因素。
-
渲染计算的复杂性对实时性的影响: LFD的实时渲染对计算资源要求较高。虽然提到了加速渲染方法,但对于未来VR应用中日益复杂的3D场景,能否持续保证高帧率和低延迟仍是一个挑战,这关系到用户体验的核心。
总而言之,这篇论文为解决VR中的VAC问题提供了一个非常有前景的结合了成熟光学设计的方案,其工程实现和优化思路值得学习。但要真正走向产品化和更广泛应用,还需要在用户体验、性能量化和系统集成方面进行更深入的探索和优化。
相似论文推荐
基于向量语义检索推荐的相关论文。