Predictive multiuser redirected walking using artificial potential fields
TL;DR 精炼摘要
本文提出了两种基于回旋曲线的新型预测性重定向行走系统,解决了虚拟现实中多用户在有限物理空间内的导航问题。通过结合非谐人工势场,研究证明这些系统在用户体验方面显著优于传统反应式方法,有助于在开放环境中提升行走的灵活性和效率。
摘要
Real walking is considered as the best locomotion metaphor to explore virtual environments in terms of user experience. In addition to being intuitive for the user, walking captures the true feelings of motion since the visual and proprioceptive sensations are harmonized well. The major disadvantage of choosing walking over other locomotion metaphors involves the physical constraints of the available space, which is usually considerably smaller than the virtual environment. To address this issue, redirected walking (RDW) introduces slight mismatches between a user’s visually perceived path and their actual walking pattern, compelling them to subconsciously compensate for the inconsistency by adjusting their walking trajectory. As a result, users are steered to a certain degree, and expansive virtual environments are effectively compressed into smaller physical spaces. Among others, particularly predictive RDW offers immense potential for growth since it unites various algorithmic systems, whereas many approaches from literature depend on drastic restrictions like single-user constraints or architectural limitations to ensure real-time performance. This work presents two novel predictive RDW systems that allow multiple physically colocated users to explore independent and unconstrained virtual environments. The systems rely on two new implementations of prediction systems based on clothoid trajectory generation combined with a cost-based planning concept built on non-harmonic artificial potential fields (APFs), which inherently allow non-convex and dynamic physical environments. Using the APFs, three additional RDW conditions popular in the literature are implemented for comparison purposes. The five RDW concepts are then validated in an extensive user study with 150 participants conducted in 75 pairs. The results indicate that the novel predictive RDW systems outperform the three systems from literature, except for particular sections of the virtual environment with specific architectural traits.
思维导图
论文精读
中文精读
1. 论文基本信息
1.1. 标题
Predictive multiuser redirected walking using artificial potential fields
(基于人工势场的预测性多用户重定向行走)
1.2. 作者
Christian Hirt, Noah Isaak, Christian Holz, Andreas Kunz
隶属机构:苏黎世联邦理工学院 (ETH Zurich),机械与过程工程系 & 计算机科学系。
1.3. 发表期刊/会议
Frontiers in Virtual Reality
这是一本在虚拟现实领域具有一定影响力的开放获取(Open Access)期刊。
1.4. 发表年份
2024年8月8日
1.5. 摘要
本文旨在解决虚拟现实(VR)中“真实行走”受物理空间限制的问题。作者提出了两种新型的预测性重定向行走(Predictive RDW)系统,允许多名用户在同一物理空间(Colocated)内探索无约束的虚拟环境。系统基于两种新的回旋曲线(Clothoid)轨迹预测算法,并结合了非谐人工势场(Non-harmonic APFs)的成本规划。通过一项包含150名参与者(75对)的用户研究,结果表明新型预测系统在大多数情况下优于现有的反应式方法。
1.6. 原文链接
Paper PDF (Open Access)
2. 整体概括
2.1. 研究背景与动机
- 核心矛盾: 在VR中,“真实行走(Real Walking)”提供了最佳的沉浸感和前庭觉反馈,但物理空间(如实验室、客厅)通常远小于广阔的虚拟环境。
- 现有解决方案: 重定向行走(Redirected Walking, RDW) 通过欺骗用户的视觉(如在用户直线行走时微调虚拟画面,使其在物理世界不知不觉地走曲线),将大虚拟空间压缩进小物理空间。
- 主要挑战(Gap):
- 多用户共存难: 大多数现有算法仅针对单用户设计,无法处理多人在同一物理空间漫游时的碰撞避免问题。
- 预测性方法的局限: 现有的预测性RDW通常依赖于预定义的“骨架图(Skeleton Graphs)”(即限制用户只能走特定的走廊),无法应用于开放、无约束的虚拟空间。
- 反应式方法的不足: 基于人工势场(APF)的现有方法大多是“反应式(Reactive)”的,即只根据当前状态进行引导,缺乏对未来路径的规划,导致引导效率较低。
2.2. 核心贡献
-
两种新型预测算法: 提出了 LPP (Lemniscate Path Prediction) 和 FPP (Forward Path Prediction),均基于回旋曲线,适用于开放空间且无需预定义路径图。
-
融合框架: 将上述预测算法与非谐人工势场(Non-harmonic APFs)相结合。APF不仅用于避障(包括墙壁和其他用户),还作为成本函数的一部分来评估预测路径的优劣。
-
大规模用户研究: 进行了150人的双人共处一室(Colocated)实验,验证了算法在复杂环境下的有效性。
3. 预备知识与相关工作
3.1. 基础概念
为了理解本文,初学者需要掌握以下三个核心概念:
- 重定向行走 (Redirected Walking, RDW):
- 增益 (Gains): 施加在用户视觉上的微小偏差。包括平移增益(走的快慢)、旋转增益(转的多少)和曲率增益(走直线变走曲线)。只要偏差在感知阈值内,用户就不会察觉。
- 重置 (Reset): 当用户即将撞墙且无法通过增益引导避开时,系统会强制停止用户,并要求其原地旋转(如旋转360度,但在虚拟中只转很少角度,从而改变物理朝向)。重置会打断沉浸感,因此重置次数越少越好。
- 人工势场 (Artificial Potential Fields, APF):
- 源自机器人路径规划。将物理空间建模为一个力场:障碍物(墙壁、其他用户)产生斥力(高势能),空旷区域产生引力(低势能)。用户就像一个粒子,被力场“推”向安全区域。
- 非谐 (Non-harmonic): 相比于谐波势场,非谐势场计算更简单,能处理非凸形状(复杂的房间形状),且不容易陷入局部极小值。
- 回旋曲线 (Clothoid):
- 一种曲率随弧长线性变化的曲线(常用于公路设计的缓和曲线)。由于人类行走的轨迹曲率通常是连续变化的,回旋曲线比圆弧或直线更能准确拟合人类的自然行走路径。
3.2. 技术演进与差异化
- 反应式 (Reactive): 如 Steer-to-Center (S2C)(始终引导用户走向中心)和 Steer-to-Gradient (S2G)(基于势场梯度的即时引导)。
- 缺点: 鼠目寸光,只看当下,容易把用户导向局部死胡同。
- 脚本式 (Scripted): 预先设计好路径。
- 缺点: 剥夺了用户的自由探索权。
- 传统预测式 (Predictive): 如 RFED 或 MPCRed。
- 缺点: 依赖“骨架图”,即假设虚拟环境是走廊连接的节点。
- 本文方法 (PredRed):
-
创新点: 结合了预测(Prediction)和势场(APF)。预测部分不依赖骨架图,而是基于用户当前的运动趋势生成回旋曲线,使其能适应开放空间(Open Space)。同时利用APF处理动态障碍物(第二个用户)。
下图(原文 Figure 1)展示了多用户在同一物理空间内,通过人工势场进行重定向的概念:
该图像是插图,展示了多个用户在物理重叠的环境中进行的高效行走引导,依据非谐人工势场实现。图中可见一名用户在虚拟环境中行走,周围是各类设备,表明此设置旨在优化用户在有限空间内探索虚拟场景的体验。
-
4. 方法论
本文提出的系统名为 PredRed,包含两个变体:PredRed LPP 和 PredRed FPP。其核心流程是:状态更新 -> 路径预测 -> 候选重定向生成 -> 成本评估 -> 应用最佳策略。
4.1. 预测算法一:双纽线路径预测 (LPP)
LPP (Lemniscate Path Prediction) 的核心思想是用一个“双纽线(8字形)”形状来限定可能的行走区域,并在其中生成多条候选的回旋曲线。
4.1.1. 双纽线形状生成
为了限制搜索空间,作者使用双纽线形状。其参数方程如下:
- 符号解释:
- :定义双纽线大小的常数(文中设定为 3米 的视界)。
- :运行变量,取值范围 ,仅使用双纽线的正半部分(即用户前方的区域)。
4.1.2. 场景感知与筛选
LPP 生成一组落在这个形状内的候选回旋曲线,然后进行碰撞检测(Scene Awareness)。
-
场景感知: 如果某条预测路径与虚拟墙壁碰撞,则直接剔除。
-
最优路径选择: 在剩余的可行路径中,选择与用户历史路径最相似的一条。
下图(原文 Figure 2)展示了 LPP 的过程:(A) 剔除撞墙的左侧路径;(B) 选出最佳预测路径(白色)。
该图像是一个示意图,展示了在LPP中运用场景感知的过程。图中红色路径为先前行走的轨迹,黄色为真实轨迹,绿色为虚拟障碍物的边缘。图(A)中,场景感知早期移除不合适的轨迹,仅保留有效的白色轨迹,而左侧的对称预测因碰撞而被丢弃。图(B)展示了从有限有效轨迹中识别出的最佳预测,预测的起点(紫色)稍微位于过去。
4.2. 预测算法二:前向路径预测 (FPP)
FPP (Forward Path Prediction) 采用数值分析方法,直接计算出一条最可能的未来路径,计算量更小。
4.2.1. 非完整约束动力学系统
人类行走被建模为一个非完整约束系统(即不能横着平移,只能沿朝向移动)。其微分方程组为:
- 符号解释:
x, y:用户位置。- :用户朝向(Heading)。
- :路径曲率(Curvature)。
- :上述变量对时间的导数。
- :控制输入1,即线速度 。
- :控制输入2,即曲率变化率 。
4.2.2. 曲率与导数计算
为了求解上述系统,需要计算当前轨迹的曲率 及其导数 。
- 曲率公式:
- 曲率变化率公式: 这里涉及到了位置的三阶导数 。
4.2.3. 数值微分 (CFD)
为了从离散的头显(HMD)数据中获取这些高阶导数,作者使用了中心有限差分法 (Central Finite Differences, CFD)。
-
CFD 系数向量: 为了计算
t-4时刻的导数(利用t-8到 的数据),作者定义了以下系数向量:注:这些复杂的系数是为了在离散数据上尽可能精确地估算一阶、二阶和三阶导数。
-
导数计算: 将历史位置数据向量 与上述系数相乘: 得到导数后,代入 Eq(3) 和 Eq(4) 即可确定唯一的一条回旋曲线。
下图(原文 Figure 3)展示了 FPP 生成的单条预测路径(黄色):
该图像是示意图,展示了多用户重定向行走的预测系统。图中A和B部分分别描绘了不同用户在虚拟环境中行走轨迹的变化,采用了不同颜色表示用户的实际步态和视觉感知路径,模型通过平滑的曲线生成引导用户行走。
4.3. 重定向与成本函数
有了预测路径 后,系统会尝试应用不同的重定向增益(Action Set ),生成一系列候选的重定向路径 。然后通过成本函数评估哪种增益最好。
4.3.1. 人工势场力矢量
重定向的“目标方向”由总斥力矢量 决定: 其中,单个障碍物 产生的斥力 为:
- 符号解释:
- :最大斥力强度。
- :斥力随距离衰减的宽度系数。
- :用户到障碍物的欧几里得距离。
- :从障碍物指向用户的单位向量(斥力方向)。
4.3.2. 总成本函数
系统选择使总成本 最小的重定向策略 : 总成本是对预测路径上所有点 的累加,并引入了折扣因子 (原文取0.8),意味着越远的预测权重越低:
4.3.3. 单点成本构成
每个点的成本 由四部分组成: 其中最关键的两项是:
- APF 成本: 直接等于该位置的力场强度,表示撞墙风险。
- 朝向成本: 惩罚用户朝向 与力场方向 的不一致。
-
这是一个归一化的点积形式,当用户正对力场方向(即远离障碍物)时,成本最低。
-
5. 实验设置
5.1. 实验设计与环境
-
参与者: 150人(75对),平均年龄 25.5 岁。
-
物理空间: 。
-
虚拟环境: 包含7个不同架构的房间(走廊、迷宫、开阔森林等),如图(原文 Figure 5)所示。
-
任务: 收集环境中的27颗星星。
-
安全机制: 当无法通过重定向避免碰撞时,触发“重置”(Reset),提示用户原地转向安全方向(见下图 Figure 4A)。
该图像是图示,包含两个部分。部分A展示了提示信息“<< Spin In Place”,用于指示用户在原地旋转的方向;部分B则显示了环境中的一个黄色星形收集物,供参与者寻找和收集。
5.2. 对比基线 (Baselines)
为了验证 PredRed 的效果,作者对比了以下五种条件:
- PredRed LPP: 本文提出的基于双纽线预测的方法。
- PredRed FPP: 本文提出的基于前向数值预测的方法。
- S2G (Steer-to-Gradient): 反应式基线。基于APF梯度引导,但不做预测。
- S2C (Steer-to-Center): 经典基线。总是引导用户走向物理中心。
- NULL: 无重定向引导,仅在即将碰撞时触发重置。
5.3. 评估指标
-
平均重置间距 (Mean Distance Between Resets, ):
- 定义: 衡量重定向算法让用户连续行走多久才被打断一次。值越大越好。
- 公式:
-
模拟器晕动症 (Simulator Sickness, SS): 使用 SSQ 问卷评估。
6. 实验结果与分析
6.1. 核心结果分析
实验结果表明,PredRed LPP 表现最佳,即提供了最长的不间断行走距离。
以下是原文 Table 4 的结果,展示了各算法的平均重置间距:
| RDW Condition | dReset |
|---|---|
| PredRed LPP | 5.75 ± 0.26 m |
| PredRed FPP | 5.60 ± 0.27 m |
| S2G | 5.56 ± 0.26 m |
| S2C | 5.42 ± 0.20 m |
| NULL | 5.28 ± 0.39 m |
分析:
-
PredRed LPP 达到了 5.75m,明显优于 NULL (5.28m) 和 S2C (5.42m)。
-
下图(原文 Figure 6)直观展示了这一分布趋势,LPP 的中位数和上限均较高。
该图像是图表,展示了不同重定向器的重置间距 的性能表现。各组数据以小提琴图形式呈现,包含PredRed LPP、PredRed FPP、S2G、S2C和Null。图中显示的重置间距值范围从4.0到6.5米。
6.2. 统计显著性
为了验证这些差异是否具有统计学意义,作者进行了单尾 t 检验。以下是原文 Table 5 的数据:
注:绿色表示 (显著),黄色表示不显著。表格阅读方式为“左侧算法 vs 上方算法”。
| p-value | PredRed FPP | S2G | S2C | NULL |
|---|---|---|---|---|
| PredRed LPP | 0.031 (Sig) | 0.012 (Sig) | 6.4E-05 (Sig) | 2.1E-06 (Sig) |
| PredRed FPP | 0.312 (Not Sig) | 0.013 (Sig) | 4.7E-04 (Sig) | |
| S2G | 0.047 (Sig) | 0.002 (Sig) | ||
| S2C | 0.056 (Not Sig) |
分析:
- PredRed LPP 显著优于所有其他算法(包括 FPP 和 S2G)。这证明了“场景感知 + 双纽线预测”的策略是最有效的。
- PredRed FPP 和 S2G 表现相近,无显著差异。这说明如果预测仅仅是简单的数值外推(FPP),其效果可能并不比优秀的反应式算法(S2G)强多少。
- S2C 与 NULL 无显著差异。这令人惊讶,说明经典的“导向中心”策略在复杂的多房间环境中可能并不比“不引导”强多少(因为中心可能被墙挡住)。
6.3. 房间结构的影响
作者还分析了不同房间结构下的表现(见下图 Figure 7)。
-
LPP 在走廊(Hallway)和大多数开阔房间表现优异。
-
S2C 在复杂结构(如迷宫)中表现急剧下降,因为它盲目地引导用户穿过虚拟墙壁去物理中心。
该图像是一个热图,显示了不同地点的重置距离。在图中,颜色从黄色(最佳)到蓝色(最差)变化,矩阵的各个单元格包含不同的距离值,这些值与不同的预测重定向行走(PredRed LPP, PredRed FPP等)方法相关联。
7. 总结与思考
7.1. 结论总结
- 本文成功提出并验证了两种适用于多用户、开放空间的预测性重定向行走算法(PredRed LPP/FPP)。
- PredRed LPP 凭借其结合了回旋曲线预测和场景感知(剔除撞墙路径)的能力,在减少重置次数方面表现最佳,统计显著优于现有方法。
- 基于人工势场 (APF) 的框架被证明具有极高的灵活性,能够优雅地处理复杂的房间几何形状和动态的用户间避障。
7.2. 局限性与未来工作
- 用户优先级: 目前APF将所有用户视为同等权重的障碍物。未来可以引入优先级系统,让某些用户在特定情况下拥有“路权”。
- 预测准确性: FPP 目前是纯数值外推,不包含场景感知。未来可以将场景感知加入 FPP 以提升精度。
- 交互性: 目前用户在虚拟中是隔离的(看不见对方)。如果在同一虚拟空间中也能看到对方,可能会改变用户的行走策略。
7.3. 个人启发与批判
- 方法的精妙之处: 本文最精彩的地方在于将预测融入了势场成本函数。传统的APF只看当前点的力,而 PredRed 计算了未来路径上累积的势场力(Eq 14),这本质上是Model Predictive Control (MPC) 的一种轻量化实现。
- FPP vs LPP 的思考: 尽管 FPP 数学推导更复杂(涉及三阶导数),但效果却不如 LPP。这提示我们:在含噪声的真实数据(HMD Tracking)面前,几何约束(LPP的双纽线)往往比高阶数值外推(FPP)更鲁棒。
- S2C 的失效: 实验再次印证了 S2C 在非凸空间(有内墙的房间)的无力。这对未来的RDW设计是一个警示:不要盲目依赖简单的几何中心。
相似论文推荐
基于向量语义检索推荐的相关论文。