论文状态：已完成

The conceptual structure of human relationships across modern and historical cultures

发表：2025/03/13

人类社会关系认知结构 (1)跨文化关系研究 (1)自然语言处理在社会科学中的应用 (1)多维关系表示空间 (1)历史与现代文化比较 (1)

原文链接

价格：0.100000

已有 10 人读过

本分析由 AI 生成，可能不完全准确，请以原文为准。

TL;DR 精炼摘要

本研究结合在线调查、认知实验与自然语言处理，跨越20余个现代文化与逾3000年历史古文化，揭示人类关系的五大维度与三大核心类别，构建统一的关系概念表征空间，深化了对人类社会性认知结构及其文化差异的理解。

摘要

Nature Human Behaviour | Volume 9 | June 2025 | 1162–1175 1162 nature human behaviour Article https://doi.org/10.1038/s41562-025-02122-8 The conceptual structure of human relationships across modern and historical cultures Xi Cheng 1,9 , Haroon Popal 1,2,9 , Huanqing Wang 1,9 , Renfen Hu 3 , Yinyin Zang 4 , Mingzhe Zhang 1 , Mark A. Thornton 5 , Yina Ma 1 , Huajian Cai 6 , Yanchao Bi 1 , Jamie Reilly 7 , Ingrid R. Olson 8 & Yin Wang 1 A defining characteristic of social complexity in Homo sapiens is the diversity of our relationships. We build connections of various types in our families, workplaces, neighbourhoods and online communities. How do we make sense of such complex systems of human relationships? The basic organization of relationships has long been studied in the social sciences, but no consensus has been reached. Here, by using online surveys, laboratory cognitive tasks and natural language processing in diverse modern cultures across the world ( n = 20,427) and ancient cultures spanning 3,000 years of history, we examined universality and cultural variability in the ways that people conceptualize relationships. We discover

思维导图

论文精读

中文精读约 36 分钟读完 · 18,810 字

1. 论文基本信息

1.1. 标题

人类关系在现代与历史文化中的概念结构 (The conceptual structure of human relationships across modern and historical cultures)

1.2. 作者

Xi Cheng, Haroon Popal, Huanqing Wang, Renfen Hu, Yinyin Zang, Mingzhe Zhang, Mark A. Thornton, Yina Ma, Huajian Cai, Yanchao Bi, Jamie Reilly, Ingrid R. Olson & Yin Wang。作者团队来自多个机构，包括北京师范大学 (Beijing Normal University) 等，体现了跨学科合作。

1.3. 发表期刊/会议

Nature Human Behaviour。《Nature Human Behaviour》是一本享誉国际的顶级学术期刊，专注于发表人类行为研究领域的原创性、高影响力研究。该期刊在心理学、社会学、神经科学等多个学科交叉领域具有极高的声誉和影响力。

1.4. 发表年份

1.5. 摘要

人类社会复杂性的一个显著特征是我们关系的多样性。我们在家庭、工作场所、社区和在线社群中建立各种联系。我们如何理解如此复杂的人际关系系统？社会科学长期以来一直在研究关系的基本组织结构，但尚未达成共识。本文通过在线调查、实验室认知任务和自然语言处理 (NLP) 方法，在全球不同现代文化（n = 20,427）和跨越3000年历史的古代文化中，考察了人们如何概念化关系的普遍性和文化变异性。研究发现了一个普遍的关系概念表征空间，包含五个主要维度（正式性、活跃性、情感价值、交换性和平等性）和三个核心类别（敌对关系、公共关系和私人关系）。这项工作揭示了人类关系知识的基本认知建构和文化原则，并推进了我们对人类社会性的理解。

1.6. 原文链接

/files/papers/68ffa09ebd968e29d463b620/paper.pdf 状态：已正式发表。

2. 整体概括

2.1. 研究背景与动机

论文试图解决的核心问题： 人类社会的一个显著特征是其关系的极端多样性和复杂性，我们如何理解和组织这些关系？尽管社会科学对此进行了长期研究，但对于人际关系的基本组织形式和结构，尚未达成普遍共识。现有的理论往往是碎片化的，来自不同学科，并且缺乏一个统一的框架来解释和比较跨文化、跨时代的关系概念化。
为什么这个问题在当前领域是重要的： 人际关系的质量和数量不仅对人类的生存至关重要，也影响着个体的认知、行为、发展和幸福感。理解人际关系的本质是社会科学的核心任务。随着社会复杂性的增加，以及全球化带来的跨文化交流日益频繁，一个统一且普适的关系理解框架对于构建健康的社会、促进跨文化理解和有效应用人工智能于社交场景都具有重要意义。
现有研究存在的具体挑战或空白：
1. 多样性与复杂性： 人类关系类型繁多（如“亦敌亦友”、“教父”、“网友”），且受时间、空间、情感、沟通、文化规范等多种因素影响，这些因素相互作用，难以孤立研究。
2. 主观性： 人际关系是主观的信念、经验和实践，受个体独特视角、态度和个性塑造，难以建立客观统一的衡量标准并在个体间进行比较。全球（和跨代际）人群在关系认知、行为和文化原则上的共享程度尚未充分评估。
3. 学科碎片化： 1970-1990年代，多学科（社会学、人类学、认知心理学、传播学）都探索了关系内部组织，但各学科有其独特理论和方法，导致难以建立统一理解并比较研究结果。
4. 缺乏跨文化和跨历史的验证： 现有研究主要集中在特定文化和当代社会，缺乏对关系概念化在不同文化和历史时期中普遍性与变异性的系统性考察。
这篇论文的切入点或创新思路： 本文的创新点在于：
1. 构建统一框架： 综合多学科现有理论，提炼出人际关系概念的统一表征空间，而不是局限于单一学科视角。
2. 数据驱动与跨模态方法： 结合在线调查、实验室认知任务和自然语言处理 (NLP) 等多样化方法，从大规模数据中发现关系结构。
3. 跨文化、跨历史验证： 首次系统性地在全球19个现代文化区域（n = 20,427）以及跨越3000年历史的古代文化中验证这一框架，考察其普遍性和文化特异性，填补了现有研究的空白。
4. 提出FAVEE-HPP模型： 发现并命名了由五个维度（Formality, Activeness, Valence, Exchange, Equality）和三个核心类别（Hostile, Public, Private）组成的 FAVEE-HPP 模型，为理解人际关系概念结构提供了新的、普适性的认知工具。

2.2. 核心贡献/主要发现

论文最主要的贡献：
1. 发现并提出了FAVEE-HPP模型： 本文通过综合多学科理论和大规模数据分析，提出了一个统一的、普适的人际关系概念结构模型——FAVEE-HPP。该模型包含五个核心维度（正式性、活跃性、情感价值、交换性和平等性）和三个核心类别（敌对关系、公共关系、私人关系）。
2. 揭示了关系概念的普遍性与文化变异性： 研究通过在多样化的现代文化和古代文化中进行验证，证实了 FAVEE-HPP 框架的普遍适用性，同时识别了文化（如宗教和现代化水平）如何塑造关系概念的具体差异。
3. 超越现有理论： 实验结果表明，FAVEE-HPP 模型在模型性能、跨区域一致性和时间持久性方面均优于15种现有的人际关系理论。
4. 为社会科学提供了计算框架： 建立了一个可以客观定量衡量人际关系的计算框架，类似于人格心理学中的“大五人格”模型，为关系科学中的人际因素设计、操纵、控制和建模提供了标准参考。
论文得出了哪些关键的结论或发现：
1. 普遍的五维结构（FAVEE）： 人们在思考社会关系时，会关注五个关键特征：正式性 (Formality)、活跃性 (Activeness)、情感价值 (Valence)、交换性 (Exchange) 和平等性 (Equality)。所有关系概念都可以在这个高维空间中表征。
2. 普遍的三大核心类别（HPP）： 关系概念会自发聚类成三个核心类别：敌对关系 (Hostile)、公共关系 (Public) 和私人关系 (Private)。这些类别是从 FAVEE 维度上的不均匀分布中产生的。
3. 跨文化共享与文化塑造： FAVEE-HPP 框架在全球19个现代文化区域（包括非工业社会摩梭族）和跨越3000年历史的古代中国文化中都得到了验证，显示出强大的普遍性。然而，文化（特别是宗教和现代化水平）会对关系的局部精细表征（如“邻居”的概念）产生显著影响。
4. 古今差异： 与现代中国人相比，古代中国人可能在理解关系时更看重平等性特征（如社会等级），而较少看重正式性特征（如职业）。

3. 预备知识与相关工作

3.1. 基础概念

主成分分析 (Principal Component Analysis, PCA)：
- 概念定义： PCA 是一种统计学方法，用于将高维数据集转换为低维数据集，同时保留数据中尽可能多的信息。它通过找到数据方差最大的正交（不相关）方向（即主成分）来重新表示数据。
- 目的： 在本文中，PCA 用于将30个理论关系特征降维到5个核心维度，从而揭示人际关系的内在结构。
自然语言处理 (Natural Language Processing, NLP)：
- 概念定义： NLP 是人工智能的一个分支，专注于使计算机能够理解、解释和生成人类语言。它涵盖了从文本分析、机器翻译到情感识别等广泛任务。
- 目的： 本文利用 NLP 技术生成了典型关系列表，并在研究3中分析了历史文本语料库以理解古代人对关系的认知。
表征相似性分析 (Representational Similarity Analysis, RSA)：
- 概念定义： RSA 是一种用于比较不同数据模态或不同理论模型之间信息表征相似性的方法。它首先计算每个模态或模型内部所有项目对之间的相似性（或相异性）矩阵，称为表征相异性矩阵 (Representational Dissimilarity Matrix, RDM)，然后比较这些 RDM 之间的相似性。
- 目的： 在本文中，RSA 用于评估不同文化区域之间关系概念表征的一致性，以及文化变量（如宗教、现代化）对这些表征变异性的解释能力。
预训练语言模型 (Pretrained Language Models, PLM)：
- 概念定义： PLM 是在大规模文本语料库上进行预训练的神经网络模型（如 BERT、RoBERTa 等），它们学习了语言的语法、语义和上下文信息。通过在特定任务上进行微调，它们可以应用于各种 NLP 任务。
- 目的： 研究3使用 PLM 作为古代人类思维的代理，通过分析其词嵌入 (word embeddings) 来推断古代人对关系的理解。
大型语言模型 (Large Language Models, LLM)：
- 概念定义： LLM 是 PLM 的一个子集，具有更大规模的模型参数和更强大的能力，例如 GPT-4。它们能够执行更复杂的语言理解和生成任务，包括生成描述性文本。
- 目的： 本文使用 GPT-4 为 PLM 生成关系相关的描述（[DESC]），以提供更丰富的上下文信息。
k-均值聚类 (k-means clustering)：
- 概念定义： k-means 是一种流行的无监督聚类算法，它将数据集中的数据点分成 $k$ 个簇。算法的目标是使每个簇内的数据点尽可能相似，而不同簇之间的数据点尽可能不同。它通过迭代地将每个数据点分配给最近的质心，并更新质心为簇内所有点的均值来工作。
- 目的： 本文使用 k-means 算法来识别关系概念的类别结构（如 HPP 模型）。
统一流形近似与投影 (Uniform Manifold Approximation and Projection, UMAP)：
- 概念定义： UMAP 是一种降维技术，类似于 t-SNE，但通常计算速度更快，并且在保留数据的局部和全局结构方面表现良好。它旨在将高维数据映射到低维空间，同时保持数据点之间的相对距离。
- 目的： 本文使用 UMAP 作为 k-means 聚类前的预处理步骤，以提高聚类算法的性能，因为它能有效地揭示数据的潜在结构。
概念结构 (Conceptual Structure)：
- 概念定义： 在认知科学中，概念结构 指的是人们如何组织和理解世界上的信息和实体。它涉及到概念是如何形成、分类、关联以及在心智中表征的。
- 目的： 本文的目标是揭示人类如何概念化和组织人际关系的内在结构。

3.2. 前人工作

论文在引言部分总结了社会科学领域中关于人际关系研究的几个关键前人工作：

社会学 (Sociologists)： 关注社会关系的形成和组织，提出了角色关系的三因素模型 (three-factor model for role-based relationships)，包括：亲密性 (intimacy)、可见性 (visibility) 和 规范性 (regulation)。
人类学 (Anthropologists)： 试图理解跨文化社会协调的基础，提出了四种基本社会纽带形式 (four elementary forms of social bonds)：共同分享 (communal sharing)、权威等级 (authority ranking)、预期互惠 (expected reciprocity) 和 市场定价 (market pricing)。
认知心理学 (Cognitive psychologists)： 研究关系感知，揭示了四维框架 (four-dimensional framework)：情感价值 (valence)、平等性 (equality)、活跃性 (activeness) 和 正式性 (formality)。
传播学 (Communication scholars)： 专注于个人关系中的沟通质量，提出了有效关系对话的三因素 (three factors for effective relational dialogues)：积极性 (positiveness)、亲密性 (intimacy) 和 控制 (control)。

这些理论都提供了深刻的见解，但由于研究者从不同学科背景和兴趣点出发，关注不同的特征空间和关系类型，导致未能达成一个统一的共识。

3.3. 技术演进

本文的工作是建立在认知科学、社会心理学、计算语言学等领域的技术演进基础之上：

认知科学的发展： 对人类如何组织概念（如物体知识、人格特质、心理状态）的理解不断深入，为本研究探索关系概念结构提供了理论基础。
社会心理学中关系研究的积累： 尽管缺乏统一框架，但过去50年社会科学对人际关系多样性、复杂性和维度特征的研究，为本文收集和提炼30个理论特征奠定了基础。
自然语言处理 (NLP) 的进步： 特别是预训练语言模型（PLM）和大型语言模型（LLM）的兴起，极大地革新了大规模文本分析工具。这些技术使得研究人员能够从历史语料库中提取对概念（如关系）的理解，这是传统方法难以实现的。例如，通过 word embeddings 反映人们对概念的理解。

3.4. 差异化分析

本文的方法与相关工作的主要区别和创新点在于：

统一性与综合性： 现有研究多为学科内或特定视角的探索，本文则通过广泛的文献回顾和数据驱动方法，综合了来自不同学科的30个理论特征，构建了一个统一的、跨学科的关系概念表征空间。这是对之前碎片化研究的重大整合。
跨文化验证： 首次系统性地在全球19个多样化现代文化区域进行大规模数据收集和验证，并特别包含了非工业社会（摩梭族），极大地扩展了研究的广度，超越了传统研究的地域限制。
跨历史验证： 创新性地利用 PLM 和 LLM 分析古代文本语料库，将关系概念的考察从当代扩展到3000年的历史维度，揭示了关系概念随时间演变的动态性，这是前所未有的尝试。
数据驱动的普适模型： 提出了 FAVEE-HPP 模型，并通过严格的统计分析和模型比较，证明其在解释性、预测性能和跨文化、跨历史一致性方面均优于已有的15种理论，为社会科学提供了一个更具普适性和 parsimonious（简约性）的新工具。
定量化与计算化： 将人际关系概念化为一个可在多维空间中量化的结构，为社会科学研究提供了更客观、精确的计算框架，有助于未来的实证研究和应用。

4. 方法论

4.1. 方法原理

本研究的核心原理是，人类在心智中对人际关系存在一种共通的、结构化的概念表征。这种表征可以通过数据驱动的方法（如调查、认知任务和文本分析）从大规模的人类判断和语言使用中提取出来，并进一步归纳为少数几个核心维度和类别。研究通过跨文化、跨历史的比较，旨在验证这种结构是否具有普遍性，以及文化因素如何对其进行局部塑形。

该方法论分三个研究阶段展开：

研究1：构建统一表征空间 - 通过综合现有理论和实验数据，发现人际关系的五维 (FAVEE) 结构和三类 (HPP) 核心类别。
研究2：验证现代文化中的普遍性与变异性 - 在全球多地进行大规模在线调查，确认 FAVEE-HPP 模型的跨文化适用性，并探索文化变异的驱动因素。
研究3：验证古代文化中的时间持久性 - 利用 PLM 和 LLM 分析古代文本，考察 FAVEE-HPP 结构在历史上的持续存在。

4.2. 核心方法详解 (逐层深入)

4.2.1. 参与者与伦理

所有研究均获得北京师范大学机构审查委员会（ $IRB_A_0024_2021002$ ）批准，并获得所有参与者的知情同意。

4.2.2. 人际关系的抽样

本研究采用数据驱动的 NLP 方法生成了全面的人际关系列表。

种子词生成： 通过头脑风暴和社交媒体搜索，由美国（n=15）和中国（n=27）的参与者生成种子词。
词嵌入 (Text embedding)： 使用词嵌入来计算词向量之间的余弦距离 (cosine distance)，从而找到与种子词高共现的词汇。
筛选与配对： 筛选出名词，并进一步根据频率和人际关系相关性进行筛选。最后，根据关系的含义将词汇进行配对，并补充文献中的关系，得到最终的关系词列表（美国159个，中国258个）。

4.2.3. 评估特征

通过全面的文献检索，从15个著名的人际关系理论中总结和提取了30个概念特征。这些特征的冗余项进行了合并。例如，这些特征包括 活跃性 (activeness)、共同性 (communality)、具体性 (concreteness)、平等性 (equality)、持久性 (endurance)、正式性 (formality)、强度 (intensity)、亲密性 (intimacy)、互惠性 (reciprocity)、社会重要性 (societal importance)、社会情感性 (socio-emotionality)、独特性 (uniqueness)、情感价值 (valence) 和 可见性 (visibility) 等。研究2还增加了三个额外的理论特征：道德 (morality)、信任 (trust) 和 代沟 (generation gap)。

下图展示了从15个理论中总结出的30个概念特征：

该图像是论文中的复合图，包括a部分的成分主成分分析碎石图，b部分的关系特征与五个主维度的相关性气泡图，以及c部分展示关系类别（私人、公有、敌意）网络结构的圆形聚类图，揭示了人类关系的概念结构。

4.2.4. 维度调查 (Dimensional Survey)

任务描述： 参与者完成在线调查，在双极李克特量表 (bipolar Likert scales) 上评价人际关系。对于每个评估特征（例如，活跃性），参与者被要求在滑块上进行评分，滑块两端是相反的短语（例如，被动 (passive) 对 主动 (active)）。
特征定义： 为避免模糊性，每个特征都提供了详细定义和示例关系。
评分指导： 参与者被要求考虑关系的各个方面（思想、情感、行为、沟通），并基于一般知识或刻板印象进行评分，而非个人经验。
防疲劳设计： 采用被试间设计 (between-subject design)，每位参与者只对一部分关系和特征进行评分，以控制调查时长（约20分钟）。研究1中的离线参与者采用被试内设计 (within-subject design)，在实验室中对所有关系的所有特征进行评分（耗时3小时）。
注意力检查： 设有注意力检查问题，以确保在线参与者认真作答。
跨文化验证： 还通过询问常见物体的尺寸和颜色等问题，排除了跨文化数据质量和一般语义知识差异对结果的影响。

4.2.5. 认知任务 (Cognitive Tasks)

除了维度调查，还实施了两种实验室认知任务来衡量关系概念的分类：

多重排列任务 (Multi-arrangement task)： 参与者通过在2D电脑屏幕上拖放排列159种关系，使其距离反映概念上的相异性（概念越相似，距离越近）。
自由分类任务 (Free sorting task)： 参与者将相同的159种关系分类到自己选择的带标签的类别中（最多八个分组）。
文本分析： 对自由分类任务中参与者提供的类别标签进行文本分析，通过层次聚类 (hierarchical clustering) 揭示标签的层级结构。

4.2.6. 降维与聚类 (Dimensionality Reduction and Clustering)

数据预处理： 清理并组织所有数据。未通过注意力检查的参与者被排除（例如，研究1中排除23.29%的参与者，研究2中排除13.17%）。根据每个关系在每个评估特征上的平均评分，创建一个矩阵，并使用 scikit-learn 包进行归一化。
主成分分析 (PCA)：
- 核心应用： PCA 是主要的降维技术，用于推导所有维度模型。
- 旋转： 采用 方差最大化旋转 (varimax rotation)，使个体评估特征在主成分上具有最大载荷。
- 命名： 通过检查前五个最高载荷（绝对值）和关系分数的分布来命名成分。
- 最佳主成分数量确定： 采用四种数据驱动指标（平行分析 (parallel analysis)、Kaiser-Guttman 规则、Cattell 碎石检验 (Cattell's scree test) 和 最佳坐标 (optimal coordinates)）来确定最佳 PCA 组件数量，并结合解释性进行选择。
- 鲁棒性验证： 还使用其他降维技术（如 独立成分分析 (independent component analysis)、探索性因子分析 (exploratory factor analysis) 和 多维尺度分析 (multidimensional scaling)）验证 PCA 结果的鲁棒性，均得到相同的五因素解。
- FAVEE模型： 将这五维解命名为 FAVEE 模型（formality、activeness、valence、exchange 和 equality 的缩写）。
聚类 (Clustering)：
- 核心应用： k-means clustering 是主要的聚类技术，用于推导类别模型。
- 输入： 159个关系的相异性矩阵 (dissimilarity matrix)。
  - 维度调查： 使用关系在所有评估特征上的评分计算 欧氏距离矩阵 (Euclidean distance matrix)。
  - 多重排列任务： 直接从原始数据中提取距离矩阵。
  - 自由分类任务： 根据两个关系被分类到同一类别的概率计算距离矩阵。
- 预处理： 使用 UMAP 作为预处理步骤，以增强 k-means 聚类性能，通过设置 nearest neighbour (15) 和 minimum distance (0.01) 参数来生成更紧密的簇。
- 最佳聚类数量确定： 考虑 轮廓系数 (silhouette score)，并检查输出簇的稳定性和解释性。
- HPP模型： 最终识别出三个聚类，标记为 敌对 (hostile)、私人 (private) 和 公共 (public)，简称 HPP 模型。

4.2.7. 语言模型与嵌入 (Language Models and Embeddings)

现代汉语 PLM： 采用 UER-py Modelzoo 中的基于词的 Chinese-RoBERTa-Base 模型，该模型在大规模现代汉语语料库上预训练，并侧重于 mask language modelling 任务。
古代汉语 PLM： 采用 BERT-ancient-Chinese，该模型在包括周朝（公元前1046年）到清朝（公元1912年）的历史汉语文本的大规模古代汉语语料库上训练。
人际关系 PLM 嵌入生成流程 (Pipeline for generating PLM embeddings)： 本研究采用 Cutler 和 Condon 提出的方法生成类似人类的 PLM 嵌入，以探测古代人对人际关系的感知和理解。
1. 查询构造： 查询模板为 [DESC] The most salient feature of the relationship [TERM] is [MASK].（中文）。
  - [TERM]：替换为258个汉语关系词之一。
  - [DESC]：由 GPT-4 生成的关系特定描述，用于提供上下文框架。GPT-4 的温度参数设为零以确保可复现性。
  - [MASK]：PLM 预测在此位置最可能出现的词汇，代表目标关系的概念化。
2. 嵌入提取： 提取 PLM 在 [MASK] 位置的最后一层向量（768维度），为258个关系生成一个 $258 \times 768$ 的矩阵。
3. 最佳 PLM 嵌入识别： 通过系统测试不同查询类型、token 位置和与 RDM 的相关性，识别出最接近人类关系表征的 PLM 嵌入。
4. 古代文本语境适配： 对于古代 PLM，首先提示 GPT-4 在古代中国背景下描述关系。然后，招募古代汉语、文学和历史专家手动精炼这些描述，并用文言文表达，以确保 DESC 与古代语境匹配。专家还精心选择了120个存在于古代中国的关系。
  
  下图展示了生成 PLM 嵌入的流程：
  
  该图像是包含三部分的复合图表，展示了不同文化间人际关系的交叉区域可靠性。a部分为不同关系类型（依附、权力、交易、家庭、浪漫、敌对）的可靠性条形图；b部分展示敌对、公有和私人关系的可靠性小提琴图；c部分说明五个核心维度（正式性、活跃性、情感色彩、交换和平等）对应的可靠性分布。

4.2.8. `RSA` 与模型比较 (`RSA` and Model Comparison)

文化变量建模：
- 目的： 揭示哪些文化变量解释了关系表征中的跨文化差异。
- 方法： 进行了 RSA 多重回归。收集了来自 World Values Survey、Timeanddate、Worldbank 等多个开放数据库的文化变量（如语言、人格、社会生态、现代化、遗传、宗教、政治和 Hofstede 6D 文化模型）。
- RDM 计算： 为每个文化变量计算一个 RDM，其中每个单元格表示两个区域在该变量上的相异性。
- 回归分析： 将文化变量 RDM 作为预测因子，关系表征几何 RDM 作为结果变量，进行线性回归。
- 噪声上限 (Noise ceiling)： 通过使用 n-1 个区域的平均关系 RDM 预测剩余区域的关系 RDM 来估计，反映了关系 RDM 的内在异质性。
- 统计显著性： 使用 Mantel test 评估 RSA 的统计显著性。通过置换文化变量 RDM 的顺序10,000次来计算 $P$ 值。
模型比较：
- 目的： 比较 FAVEE 模型与其他现有理论在预测 PLM 嵌入方面的性能。
- 方法： 计算 PLM 嵌入（ $258 \times 768$ 或 $120 \times 768$ 矩阵）转换为余弦相似度矩阵（ $258 \times 258$ 或 $120 \times 120$ ）。这个相似度矩阵与从 FAVEE 维度（表示5D FAVEE 空间中关系对之间的距离）或 HPP 类别导出的 RDM 下三角部分进行 Spearman 相关。
- 噪声上限： 通过将从 FAVEE-HPP 模型导出的人类评分 RDM 与从33个维度特征导出的 RDM 进行相关来估计。

4.2.9. 鲁棒性测试 (Robustness Test)

为了量化模型在不同关系数量下的鲁棒性，研究移除人际关系并重新进行所有分析（如 PCA、聚类和跨文化 RSA）。移除的顺序是：将多重排列任务中相似度最高到最低的关系对进行排序，然后从每对中移除熟悉度较低的关系。通过计算全数据集和子集之间指标的 Pearson 相关系数来确定结果的鲁棒性。

4.2.10. 动力学图例

下图展示了人类关系的概念结构。它揭示了当人们思考社会关系时，会关注五个关键特征。一旦关系在某些特征维度上的空间接近度足够近，它们就可以自聚类为有意义的类别。关系类别从 FAVEE 维度上的不均匀分布中出现，并且关系分类法可以理解为存在于连续多维空间中的离散类别集。

$Fig. 5 | Validation of the FAVEE-HPP model in modern and ancient China using language models. a, Pipeline for generating PLM embeddings. The query (dashed box) was formulated as '\[DESC\] The most sali…$ 该图像是图表，展示了图5中FAVEE-HPP模型在现代和古代中国中的验证过程，包括生成PLM嵌入的流程、主成分分析与人类评分的相关性及模型泛化性。图b和c中展示了PCA载荷分数及其与人类评分和嵌入的对应关系，图d-f呈现了模型泛化性和古今差异的比较。

4.2.11. 非二元关系的泛化性 (Generalizability to non-dyadic relationships)

为了验证 FAVEE-HPP 模型在非二元关系中的泛化性，本研究还招募了380名美国在线参与者和242名中国在线参与者，测试了三元关系（例如，爱情三角形）和群体关系（例如，富人-穷人、民主党-共和党）的适用性。

下图展示了 FAVEE 模型对美国和中国非二元关系的良好泛化性：

该图像是一个示意图，展示了人类关系的五个维度（活动性、正式性、互惠性、平等性和情感价值）及其对应的私人和公共关系类别，图中还结合了动机、目标、情感和行为的分类，揭示了从敌对到文化人类关系的多层次结构。

5. 实验设置

5.1. 数据集

研究1：
- 关系列表： 159个典型的英语关系，包括常见关系（如 兄弟姐妹 (siblings)、朋友 (friends)、敌人 (enemies)）和不常见关系（如 主仆 (master-servant)、炮友 (friends with benefits)）。
- 特征： 30个来自15个现有理论的概念特征。
研究2：
- 关系列表：
  - 对159个英语关系进行翻译，用于全球19个地区的调查。
  - 另外，通过中文 NLP 算法生成了258个新的中文关系列表，其中包括许多中国特有的关系，用于中美对比研究。
  - 为摩梭文化识别出75个典型关系。
- 文化变量： 收集了来自多个开放数据库（如 World Values Survey、Timeanddate、Worldbank）的语言、人格、社会生态（生计方式、历史疾病流行、气候）、现代化、遗传、宗教、政治和 Hofstede 6D 文化模型等数据。
研究3：
- 关系列表： 258个中文关系（用于现代 PLM）。120个由专家选择的古代中国关系（用于古代 PLM）。
- 语料库： 现代中文 PLM 训练于大规模现代汉语语料库。古代中文 PLM (BERT-ancient-Chinese) 训练于包括周朝（公元前1046年）到清朝（公元1912年）的历史汉语文本的大规模古代汉语语料库。

5.2. 评估指标

本研究使用了多种统计指标来评估模型的性能、结果的鲁棒性和跨文化、跨历史的相似性。

Pearson 相关系数 (Pearson's correlation coefficient, $r$ )：
1. 概念定义： 衡量两个变量之间线性关系强弱和方向的统计量。 $r$ 值介于-1到1之间，其中1表示完全正相关，-1表示完全负相关，0表示没有线性关系。
2. 数学公式： $r = \frac{\sum_{i=1}^{n}(x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\sum_{i=1}^{n}(x_i - \bar{x})^2 \sum_{i=1}^{n}(y_i - \bar{y})^2}}$
3. 符号解释：
  - $n$ ：样本数量。
  - $x_i$ ：第 $i$ 个观测值的变量 $X$ 的值。
  - $\bar{x}$ ：变量 $X$ 的样本均值。
  - $y_i$ ：第 $i$ 个观测值的变量 $Y$ 的值。
  - $\bar{y}$ ：变量 $Y$ 的样本均值。
4. 应用： 用于衡量 PCA 组件的鲁棒性（例如，子样本与整体数据集评分和载荷的相关性）、跨文化表征几何的相似性、PLM 嵌入与人类评分的相似性等。
调整后的决定系数 (Adjusted R-squared, $R^2_{adj}$ )：
1. 概念定义： R-squared 衡量回归模型对因变量方差的解释比例。Adjusted R-squared 是 R-squared 的修正版本，它考虑了模型中预测变量的数量，因此在比较包含不同数量预测变量的模型时更可靠，因为它不会仅仅因为增加了预测变量就增加。
2. 数学公式： $R^2_{adj} = 1 - \frac{(1 - R^2)(n - 1)}{n - k - 1}$
3. 符号解释：
  - $R^2$ ：原始的决定系数。
  - $n$ ：样本数量。
  - $k$ ：模型中预测变量的数量。
4. 应用： 用于模型比较分析，评估不同理论模型解释数据方差的能力。
贝叶斯信息准则 (Bayesian Information Criterion, BIC)：
1. 概念定义： BIC 是一个模型选择标准，用于在模型复杂度和模型拟合优度之间进行权衡。BIC 值越小，表示模型越好。它对模型的复杂性进行惩罚，更倾向于选择更简单的模型。
2. 数学公式： $\text{BIC} = k \ln(n) - 2 \ln(\hat{L})$
3. 符号解释：
  - $k$ ：模型中参数的数量。
  - $n$ ：样本数量。
  - $\hat{L}$ ：估计模型的最大似然值。
4. 应用： 用于模型比较分析，评估模型的拟合优度和简约性。
F 统计量 (F-statistic)：
1. 概念定义： $F$ 统计量主要用于方差分析 (ANOVA) 或回归分析中，检验两个或多个组的均值是否存在显著差异，或者回归模型整体是否具有显著性。
2. 数学公式 (回归分析为例)： $F = \frac{\text{解释方差}}{\text{未解释方差}} = \frac{(\text{RSS}_0 - \text{RSS}_1)/(\text{df}_0 - \text{df}_1)}{\text{RSS}_1/\text{df}_1}$
3. 符号解释：
  - $\text{RSS}_0$ ：零模型的残差平方和。
  - $\text{RSS}_1$ ：备择模型的残差平方和。
  - $\text{df}_0, \text{df}_1$ ：相应模型的自由度。
4. 应用： 用于 RSA 多重回归中，评估预测变量对关系表征几何的解释能力是否具有统计显著性。
P 值 (P-value)：
1. 概念定义： 在假设检验中， $P$ 值是当原假设为真时，观察到当前数据（或更极端数据）的概率。通常， $P$ 值小于0.05被认为是具有统计显著性的。
2. 应用： 用于判断各种统计检验（如相关性、回归系数、均值差异）的结果是否具有统计显著性。
Cohen's d：
1. 概念定义： Cohen's d 是一种效应量 (effect size) 指标，用于衡量两个群体平均值之间的标准化差异，而不受样本量大小的影响。它表示两个均值之间的差异以标准差为单位的量。 $d$ 值通常被解释为：0.2（小效应），0.5（中等效应），0.8（大效应）。
2. 数学公式 (两独立样本 t 检验为例)： $d = \frac{\bar{x}_1 - \bar{x}_2}{s_p}$
3. 符号解释：
  - $\bar{x}_1, \bar{x}_2$ ：两个组的样本均值。
  - $s_p$ ：合并标准差 (pooled standard deviation)。
4. 应用： 用于量化不同关系类别之间文化变异性的差异大小。
Spearman 相关系数 (Spearman's rank correlation coefficient, $\rho$ )：
1. 概念定义： 衡量两个变量之间排序关系强弱和方向的非参数指标。它不假设变量之间的关系是线性的，只关注它们的等级顺序是否一致。
2. 数学公式： $\rho = 1 - \frac{6 \sum d_i^2}{n(n^2 - 1)}$
3. 符号解释：
  - $d_i$ ：第 $i$ 个数据点在两个变量中的等级差异。
  - $n$ ：数据点的数量。
4. 应用： 用于衡量语言模型嵌入 RDM 与人类评分 FAVEE-HPP 模型 RDM 之间的相关性。
轮廓系数 (Silhouette score)：
1. 概念定义： 轮廓系数 是一种衡量聚类结果质量的指标。它评估一个对象与其自身簇的相似程度（内聚性）以及与其他簇的相异程度（分离性）。系数范围从-1到1，值越高表示聚类效果越好。接近1表示对象很好地聚类，接近0表示对象位于两个簇的边界，接近-1表示对象可能被分配到错误的簇。
2. 数学公式： 对于每个样本 $i$ ： $s(i) = \frac{b(i) - a(i)}{\max(a(i), b(i))}$
3. 符号解释：
  - a(i)：样本 $i$ 到其自身簇中所有其他点的平均距离（内聚性）。
  - b(i)：样本 $i$ 到所有其他簇中点的平均距离的最小值（分离性）。
  - s(i)：样本 $i$ 的轮廓系数。
4. 应用： 用于确定 k-means 聚类的最佳簇数量，评估聚类结果的稳定性。

5.3. 对比基线

在模型比较分析中，本文将提出的 FAVEE 模型与15种现有的人际关系理论进行了对比。这些理论包括在 3.2. 前人工作 中提及的社会学、人类学、认知心理学和传播学领域的理论。选择这些理论作为基线是因为它们代表了社会科学领域中对人际关系结构理解的主要尝试。通过比较，可以验证 FAVEE 模型在解释性、预测性能和跨文化一致性方面的优越性。

6. 实验结果与分析

6.1. 核心结果分析

6.1.1. 研究1：跨学科统一表征空间 (Study 1: a unified representational space across disciplines)

五维FAVEE模型： 通过对30个理论特征进行 PCA，提取出5个潜在维度，解释了82.14%的方差。这五个维度被命名为：
1. 正式性 (Formality)： 对比正式、职业、公开可见（如同事、军官-士兵）与非正式、社会情感、私人关系（如父母-婴儿、夫妻）。
2. 活跃性 (Activeness)： 对比亲密关系（如夫妻、兄弟姐妹）与疏远关系（如远亲、陌生人），高载荷项包括 活跃性 (activeness)、同步性 (synchronicity) 和 空间距离 (spatial distance)。
3. 情感价值 (Valence)： 对比友好、和谐、团结（如教会成员、作家-读者）与冲突、敌对、对抗关系（如霸凌者-受害者、奴隶主）。
4. 交换性 (Exchange)： 区分交换具体资源（如金钱、商品、服务，例如经销商-买家、妓女-客户）与交换象征性、无形资源（如信息、爱、身份，例如名人-黑粉、兄弟姐妹）的关系。
5. 平等性 (Equality)： 区分权力平等（如体育竞争对手、笔友）与权力不平等（如人-神、政治家-支持者）的关系。
三大HPP类别和六种典型关系类型：
- 通过对维度调查结果进行聚类，发现了“敌对 (Hostile)”、“私人 (Private)”和“公共 (Public)”三大类别（HPP 模型）。
- 进一步通过认知任务（多重排列任务和自由分类任务）发现，这三大类别可以细分为六种典型的关系类型：敌对 (hostile)、家庭 (familial)、浪漫 (romantic)、亲和 (affiliative)、交易 (transactional) 和权力 (power)。
- HPP 类别与 FAVEE 维度紧密相关：私人和公共关系分别位于 正式性 维度的两端，而 情感价值 维度低分的关系构成了敌对类别。这表明 HPP 类别可能起源于 FAVEE 维度。
  
  下图展示了五维FAVEE模型和30个理论特征的PCA载荷。
  
  该图像是一张图表，展示了论文中五维人际关系模型（FAVEE模型）中30个理论特征的主成分分析（PCA）载荷。图中气泡大小和颜色分别表示特征的载荷大小和正负值，横轴代表五个维度：正式性、主动性、情感价值、交换性和平等性。

下图展示了关系的分类和维度表示。

Fig. 4 | Comparisons between the USA and China. a, Similar PCA loadings for the two countries. b, Correlation of relationship scores between the two countries. The high concordance of PCA loadings (a… 该图像是论文中图4的图表，展示了美国与中国在关系概念上的比较，包含主成分分析（PCA）加载量、关系得分的相关性，以及近亲、权力和远距离恋爱关系的心理和物理距离、平等与交换维度的矩阵和箱线图，体现了两国在人际关系认知上的异同。

6.1.2. 研究2：现代文化中的普遍性与变异性 (Study 2: universality and variability across modern cultures)

FAVEE-HPP模型的跨文化普遍性： 在全球19个现代文化区域的大规模在线调查中，再次识别出 5D FAVEE 空间和3个 HPP 类别。通过留一区域交叉验证 (leave-one-region-out cross-validation)，各区域独特的表征几何形状可以被聚合数据准确预测，表明 FAVEE 和 HPP 模型是可泛化到全球的关系概念普遍结构。
超越现有理论： FAVEE 模型在数据拟合和解释方差方面优于其他15种现有理论，且在跨全球区域表现一致，是当前最具代表性、简约性和一致性的模型。
- 下图展示了模型比较在性能一致性方面的结果：
  
  该图像是论文中的图3，包含四部分内容：(a)展示了模型比较的线性回归流程图；(b)(c)分别为不同模型的调整后的决定系数和贝叶斯信息准则的条形图；(d)展示了多个国家模型表现的排名列表。
文化变异性与驱动因素： 尽管基本组织结构普遍共享，但存在丰富的文化变异性。
- 关系类型差异： 公共关系概念的文化变异性大于敌对和私人关系概念。而家庭和浪漫关系具有最低的跨区域变异性。
- 驱动因素： RSA 多重回归分析显示，宗教 (religion) 和 现代化水平 (modernization) 是唯一能显著预测表征几何跨区域变异的两个因素。具有相似宗教和现代化水平的区域，其关系表征几何也相似。
- 下图展示了关系表征几何的普遍性与文化变异性：
  
  该图像是论文中的复合图表，展示了跨19个全球地区模型的泛化能力、不同预测文化变量对代表性几何模型的回归系数影响，以及宗教和现代化对跨区域代表性几何体相似度的相关分析。
  
  该图像是包含三部分的复合图表，展示了不同文化间人际关系的交叉区域可靠性。a部分为不同关系类型（依附、权力、交易、家庭、浪漫、敌对）的可靠性条形图；b部分展示敌对、公有和私人关系的可靠性小提琴图；c部分说明五个核心维度（正式性、活跃性、情感色彩、交换和平等）对应的可靠性分布。
中美对比：
- FAVEE空间共享： 中美两国在 PCA 载荷和关系分数上高度一致，表明共享 FAVEE 空间。
- 亲密关系认知： 美国人似乎更关注物理距离来理解亲密关系，而中国人则同时考虑心理距离和物理距离。例如，中国人认为“祖先-后代”的关系不那么遥远，因为儒家文化中有祖先崇拜，存在高度的精神亲密性。
- 权力关系认知： 中国人在家庭成员（如叔叔-侄子）之间对不平等的刻板印象更强，这与儒家孝道观念一致。
- 社会交换认知： 在私人关系中，美国人似乎比中国人经历更多具体的资源交换，这可能与更高的现代化水平或资本主义价值观相关。例如，美国异地恋人常送礼物，而中国异地恋人则多进行长时间的电话交流等象征性交换。
- 下图展示了美国与中国的关系概念化比较：
  
  该图像是论文中图4的图表，展示了美国与中国在关系概念上的比较，包含主成分分析（PCA）加载量、关系得分的相关性，以及近亲、权力和远距离恋爱关系的心理和物理距离、平等与交换维度的矩阵和箱线图，体现了两国在人际关系认知上的异同。
非工业社会验证： 在中国摩梭族（母系氏族社会）的田野调查数据也证实，摩梭文化在理解关系时仍符合 FAVEE-HPP 结构，与汉族和世界其他工业社会表现出高度相似的表征几何。

下图展示了摩梭社会关键特征以及摩梭、汉族和全球平均数据在 FAVEE 维度上的 PCA 载荷。

该图像是论文中关于中国摩梭族以及全球不同文化中人际关系概念结构的综合图表，包含地点地图(a)、维度相关性热图(b、d)、统计分析图(c)、关系类别树状图(e)及三维关系空间图(f)。其中展示了五个主维度（形式性、活跃性、情感价值、交换和平等）与三类核心关系（敌对、公共和私人）的认知结构。

下图展示了“邻居”概念在全球范围内的概念差异。

该图像是论文中图4的图表，展示了不同国家邻居关系的概念认知差异。a部分为邻居关系的正式性与活跃度随现代化水平变化的散点图及回归线，b部分为中国、以色列和美国邻居群体的t-SNE低维聚类及其正式性得分词汇分布。

6.1.3. 研究3：古代文化中的关系表征 (Study 3: relationship representations in ancient cultures)

语言模型反映人类理解： 研究通过 PLM 嵌入验证了语言模型能够生成类似人类的关系理解，并且在历史背景下具有专业知识（与专家评分而非非专家评分高度一致）。
FAVEE-HPP模型在古代文化中的泛化性： 在古代汉语 PLM 嵌入中识别出了 FAVEE 结构，并且 FAVEE 维度和 HPP 类别与人类评分的 RDM 之间存在显著相关性，表明 FAVEE-HPP 模型可以捕获历史上的关系表征。
古今关系概念的差异：
- 正式性 (Formality)： 正式性 在现代关系表征中解释的方差更多（现代0.279，古代0.178）。
- 平等性 (Equality)： 平等性 在古代关系表征中解释的方差更多（现代0.148，古代0.243）。
- 这表明与现代中国人相比，古代中国人可能在理解关系时更注重 平等性 特征（如社会等级），而较少关注 正式性 特征（如职业）。

6.2. 数据呈现 (表格)

以下是原文 Extended Data Table 1 的结果：

Main Analysis	Representational Geometry Models
Main Analysis			Full-feature Model Dimensional Model Categorical Model
Predictors	β	p	β	p	β	p
Climates	0.163	0.180	0.167	0.200	0.146	0.154
Demographics	-0.052	0.591	-0.003	0.469	-0.323	0.996
Disease	0.004	0.499	-0.025	0.609	-0.012	0.555
Gene	-0.056	0.568	-0.157	0.740	-0.052	0.574
Geography	-0.213	0.924	-0.197	0.896	-0.205	0.936
Hofstede6D	-0.147	0.810	-0.178	0.857	-0.097	0.746
Language	0.005	0.498	-0.107	0.667	0.189	0.208
Modernization	0.347	0.022	0.274	0.048	0.245	0.047
Personality	0.133	0.204	0.170	0.191	0.062	0.295
Politics	-0.125	0.820	-0.122	0.818	-0.077	0.730
Religion	0.561	0.014	0.601	0.011	0.299	0.109
Subsistence	-0.079	0.698	-0.029	0.563	-0.004	0.491
Adjusted R-squared	0.561		0.532		0.267
Follow-up Analysis	Representational Geometry Models
Follow-up Analysis			Full-feature Model Dimensional Model Categorical Model
Predictors	β	p	β	p	β	p
Climates	0.198	0.156	0.188	0.181	0.182	0.120
Demographics	0.035	0.395	0.063	0.332	-0.278	0.986
Disease	-0.014	0.575	-0.027	0.632	-0.052	0.729
Education	0.123	0.203	0.122	0.207	0.032	0.366
Gene	-0.139	0.700	-0.23	0.839	-0.065	0.598
Geography	-0.122	0.776	-0.127	0.790	-0.164	0.891
Hofstede6D	-0.087	0.700	-0.125	0.773	-0.09	0.728
Language	0.091	0.369	-0.047	0.573	0.238	0.154
Personality	0.146	0.188	0.188	0.177	0.05	0.321
Politics	-0.078	0.716	-0.083	0.730	-0.063	0.691
Religion	0.317	0.109	0.419	0.048	0.177	0.223
Subsistence	-0.045	0.614	-0.005	0.502	0.023	0.413
Urbanization	0.445	0.018	0.326	0.050	0.307	0.044
Wealth	-0.072	0.693	-0.077	0.708	0.08	0.241
Object knowledge	0.017	0.439	0.056	0.359	-0.098	0.749
Adjusted R-squared	0.618		0.559		0.299

分析：
- 在主要分析中，现代化 (Modernization) 和 宗教 (Religion) 两个因素在预测 Full-feature Model 和 Dimensional Model 的表征几何变异性时表现出显著的 $p$ 值（小于0.05），这表明它们是影响跨文化关系概念化的关键驱动因素。
- 在 Categorical Model 中，现代化 仍然显著，但 宗教 不显著。
- Adjusted R-squared 显示，Full-feature Model 和 Dimensional Model 对文化变异的解释力较强（分别为0.561和0.532）。
- 在后续分析中，城市化 (Urbanization) 成为一个显著的预测因素，并且在 Full-feature Model、Dimensional Model 和 Categorical Model 中都表现出显著性。这表明 城市化 作为 现代化 的一个组成部分，在塑造关系概念方面也扮演着重要角色。
- 对象知识 (Object knowledge) 的 $p$ 值始终很高，表明其与关系理解的文化变异性无关，从而排除了数据质量或一般语义知识差异对研究结果的影响。

6.3. 消融实验/参数分析

不同降维技术的鲁棒性： 研究在 PCA 之外，还评估了 独立成分分析 (independent component analysis)、探索性因子分析 (exploratory factor analysis) 和 多维尺度分析 (multidimensional scaling) 等其他降维技术，结果均得到相同的五因素解（参考 Supplementary Fig. 3），这验证了 FAVEE 模型潜在因素解决方案的鲁棒性。
聚类算法的鲁棒性： 除了 k-means 聚类，研究还进行了 层次聚类 (hierarchical clustering) 和 HDBSCAN 等其他聚类技术，以验证 k-means 结果的稳定性。
关系数量的鲁棒性测试： 研究量化了在不同关系数量下的鲁棒性，通过每次移除一个关系并重新执行所有分析。结果显示，少至40个关系子集也能很好地复现基于159个关系的所有发现（参考 Supplementary Fig. 11），这表明模型的发现对关系的具体选择具有很强的鲁棒性。
PILOT研究： 在正式研究前，进行了 pilot study（n=721），结果完全复制了 Wish et al. (1976) 的发现。通过 Monte Carlo 模拟测试，确定每个条件所需的最小响应数，发现10个响应的子样本几乎与整个数据集相同（评分相关性 $r > 0.95$ ），足以确保高度相似的 PCA 组件。

7. 总结与思考

7.1. 结论总结

本研究通过对全球20,427名现代文化参与者和跨越3000年历史的古代文本进行大规模数据分析，成功构建了一个统一的人际关系概念框架——FAVEE-HPP 模型。该模型包含五个核心维度：正式性 (Formality)、活跃性 (Activeness)、情感价值 (Valence)、交换性 (Exchange) 和 平等性 (Equality)，以及三个核心类别：敌对关系 (Hostile)、公共关系 (Public) 和 私人关系 (Private)。

研究证实了 FAVEE-HPP 框架在现代社会（包括非工业社会摩梭族）和古代文化中的普遍适用性，并在模型性能上优于现有15种理论。同时，研究也揭示了文化因素（如宗教和现代化水平）如何塑造关系概念的具体差异，例如中美两国在亲密关系和权力关系认知上的细微差别，以及古代中国人在关系中对平等性的更高关注。这项工作不仅填补了人际关系研究中缺乏统一框架和跨文化/历史验证的空白，也为社会科学提供了一个可量化、可计算的分析工具，极大地推进了我们对人类社会性的理解。

7.2. 局限性与未来工作

论文作者指出了以下局限性：

仅触及外显理论： 本研究主要关注外显理论 (lay theory)（即人们口头表达的信念），可能与人际关系在社会中的实际组织方式存在差异。未来工作需要进一步考察关系中的社会行为和互动。
FAVEE-HPP的普遍性并非定论： 尽管结果显示出高度普遍性，但本研究主要依赖在线人群和数据驱动方法，这可能是一把双刃剑。需要更多数据和研究来探索可能影响 FAVEE-HPP 模型稳定性、有效性、代表性和泛化性的因素或边界条件。
维度排序问题： 尽管模型名称采用 FAVEE，但全球数据显示 正式性 并非总是最重要的维度。不同区域维度排序的差异值得进一步深入研究，这可能揭示有趣的文化差异。
分类学的科学严谨性： FAVEE-HPP 模型是从普通语言中的理论特征中分解出来的，需要更科学严谨的方法来创建有效可靠的人际关系分类学。
古代文化研究的局限性： 受限于古代文化专家和高质量 PLM 资源的限制，研究3仅考察了古代中国。未来研究应在其他历史背景下（如希伯来、希腊、泰米尔和古英语文化）验证 FAVEE-HPP 模型。

7.3. 个人启发与批判

个人启发：
- 统一框架的强大： 本研究在整合多学科碎片化知识方面做出了杰出贡献。FAVEE-HPP 模型提供了一个简洁而强大的认知工具，可以跨越文化和时间来理解人际关系，这对于社会学、心理学乃至跨文化交流都具有深远意义。它像一面“关系罗盘”，可以帮助个体导航复杂的社会环境。
- 计算方法的潜力： 引入 NLP 和 LLM 分析古代文本，为历史学和文化研究提供了新的范式。这种将人文社科的抽象概念通过计算方法进行量化和验证的能力，展示了人工智能在交叉学科研究中的巨大潜力。
- 普遍性与特殊性的辩证： 研究成功地平衡了普遍性（FAVEE-HPP 核心结构）和文化特殊性（由宗教和现代化塑造的局部差异），这对于理解人类行为的复杂性至关重要。
- 对人工智能伦理的思考： 如果 LLM 能够“理解”甚至预测人际关系，那么在社交机器人、心理咨询AI等领域的应用，其伦理边界和潜在影响需要更深入的探讨。AI如何学习和复制人类关系中的文化细微差异，以及如何避免偏见，将是重要挑战。
批判：
- “心智代理”的局限性：尽管论文通过验证 PLM 嵌入与人类评分的相似性来支持其作为“人类心智代理”的说法，但语言模型毕竟是统计模式的捕获者，它们是否真正“理解”了情感、意图和关系中的道德维度，仍是一个哲学和科学上的开放问题。模型可能捕获了语言表层结构，但深层认知机制仍需谨慎解释。
- 现代化与宗教的解释力： 论文发现现代化和宗教是影响文化变异性的重要因素。虽然数据支持这一结论，但对于“为什么”这两个因素如此关键，以及它们具体如何通过何种机制（例如，现代化对个人主义的影响，宗教对集体主义的塑造）来影响关系概念化，可以进行更深入的理论阐述。
- 抽样偏差的潜在影响： 尽管采用了大规模样本并进行了鲁棒性测试，但大部分现代数据仍然来自在线平台（如 MTurk），这可能导致样本代表性存在偏差，尤其是在全球范围内。未来需要更多元化的数据来源来进一步巩固结论。
- “关系分类学”的完善：论文也指出了需要更严谨的科学方法来创建关系分类学。FAVEE-HPP 作为一个重要的起点，未来可以探索其与现有心理测量学工具的结合，开发出类似“大五人格”的标准化关系评估量表，以应用于个体差异研究和临床实践。

相似论文推荐

基于向量语义检索推荐的相关论文。

暂时没有找到相似论文。