摘要

We describe a parser of English effectuated by biologically plausible neurons and synapses, and implemented through the Assembly Calculus, a recently proposed computational framework for cognitive function. We demonstrate that this device is capable of correctly parsing reasonably nontrivial sentences. While our experiments entail rather simple sentences in English, our results suggest that the parser can be extended beyond what we have implemented, to several directions encompassing much of language. For example, we present a simple Russian version of the parser, and discuss how to handle recursion, embedding, and polysemy.

1. 论文基本信息

1.1. 标题

一种生物学上合理的句法分析器 (A Biologically Plausible Parser)

1.2. 作者

Daniel Mitropolsky: 哥伦比亚大学计算机科学系。
Michael J. Collins: Google Research，著名自然语言处理专家。
Christos H. Papadimitriou: 哥伦比亚大学计算机科学系，算法博弈论和计算复杂性领域的顶级学者。

1.3. 发表期刊/会议

该论文发布于 arXiv 预印本平台（2021年），后在相关神经计算与认知科学研讨会中引起广泛讨论。其核心理论基础“集合演算 (Assembly Calculus)”发表于美国国家科学院院刊 (PNAS)。

1.4. 发表年份

2021年

1.5. 摘要

本文描述了一种由生物学上合理的 神经元 (Neurons) 和 突触 (Synapses) 实现的英语句法分析器。该系统通过 集合演算 (Assembly Calculus, AC) 实现，这是一种最近提出的用于认知功能的计算框架。作者证明了该设备能够正确解析相当复杂的句子。虽然实验目前主要针对简单的英语句子，但结果表明，该分析器可以扩展到俄语等其他语言，并能处理递归、嵌入和多义词等复杂语言现象。

1.6. 原文链接

arXiv: https://arxiv.org/abs/2108.02189v1
PDF: https://arxiv.org/pdf/2108.02189v1.pdf
发布状态: 预印本 (Preprint)

2. 整体概括

2.1. 研究背景与动机

语言 (Language) 是人类独有的高级认知功能，涉及层级结构信息的创建与理解。科学界普遍承认语言是由神经元和突触的活动实现的，但具体机制（即单个神经元的电生理活动如何产生复杂的语法结构）仍是一个巨大的谜团。

当前研究面临两大挑战：

神经科学的局限: 现有研究多集中在动物的感官和运动功能，缺乏能够解释高级认知功能（如语言）涌现的高层级计算模型。
计算模型的断层: 现有的计算语言学模型（如深度学习中的 Transformer）虽然性能强大，但由于使用了反向传播等算法，被认为在生物学上是不合理的（即大脑中不存在这种机制）。

本文的切入点: 利用 集合演算 (Assembly Calculus) 这一桥梁，试图证明仅使用符合生物学特征的神经元动态（如赫布可塑性、抑制机制），也能构建出一个功能完备的句法分析器。

2.2. 核心贡献/主要发现

存在性证明: 首次证明了可以通过模拟的神经元和突触活动，实现复杂的语言处理任务—— 依存句法分析 (Dependency Parsing)。
生物学合理性: 该分析器完全基于 集合 (Assembly) 的操作。集合是大脑中代表对象、单词或思想的大规模互连神经元组，被认为是认知计算的“字母表”。
计算效率: 模拟显示，解析速度（神经元放电周期）与人类语言器官的处理速度高度吻合（约 0.2-0.5 秒/词）。
跨语言潜力: 证明了该架构不仅适用于英语，还能通过调整“词汇动作”来处理俄语等具有自由语序的语言。

3. 预备知识与相关工作

3.1. 基础概念

生物学合理性 (Biologically Plausible): 指计算模型的设计遵循大脑已知的解剖学和生理学规律，例如神经元只通过脉冲传递信息，突触权重的改变遵循局部规则（如赫布定律），而非全局优化算法。
集合 (Assembly): 由神经科学家赫布 (Hebb) 在1949年提出，指同一脑区内高度互连的一组兴奋性神经元。当这些神经元同步放电时，就代表了一个特定的概念（如“苹果”或“主语”）。
赫布可塑性 (Hebbian Plasticity): 大脑学习的基础。简单来说就是“神经元同步放电，连接加强 (Neurons that fire together, wire together)”。

3.2. 核心计算框架：集合演算 (Assembly Calculus, AC)

理解本文的关键在于 AC 框架。它描述了一个包含多个脑区的动力系统：

随机连接: 脑区内部和脑区之间存在随机的、有向的连接。
k-优胜者通吃 (k-Winner-Take-All): 在每一个时间步，由于局部抑制神经元的存在，一个脑区中只有突触输入最强的 $k$ 个神经元会放电。
投影 (Projection): 当脑区 A 的一个集合放电时，会激活脑区 B 中与之连接的神经元，经过几轮迭代和突触权重增加，脑区 B 会形成一个新的稳定集合。

3.3. 相关工作与技术演进

在计算心理学领域，先前的工作（如 Jurafsky 的概率解析或现代神经网络解析器）大多是在 马尔的算法层级 (Marr's Algorithmic Level) 进行描述，即使用高级编程语言编写算法。而本文是在更底层的 实现层级 (Implementation Level) 工作，探讨神经元硬件如何跑通这些算法。

4. 方法论

4.1. 脑动力学模型

分析器运行在一个离散时间的动力系统中（每个时间步约 20 毫秒）。系统由 $a$ 个脑区组成，每个区域包含 $n$ 个兴奋性神经元。

4.1.1. 神经元放电与输入计算

在时间步 $t$ ，对于脑区中的每一个神经元 $i$ ，其接收到的 突触输入 (Synaptic Input) $SI_i^t$ 计算公式如下： $SI_i^t = \sum_{(j, i) \in E, f_j^t = 1} w_{ji}^t$ 符号解释:

$E$ : 神经元连接的边集合。
$f_j^t$ : 时间 $t$ 时神经元 $j$ 的放电状态（1 为放电，0 为不放电）。
$w_{ji}^t$ : 从突触前神经元 $j$ 到突触后神经元 $i$ 在时间 $t$ 的突触权重。

4.1.2. 激活规则 (k-Winner-Take-All)

神经元在 $t+1$ 时刻是否放电 $f_i^{t+1}$ 取决于它是否属于输入前 $k$ 名：

如果 $SI_i^t$ 位于所在区域前 $k$ 个最大值中，则 $f_i^{t+1} = 1$ ；否则为 0。

4.1.3. 突触权重更新 (可塑性规则)

权重更新遵循增强的赫布定律： $w_{ij}^{t+1} = w_{ij}^t (1 + f_i^t f_j^{t+1} \beta)$ 符号解释:

$\beta$ : 可塑性参数（学习率），表示权重增加的比例。
该公式意味着：只有当突触前神经元 $i$ 在 $t$ 时刻放电，且突触后神经元 $j$ 在紧接着的 $t+1$ 时刻放电时，权重才会增加。

4.2. 分析器架构

分析器由多个相互连接的脑区组成，每个区域对应一个语法角色：

LEX (词汇区): 存储单词的集合。每个单词对应一个独特的神经元集合 $x_w$ 。
语法角色区: 包括 SUBJ (主语)、VERB (谓语)、OBJ (宾语)、DET (限定词)、ADJ (形容词) 等。
纤维 (Fibers): 连接脑区的突触束。它们可以被 抑制 (Inhibit) 或 去抑制 (Disinhibit)，从而控制信息的流动。

4.3. 词汇动作 (Word Actions)

这是本文的创新点。每个单词集合 $x_w$ 在激活时，会触发特定的神经控制信号，称为 动作 ( $\alpha_w$ )。这些动作由两类指令组成：

预指令 (Pre-commands): 在投影前执行，用于打开或关闭特定的脑区或纤维。
后指令 (Post-commands): 在投影后执行。

示例：及物动词 "saw" 的动作分析

Pre-commands: 去抑制 LEX 到 VERB 的纤维，去抑制 SUBJ 到 VERB 的纤维。这允许当前单词与之前的主语在 VERB 区进行“融合”。
Post-commands: 去抑制 OBJ 区域，因为它预见到后面会出现一个宾语。

4.4. 解析算法流程

解析过程是增量式的（逐词处理）：

词汇激活: 为输入的单词 $w$ 激活 LEX 中的集合 $x_w$ 。
执行预指令: 调整脑区间的“闸门”。
强投影 (Strong Project, project*): 这是一个系统级的操作。所有去抑制的区域会通过去抑制的纤维相互影响，直到神经元放电状态达到稳定。这对应于在语法区域中创建或关联新的集合。
执行后指令: 为下一个单词做准备。

5. 实验设置

5.1. 数据集与样本

由于这是一个原型验证实验，作者手工设计了 200 个英语句子，涵盖了 20 种句法模式。

样本示例:

D N V D N: "the man saw the woman" (限定词-名词-动词-限定词-名词)
ADJ N V N: "cats hate loud noises" (形容词-名词-动词-名词)
${D} N V-INTRANS PP$ : "the boy went to school" (限定词-名词-不及物动词-介词短语)

5.2. 评估方法

实验通过 读取 (Readout) 算法验证解析的正确性。

5.2.1. 读取算法原理

解析完成后，语法结构隐含在各脑区间的突触连接权重中。读取算法会：

从 VERB 区的集合出发。
尝试通过权重探测关联的区域（如 SUBJ 或 OBJ）。
将这些关联投射回 LEX 区域，还原出对应的单词及其依存关系。

5.3. 俄语实验

为了验证通用性，作者测试了俄语。俄语具有自由语序，例如“女人给男人包”这句话的 24 种排列在俄语中都是合法的。作者通过改变词汇动作（基于俄语的格变化而非语序）成功解析了这些句子。

6. 实验结果與分析

6.1. 核心结果分析

所有的 200 个句子均被正确解析。这意味着基于集合演算的动力系统能够：

稳定性: 在处理复杂序列时，神经放电不会陷入混乱，而是能收敛到稳定的集合。
结构性: 能够通过突触权重的改变，在物理上存储“谁是谁的主语”这种抽象关系。

6.2. 解析过程追踪

下图（原文 Figure 2）展示了句子 "the man saw a woman" 的解析追踪：

$Figure 2: Trace of the Parser for the sentence "the man saw a woman". The action $\\alpha _ { i }$ of each word is given beneath aue howi he stat the Par er her-d an projechavc or hat worGre r ndaci ro the one in LEX labeled `x _ { w }` ). Purple dotted arrows indicate assemblies that have been connected; one can fire to activate the other. Purple arrows to LEx are shown only in the stage in which they are created. Green $( \\bigcirc )$ and red $( \\oslash )$ circles indicate areas or fibers that will be disinhibited/inhibited by the Post-commands.$

详细解读:

当输入 "the" 时，DET 区域被激活并准备好连接后续名词。
输入 "man" 时，LEX 将信息投射到 SUBJ。由于之前 DET 已激活，SUBJ 形成了代表 "the man" 的复合集合。
输入 "saw" 时，VERB 区域激活。注意图中紫色虚线，它表示 SUBJ 和 VERB 之间建立了突触连接。
最后输入 "woman" 时，OBJ 被激活，并与 VERB 建立连接。

6.3. 错误检测 (Error Detection)

系统表现出了类似人类的“语法不适感”：

空投影错误 (Empty-project Error): 当输入不符合语法（如 "the dogs lived cats"），由于 OBJ 区域未被去抑制，投影操作无法激活任何神经元，系统报错。
无意义集合错误 (Nonsense Assembly Error): 当读取算法投射回 LEX 时，如果找不到对应的单词，说明存储的结构是畸形的。

7. 总结与思考

7.1. 结论总结

这篇论文提供了一个 “存在性定理”：它证明了人类大脑完全有能力利用已知的神经生物学机制（集合、抑制、赫布塑性）来构建一个解析器。它填补了底层神经放电与高层句法分析之间的鸿沟。

7.2. 局限性与未来工作

递归深度: 目前对于多层嵌套（如“我听说他觉得她爱他”）的处理还比较初级，可能需要引入类似“堆栈”的辅助脑区。
歧义处理: 论文提到的多义词（如 "rock" 既是名词又是动词）处理方案还需进一步实验验证。
学习机制: 目前的“词汇动作”是预设的。真正的挑战在于：大脑是如何通过语料输入，自发地学习到这些动作的？

7.3. 个人启发与批判

启发: 该模型将语法角色（SUBJ, OBJ）看作是物理上的脑区，这为理解脑损伤（如布罗卡区失语症）提供了新的计算解释——如果某个区域或其纤维受损，特定的语法连接就无法物理形成。
批判: 论文假设每个单词都有一个预设的“动作代码”，这在某种程度上类似于将规则硬编码进了神经元。虽然作者解释这些代码可以通过亚群体实现，但这种“微程序”在大脑中是如何存储和调用的，依然缺乏直接的电生理证据。此外，该模型目前高度依赖语序或显性的形态标志（如格），对于上下文高度敏感的隐含语义处理尚显不足。

A Biologically Plausible Parser

TL;DR 精炼摘要

摘要

思维导图

论文精读

中文精读约 9 分钟读完 · 4,484 字