Deciphering the impact of machine learning on education: Insights from a bibliometric analysis using bibliometrix R-package
TL;DR 精炼摘要
本研究利用`bibliometrix R-package`进行文献计量分析,探讨机器学习在教育领域的影响,揭示其对教学方法的潜在变革。研究分析970篇自2000年至2023年的文章,识别领域内的增长模式、核心贡献者及新兴趋势,为研究人员、教育者及政策制定者提供了将机器学习整合入教育的全面路径图。
摘要
This study leverages bibliometric analysis through the bibliometrix R-package to dissect the expansive influence of machine learning on education, a field where machine learning’s adaptability and data-processing capabilities promise to revolutionize teaching and learning methods. Despite its potential, the integration of machine learning in education requires a nuanced understanding to navigate the associated challenges and ethical considerations effectively. Our investigation spans articles from 2000 to 2023, focusing on identifying growth patterns, key contributors, and emerging trends within this interdisciplinary domain. By analyzing 970 selected articles, this study uncovers the developmental trajectory of machine learning in education, revealing significant insights into publication trends, prolific authors, influential institutions, and the geographical distribution of research. Furthermore, it highlights the journals pivotal in disseminating machine learning education research, the most cited works that shape the field, and the dynamic evolution of research themes. This bibliometric exploration not only charts the current landscape but also anticipates future directions, suggesting areas for further inquiry and potential breakthroughs. Through a detailed examination of empirical evidence and a critical analysis of machine learning applications in educational settings, this study aims to provide a foundational understanding of the field’s complexities and potentials. The anticipated outcome is a comprehensive roadmap that guides researchers, educators, and policymakers towards a thoughtful integration of machine learning in education, balancing innovation with ethical stewardship.
思维导图
论文精读
中文精读
1. 论文基本信息
1.1. 标题
解密机器学习对教育的影响:基于 bibliometrix R-package 的文献计量分析 (Deciphering the impact of machine learning on education: Insights from a bibliometric analysis using bibliometrix R-package)
1.2. 作者
- Zilong Zhong (北京外国语大学外国语言研究所,中国)
- Hui Guo (哈尔滨师范大学计算机科学与信息工程学院,中国)
- Kun Qian (重庆大学电气工程学院,中国)
1.3. 发表期刊/会议
Springer Science+Business Media, LLC, part of Springer Nature。该论文于2024年5月6日在线发表。Springer Nature 是一个著名的国际学术出版集团,其出版的期刊在科学、技术、医学等领域具有广泛的影响力。
1.4. 发表年份
2024年
1.5. 摘要
本研究利用 bibliometrix R-package 进行文献计量分析,旨在剖析机器学习在教育领域的广泛影响。教育领域中,机器学习的适应性和数据处理能力有望彻底改变教学和学习方法。尽管其潜力巨大,但机器学习在教育中的整合需要细致的理解,以有效应对相关挑战和伦理考量。本研究考察了2000年至2023年间的文章,重点识别这一跨学科领域的增长模式、主要贡献者和新兴趋势。通过分析970篇精选文章,本研究揭示了机器学习在教育领域的发展轨迹,深入洞察了出版趋势、高产作者、有影响力的机构以及研究的地理分布。此外,它还强调了在传播机器学习教育研究中至关重要的期刊、塑造该领域的最受引用著作以及研究主题的动态演变。这次文献计量探索不仅描绘了当前的研究格局,还展望了未来方向,提出了进一步探究和潜在突破的领域。通过对实证证据的详细审查和对机器学习在教育环境中应用的批判性分析,本研究旨在提供对该领域复杂性和潜力的基础理解。预期的结果是一份全面的路线图,指导研究人员、教育工作者和政策制定者以深思熟虑的方式整合机器学习于教育中,平衡创新与伦理管理。
1.6. 原文链接
/files/papers/6936dd1ac73d3b7a7fc4dbc4/paper.pdf
发布状态:已于2024年5月6日正式在线发表。
2. 整体概括
2.1. 研究背景与动机
核心问题: 机器学习 (Machine Learning, ML) 作为人工智能 (Artificial Intelligence, AI) 的一个变革性分支,在教育领域展现出巨大的潜力,能够通过其适应性和数据处理能力革新教学和学习方法。然而,其整合也伴随着挑战和伦理考量。该领域缺乏系统的文献计量分析,导致对现有研究格局、发展轨迹和未来方向的理解不足。
重要性与挑战/空白:
- 个性化学习与效率提升: 机器学习算法能够根据学生的需求、学习风格和进度提供个性化的学习路径,从而提高学习效率和参与度,改善学生成果。它还在教育分析 (educational analytics) 中发挥关键作用,提供学生表现洞察、预测学习成果并识别高风险学生。
- 行政任务自动化: 机器学习有助于自动化教育机构中的行政任务(如评分和排课),使教育工作者能够将更多时间投入到教学中。
- 智能辅导系统: 机器学习支持开发智能辅导系统,提供即时反馈和自适应学习资源,提升学习过程的效率和可访问性。
- 挑战与伦理考量: 机器学习在教育中的整合并非没有挑战。它引发了对学生监控、评估方法的公平性和透明度、以及机器系统取代人类互动等伦理问题。教育是一个复杂、动态且深刻的人类活动,机器学习虽然带来创新机会,但也需谨慎管理其挑战。
- 文献计量分析的缺失: 尽管机器学习在教育领域的应用研究持续增长,但现有研究缺乏系统的文献计量可视化分析。文献计量分析是系统绘制研究图景、理解领域发展和影响、识别关键研究趋势和空白的重要工具。这种缺失意味着一个进行详细文献计量分析的机会。
切入点/创新思路:
本研究通过使用 bibliometrix R-package 对 Web of Science (WoS) 数据库中2000年至2023年间发表的970篇相关文章进行全面的文献计量分析,旨在系统地绘制机器学习在教育领域的研究图谱。通过这种方法,研究旨在深入理解该领域的演变、主要贡献者、关键主题和未来发展方向,并提供一份平衡创新与伦理管理的路线图。
2.2. 核心贡献/主要发现
- 增长轨迹: 机器学习在教育领域的研究在2000年代初期出版量停滞,从2018年开始出现显著增长,并在2019年至2021年间呈现指数级增长,2022年达到顶峰,2023年有所稳定,这表明该领域经历了从早期探索到快速发展再到稳定深化的过程。
- 主要贡献者: 识别了高产作者 (如 Liu Y.、Wang Y.)、有影响力的机构 (如 Monash University、University of Macau、北京师范大学) 和国家 (中国贡献显著,SCP 数量高达425篇,美国次之)。研究揭示了全球研究协作网络和地理分布,突出了该领域的国际性和协作性。
- 核心出版平台: 确定了在机器学习与教育交叉领域中扮演重要角色、传播研究成果的关键期刊,包括
Computational Intelligence and Neuroscience、Frontiers in Psychology和Mobile Information Systems等,反映了该领域的跨学科性质。 - 影响力著作: 强调了在该领域最具影响力的被引著作,涵盖生物信息学工具、数字土壤制图、交互式学习任务、细胞生物学、虚拟学习环境、MOOC 成功因素、高光谱图像分类、学生表现预测、学生留存以及职前教师教育项目中的学习方法等多样化应用。
- 研究主题演变: 通过词云、主题图和主题演化图分析,揭示了核心研究主题(如
performance、model、prediction、classification),并描绘了主题的演变(如从quality到higher-education,从system到analytics)。近期主题如COVID-19、mental-health和neural-networks的出现,反映了领域对外部事件和技术进步的响应。 - 未来方向: 提出了未来研究方向,包括持续探索机器学习应用对学生表现和福祉的影响、学习分析在教学实践中的整合、机器学习应用可靠性和通用性的验证、数据使用和算法决策的伦理维度,以及高级神经网络架构和基于互联网教育技术的研究。
3. 预备知识与相关工作
3.1. 基础概念
- 人工智能 (Artificial Intelligence, AI): 人工智能是计算机科学的一个分支,旨在开发能够执行通常需要人类智能的任务的机器,例如学习、解决问题、感知和理解语言。
- 机器学习 (Machine Learning, ML): 机器学习是人工智能的一个子集,它使计算机系统能够从数据中“学习”而无需进行明确的编程。其核心是通过算法和统计模型分析和学习数据,预测结果并做出决策。机器学习主要分为以下几种类型:
- 监督学习 (Supervised Learning): 算法从带有标签 (labeled) 的训练数据中学习,即输入数据和对应的正确输出都已知。通过学习输入与输出之间的映射关系,模型可以对新数据进行预测。例如,通过历史学生数据(如出勤率、作业成绩)和最终考试成绩的标签,模型可以预测未来学生的考试成绩。
- 无监督学习 (Unsupervised Learning): 算法处理没有标签的数据,旨在发现数据中隐藏的模式或结构。它常用于聚类和降维。例如,通过分析学生的学习行为数据(无明确标签),模型可以将学生分为不同的学习群体。
- 强化学习 (Reinforcement Learning): 模型(智能体
agent)通过与环境的互动来学习如何做出决策。智能体根据其行动获得奖励或惩罚,目标是最大化累积奖励。在教育中,这可以应用于智能辅导系统,根据学生的反应调整教学策略。
- 深度学习 (Deep Learning): 深度学习是机器学习的一个子领域,它使用具有多层神经网络的算法来从数据中学习高级特征。它在处理图像、语音和文本等复杂数据方面表现出色。例如,卷积神经网络 (Convolutional Neural Networks, CNN) 可用于分析学生面部表情以评估学习投入度,循环神经网络 (Recurrent Neural Networks, RNN) 可用于理解学生的文本反馈。
- 文献计量分析 (Bibliometric Analysis): 文献计量分析是一种采用定量分析和统计方法来描述书面出版物模式的方法。它通过分析出版物数量、引用次数、作者、机构、期刊和关键词等指标,来全面概述特定学术领域的演变、影响和趋势。
bibliometrix R-package: 这是一个在 R 编程环境中开发的强大且多功能的软件包,专门用于进行文献计量分析。它提供了数据导入、转换、描述性分析、网络分析(如共同作者、引用和关键词网络)以及趋势分析等功能,有助于系统地研究文献数据。
3.2. 前人工作
论文在引言中简要提及了机器学习在多个领域(如自然语言处理、计算机视觉、预测分析和决策制定)的应用,并引用了相关研究来支撑其在教育领域变革潜力。在具体方法上,本研究采用文献计量分析,因此其前人工作主要围绕文献计量方法论本身及其在其他领域的应用。
- 文献计量分析的方法论:
- Moral- Muñoz et al. (2020) 指出,文献计量分析通过定量分析和统计方法描述书面出版物模式,提供学术产出的全面概述,洞察领域演变、影响和趋势。
- Mao et al. (2021) 和 Qian & Zhong (2023) 表明,该方法在识别关键主题、有影响力的作者和塑造研究领域的关键出版物方面特别有用。
bibliometrix工具的开发与应用:- Aria & Cuccurullo (2017) 开发了
bibliometrix R-package,该工具能够处理大型数据集并执行广泛的文献计量分析,支持数据导入、描述性分析、网络分析和趋势分析等功能。Jing et al. (2023) 也强调了bibliometrix在教育技术研究中的应用。
- Aria & Cuccurullo (2017) 开发了
- 机器学习在教育中的应用:
- Kabudi et al. (2021) 和 Hussain et al. (2021) 指出机器学习在教育中的应用能够显著提升教学方法和学习体验。
- Cui & Chen (2024) 强调机器学习算法能够开发个性化学习路径,适应学生的个性化需求、学习风格和学习速度。
- Alshamaila et al. (2024) 提及机器学习在教育分析中的作用,提供学生表现洞察,预测学习成果,并识别高风险学生。
- Sabharwal & Miah (2024) 讨论了机器学习在自动化教育机构行政任务(如评分和排课)中的作用。
- Basnet et al. (2022) 提到了机器学习支持智能辅导系统的开发,提供即时反馈和自适应学习资源。
- 机器学习在教育中的伦理考量与挑战:
-
Webb et al. (2021) 强调了对机器学习预测、数据管理和数据完整性问题的日益依赖所带来的担忧。
-
Saltz et al. (2019) 探讨了伦理考量,例如学生监控增加的潜力、评估方法的公平性和透明度,以及机器系统取代人类互动的影响。
-
Holmes et al. (2021) 强调教育是一个复杂、动态且深刻的人类活动,机器学习提供了创新机会,但也带来了需要仔细考虑和负责任管理的挑战。
本研究的独特之处在于,它专门将文献计量分析方法应用于“机器学习在教育领域”这一交叉学科,以填补该领域缺乏系统性概览的空白。
-
3.3. 技术演进
机器学习在教育领域的应用演进可以概括为以下几个阶段:
- 萌芽期 (2000-2007): 这一时期,机器学习在教育中的应用仍处于非常初级的阶段,出版物数量极少,甚至有些年份没有相关研究。这反映了当时机器学习技术本身的成熟度有限,以及教育领域对新兴技术的认识和接受程度较低。研究可能集中在概念验证和非常基础的算法探索上。
- 缓慢增长期 (2008-2017): 随着机器学习算法的进步(如支持向量机、决策树等逐渐成熟)和计算能力的提升,教育领域开始逐渐意识到其潜力。出版物数量缓慢增加,研究兴趣逐渐建立,可能开始探索在学生表现预测、早期预警系统等方面的初步应用。
- 快速发展期 (2018-2022): 这一时期是机器学习在教育领域发展的“爆发期”。
- 技术成熟: 深度学习 (Deep Learning) 技术的崛起(如卷积神经网络、循环神经网络)为处理教育领域的复杂数据(如文本、图像、语音)提供了强大工具。
- 数据可用性: 学习管理系统 (Learning Management Systems, LMS) 和在线教育平台的普及,使得教育数据(学生学习行为、成绩、互动数据等)日益丰富和易于获取,为机器学习模型训练提供了基础。
- 个性化学习需求: 教育界对个性化学习路径、自适应学习系统和智能辅导系统 (Intelligent Tutoring Systems, ITS) 的需求日益增长,机器学习成为实现这些目标的关键技术。
- 外部事件催化: COVID-19 大流行加速了全球教育向在线和技术驱动模式的转变,进一步推动了对机器学习在教育中应用的研究和需求。研究焦点从简单的预测扩展到更复杂的应用,如个性化推荐、情感识别、智能内容生成等。
- 稳定深化期 (2023至今): 2023年出版物数量有所回落,但仍保持高位。这可能标志着领域从初期的探索性研究转向更深入、更细致、更注重质量和实际应用的研究。研究可能更加关注模型的解释性、公平性、伦理问题,以及机器学习技术在不同教育背景下的通用性和长期影响。
3.4. 差异化分析
本研究与现有相关工作的主要区别和创新点在于:
- 聚焦特定交叉领域: 许多文献计量分析可能聚焦于机器学习的某个技术方向(如深度学习应用)或教育学的某个子领域。本研究明确聚焦于“机器学习在教育中的应用”这一特定的、快速增长的跨学科领域,提供了该领域发展轨迹的全面概览。
- 系统性文献计量可视化分析: 论文明确指出该领域缺乏“文献计量可视化分析 (bibliometric visual analysis)”。本研究填补了这一空白,不仅进行了定量分析,还利用
bibliometrix R-package提供的可视化工具(如词云、主题图、主题演化图)来直观展示研究趋势和模式,使得分析结果更易于理解和洞察。 - 时间跨度与数据量: 本研究涵盖了2000年至2023年的文献,分析了970篇精选文章,这一较长的时间跨度和较大的样本量,使得其能够更准确地描绘该领域从萌芽到成熟的完整发展历程。
- 多维度分析: 论文从多个维度进行了深入分析,包括年度出版物趋势、高产作者、有影响力机构、国家贡献与协作模式、核心期刊、高被引著作以及研究热点与主题演化。这种多角度的综合分析提供了对领域现状和未来方向的全面理解。
- 关注伦理与挑战: 在讨论机器学习在教育中的潜力时,本研究也始终保持批判性视角,强调了其整合所带来的伦理考量和挑战,并将其纳入研究结论和未来方向的讨论中,而不仅仅是关注技术优势。
- 提供路线图: 本研究的预期成果是提供一份“全面的路线图 (comprehensive roadmap)”,旨在指导研究人员、教育工作者和政策制定者如何在教育中深思熟虑地整合机器学习,平衡创新与伦理管理,这超越了简单的现状分析,具有更强的实践指导意义。
4. 方法论
4.1. 方法原理
本研究的核心方法原理是文献计量分析 (Bibliometric Analysis)。文献计量分析是一种利用定量方法和统计学来研究学术出版物模式的学科。其基本思想是通过对大量文献数据(如出版物数量、引用次数、作者、机构、关键词等)进行系统性分析,从而揭示特定研究领域的演变规律、知识结构、主要贡献者、热点主题和发展趋势。
核心原理包括:
-
统计学原理: 运用时间序列分析来观察出版物数量的增长趋势;使用频率分析来识别高产作者、机构、国家和关键词;通过引用分析来评估文章、作者或期刊的影响力。
-
网络科学原理: 构建共同作者网络(揭示合作关系)、共同引用网络(识别知识基础)、关键词共现网络(发现研究主题结构)等,以可视化方式展现学术社区的结构和主题之间的关联。
-
信息可视化原理: 将复杂的文献数据通过图表(如年度出版图、词云、主题图、主题演化图)进行可视化,使研究趋势和模式更加直观易懂。
本研究利用
bibliometrix R-package实现这些原理。bibliometrix软件包是一个专门为文献计量分析设计的强大工具,它能够处理从 Web of Science (WoS) 等数据库导入的原始文献数据,并提供一系列内置函数来执行上述各种分析和可视化任务。例如,它可以自动计算年度出版量、识别高产实体、构建共现矩阵,并通过 R 的绘图功能生成相应的图表。
4.2. 核心方法详解 (逐层深入)
4.2.1. 数据收集
本研究的数据收集过程严格遵循以下步骤:
-
数据库选择: 选择了 Web of Science (WoS) 作为主要文献数据库。WoS 以其严格的筛选标准和高标准的索引而闻名,被认为是文献计量分析中最可靠和广泛使用的数据库之一。它提供了比其他数据库更严格的审查级别,确保了来源出版物的质量和可信度。
-
数据源: 数据从 WoS 核心合集 (WoS Core Collection) 中收集,具体包括三个主要组成部分:
Science Citation Index Expanded (SCI-Expanded)Social Sciences Citation Index (SSCI)Arts & Humanities Citation Index (A&HCI)这些组件共同提供了一个全面且多学科的学术文章范围。
-
搜索策略: 采用结构化的搜索查询,旨在捕获机器学习在教育背景下的广泛研究。使用的搜索查询为:
TI = ('machine learning' OR 'deep learning') AND ('educat*' OR 'teach*' OR 'learner*' OR 'student*' OR 'class*')- :表示在文章标题 (Title) 中进行搜索。
'machine learning' OR 'deep learning':确保捕获与机器学习或深度学习相关的研究。'educat*' OR 'teach*' OR 'learner*' OR 'student*' OR 'class*':使用通配符*来匹配education、educating、teacher、teaching、learner、learning、student、students、class、classes等相关术语,以涵盖教育领域的各种术语和短语。AND:表示逻辑与操作,确保搜索结果同时包含机器学习/深度学习和教育相关术语。
-
纳入标准与数据提取: 纳入标准在图1中详细概述,以确保数据集的专注性和相关性。数据于2023年12月31日提取。
-
数据集结果: 共收集到970条记录,涵盖346种期刊和133个 WoS 类别。这一广泛的收集反映了机器学习与教育应用相互交织研究的多元和跨学科性质。
下图(原文 Figure 1)展示了数据搜索阶段的工作流程图和每个阶段的结果:

图1 工作流程图:文档搜索阶段和本研究各阶段的结果
4.2.2. 分析工具
本研究的核心分析工具是 bibliometrix R-package。
- 工具概述:
bibliometrix是一个在 R 编程环境中开发的强大且多功能的软件包,专门用于文献计量分析。它提供了一套全面的功能,可以系统地分析文献数据。 - 关键功能:
- 数据导入和转换: 能够直接从 WoS 和其他主要数据库导入数据,并将其转换为适合分析的格式。
- 描述性分析: 提供计算基本文献计量指标的功能,例如出版物总数、引用次数、作者数量和期刊数量。
- 网络分析: 可以构建和可视化复杂的网络,包括共同作者网络(
co-authorship network)、引用网络(citation network)和关键词网络(keyword network),从而深入了解协作模式和主题结构。 - 趋势分析: 能够进行随时间变化的趋势分析,识别研究主题、高产作者和机构的演变。
- 动态分析: 支持动态数据分析,允许探索研究领域在特定时期内的变化和发展。
4.2.3. 数据分析流程
利用 bibliometrix R-package,本研究按照以下步骤对收集到的970篇文章进行分析:
- 年度出版物分析: 统计每年(2000-2023)的出版物数量,以揭示领域的发展轨迹和增长模式。
- 作者、机构和国家分析:
- 识别高产作者 (most prolific authors)。
- 识别高产机构 (most productive affiliations)。
- 分析国家贡献,区分单国出版物 (Single-Country Publications, SCP) 和多国出版物 (Multi-Country Publications, MCP),以了解国际合作模式。
- 期刊分析: 识别在机器学习与教育交叉领域中发表文章数量最多的期刊,揭示核心传播平台。
- 高被引文章分析: 识别被引用次数最多的文章,以了解该领域的里程碑式研究和影响力。
- 热点主题、演变和趋势分析:
-
词云 (Word Cloud): 基于关键词频率生成词云图,直观展示当前研究热点。
-
主题图 (Thematic Map): 根据关键词的“发展度 (density)”和“中心性 (centrality)”绘制主题图,将主题分类为运动主题 (motor themes)、利基主题 (niche themes)、新兴/衰退主题 (emerging/declining themes) 和基础主题 (basic themes)。
- 密度 (Density): 反映主题内部的联系强度或发展程度,即该主题下的关键词相互关联的紧密程度。
- 中心性 (Centrality): 反映主题与其他主题的外部联系强度或重要性,即该主题在整个研究领域中的重要性和连接性。
-
主题演化图 (Thematic Evolution Map): 通过时间序列分析,展示不同时间段内研究主题的变化和相互关联,揭示研究焦点的动态演变。
-
趋势主题 (Trend Topics): 基于关键词频率随时间变化的趋势,识别新兴或持续热门的研究方向。
通过上述分析步骤,本研究旨在全面描绘机器学习在教育领域的研究图谱,提供深入的洞察。
-
5. 实验设置
5.1. 数据集
实验中使用的数据集是通过 Web of Science (WoS) 核心合集收集的文献数据。
- 来源: Web of Science (WoS) 核心合集,包括
Science Citation Index Expanded (SCI-Expanded)、Social Sciences Citation Index (SSCI)和Arts & Humanities Citation Index (A&HCI)。选择 WoS 是因为其严格的筛选标准和高标准的索引,保证了数据的质量和可信度。 - 规模与特点:
- 时间跨度: 2000年至2023年。
- 文章数量: 970篇。
- 期刊数量: 346种。
- WoS 类别: 133个。
- 领域: 涵盖了机器学习在教育领域的广泛应用,体现了该领域的跨学科性质。
- 选择原因: 这些数据集能够有效地验证该领域从早期发展到当前趋势的演变,提供全面的文献计量分析基础。广泛的期刊和类别覆盖确保了分析的全面性和代表性。
5.2. 评估指标
本研究作为文献计量分析,其“评估指标”主要体现在对文献产出、影响力和主题结构等方面的量化指标。这些指标不是评估算法性能的指标,而是评估学术活动和趋势的指标。
- 年度出版物数量 (Number of Annual Publications):
- 概念定义: 指在特定年份内发表的与研究主题相关的文章总数。它量化了学术界对某一研究领域随时间变化的兴趣和投入程度。
- 数学公式: 不存在标准的数学公式,通常通过计数得到。
- 符号解释:
- : 在年份 的出版物总数。
- : 在年份 识别到的总文献数量。
- : 如果第 篇文献是在年份 发表的,则为1;否则为0。
- 作者出版物数量 (Number of Author Publications):
- 概念定义: 指特定作者在研究主题领域内发表的文章总数。用于识别该领域的高产学者。
- 数学公式:
- 符号解释:
- : 作者 的出版物总数。
- : 作者 参与发表的文献总数量。
- : 如果第 篇文献由作者 撰写,则为1;否则为0。
- 机构出版物数量 (Number of Affiliation Publications):
- 概念定义: 指特定学术机构在研究主题领域内发表的文章总数。用于识别该领域的领先研究机构。
- 数学公式:
- 符号解释:
- : 机构 的出版物总数。
- : 机构 参与发表的文献总数量。
- : 如果第 篇文献由机构 的研究人员撰写,则为1;否则为0。
- 国家出版物数量 (Number of Country Publications):
- 概念定义: 指特定国家在研究主题领域内发表的文章总数。可进一步细分为单国出版物 (Single-Country Publications, SCP) 和多国出版物 (Multi-Country Publications, MCP)。
- 数学公式:
- 符号解释:
- : 国家 的出版物总数。
- : 国家 参与发表的文献总数量。
- : 如果第 篇文献由国家 的研究人员撰写,则为1;否则为0。
- : 国家 的单国出版物数量。
- : 国家 的多国出版物数量。
- 期刊出版物数量 (Number of Journal Publications):
- 概念定义: 指特定期刊在研究主题领域内发表的文章总数。用于识别该领域的核心传播平台。
- 数学公式:
- 符号解释:
- : 期刊 的出版物总数。
- : 期刊 中发表的文献总数量。
- : 如果第 篇文献发表在期刊 上,则为1;否则为0。
- 引用次数 (Citation Count):
- 概念定义: 指一篇文章被其他学术作品引用的总次数。它是衡量一篇文章、作者或期刊学术影响力的重要指标。
- 数学公式: 不存在标准数学公式,通过数据库统计。
- 符号解释:
- : 文献 的总引用次数。
- : 引用文献 的文献总数量。
- : 如果第 篇文献引用了文献 ,则为1;否则为0。
- 关键词频率 (Keyword Frequency):
- 概念定义: 指特定关键词在文章中出现的次数(通常是作者关键词或通过文本挖掘提取的关键词)。用于识别研究热点和主要关注点。
- 数学公式:
- 符号解释:
- : 关键词 的出现频率。
- : 包含关键词 的文献总数量。
- : 如果第 篇文献包含关键词 ,则为1;否则为0。
- 关键词中心性 (Keyword Centrality):
- 概念定义: 在关键词共现网络中,表示一个关键词与其他关键词的连接程度。高中心性关键词通常是研究领域中的核心概念。
- 数学公式 (度中心性 Degree Centrality): 最简单的中心性指标,指一个节点在网络中直接连接的其他节点的数量。
- 符号解释:
- : 节点 的度中心性。
- : 节点 的度,即与其直接相连的边数。
- 关键词密度 (Keyword Density):
- 概念定义: 在关键词共现网络中,表示一个关键词所形成的主题簇内部的连接紧密程度。高密度关键词通常表示一个发展较为成熟且内部联系紧密的子领域。
- 数学公式: 通常通过计算主题簇内部节点(关键词)之间的边数与可能最大边数的比率来衡量。
- 符号解释:
- : 主题簇 的密度。
- : 主题簇 内部的边集。
- : 主题簇 内部的节点集。
- : 主题簇 内部的边数。
- : 主题簇 内部的节点数。
5.3. 对比基线
作为文献计量分析,本研究没有采用传统机器学习实验中对比不同算法性能的“基线模型 (Baselines)”。相反,其“对比基线”体现在对不同时间段、不同作者/机构/国家、不同期刊的数据进行比较,以及与该领域其他可能的文献计量研究(如果有的话)进行隐性比较。
具体来说,本研究通过以下方式进行比较和基准化:
-
时间对比: 通过年度出版物分析,将不同年份的出版量进行比较,以识别增长模式和发展阶段。
-
贡献者对比: 对比不同作者、机构和国家的出版物数量、引用次数以及单国/多国出版比例,以量化他们的相对贡献和影响力。
-
期刊对比: 对比不同期刊在机器学习与教育领域的发文量,以确定核心出版平台。
-
高被引对比: 对比高被引文章的引用次数和研究主题,以识别该领域最具影响力的工作。
-
主题演化对比: 对比不同时间段内的关键词频率、主题图结构,以观察研究热点的演变和趋势。
这些“基线”或“比较点”构成了文献计量分析的本质,通过横向和纵向的比较,揭示研究领域的深层结构和动态变化。
6. 实验结果与分析
6.1. 核心结果分析
6.1.1. 年度出版物分析
下图(原文 Figure 2)展示了机器学习在教育领域研究的年度出版物数量。

图2 机器学习在教育领域研究的年度出版物
-
2000-2007: 领域处于萌芽阶段,出版率停滞不前,每年不超过两篇文章,甚至有年份没有出版物,表明机器学习与教育的交叉研究尚未被广泛认识和探索。
-
2008-2017: 出版物数量逐渐增加,从2008年的4篇缓慢上升到该时期末的每年5篇,这可能得益于机器学习算法的进步以及其在教育中应用潜力的认知提高。
-
2018: 迎来一个显著的跳跃,文章数量增至14篇,预示着该领域开始获得更广泛的关注。
-
2019-2021: 呈现指数级增长,从45篇飙升至175篇。这一激增归因于机器学习技术的成熟、教育数据可用性的增加以及个性化和自适应学习环境的推动,尤其可能受到 COVID-19 大流行期间在线教育需求激增的影响。
-
2022: 达到出版活动的高峰,记录了373篇文章,表明机器学习已巩固其在教育研究和实践中的关键工具地位。
-
2023: 出版物数量下降至236篇。这一减少可能表明领域进入稳定阶段,初期探索的热潮逐渐让位于对研究质量和实际应用的深化。
总结: 整体趋势显示,该领域经历了早期探索、显著增长到近期稳定深化的过程,但这种稳定并非饱和,而是对跨学科协作、先进分析方法和创新教育实践的持续需求。
6.1.2. 作者、机构和国家分析
6.1.2.1. 高产作者
下图(原文 Figure 3)展示了机器学习在教育领域的前10位高产作者。

图3 机器学习在教育领域的前10位高产作者
-
Liu Y. (9篇): 以9篇文章位居榜首,显示其在该领域的核心地位、成熟的研究议程和领导力。
-
Wang Y. (6篇): 紧随其后,贡献了6篇文章,表明其对该领域的持续承诺。
-
Liu J., Tian Y., Zhang R., Zhang W. (各5篇): 这一批作者的持续产出,表明了他们在该领域的专注研究和专业知识,共同推动了理论框架、方法论和实际应用的进步。
-
Chen Z., Lee S., Leung S. O., Li Y. (各4篇): 虽然出版数量稍低,但其稳定的文献贡献丰富了该领域的研究多样性和视角。
总结: 这些高产作者的贡献共同构成了机器学习在教育领域学术景观的重要组成部分。他们的工作不仅推动了知识传播,还影响了研究趋势,并塑造了未来研究的议程,体现了该领域的跨学科性和竞争与协作精神。
6.1.2.2. 高产机构
下图(原文 Figure 4)展示了机器学习在教育领域的前10位高产机构。

图4 机器学习在教育领域的前10位高产机构
-
Monash University 和 University of Macau (各11篇): 共同位居榜首,表明这些机构是机器学习在教育领域学术讨论的关键参与者,拥有专注的研究团队、充足的资源(资金、人才、数据)和强大的学术生产力。
-
Beijing Normal University 和 King Saud University (各10篇): 紧随其后,反映了这两所大学在该领域强大的研究参与度和显著投入。中国和沙特阿拉伯机构的出现,也表明了研究工作的地理多样性。
-
Central China Normal University, McGill University, University of Michigan (各9篇): 进一步证实了国际研究社区的活跃性,这些机构通过跨学科合作汇集了教育和计算机科学领域的专业知识。
-
Ajman University, Fordham University, Purdue University (各8篇): 这些机构的持续产出为该领域的学术工作奠定了基础,并显示了它们在该特定领域新兴或已建立的研究能力。
总结: 这些机构的贡献表明了它们对创新研究的重视,并向政策制定者和教育从业者传递了投资机器学习作为教育增强工具的价值。
6.1.2.3. 高产国家
下图(原文 Figure 5)展示了机器学习在教育领域的前10位高产国家。

图5 机器学习在教育领域的前10位高产国家
-
中国 (480篇,其中SCP 425篇,MCP 55篇): 绝对主导该领域,巨大的出版数量凸显了中国在教育领域机器学习应用研究中的领先地位。高比例的
SCP表明中国强大的内部协作和完善的研究基础设施。 -
美国 (87篇,其中SCP 75篇,MCP 12篇): 位居第二,其显著的
SCP数量表明美国在该跨学科领域强大的国家研究能力。MCP反映了其战略性的国际伙伴关系。 -
印度 (34篇) 和韩国 (29篇): 紧随其后,印度
SCP比例较高,表明其研究社区更侧重内部发展;韩国SCP与MCP的平衡则显示其活跃的国际合作。 -
英国 (21篇,其中MCP 13篇): 虽然总出版物较少,但其高比例的
MCP反映了英国强大的国际合作精神。 -
澳大利亚、德国、沙特阿拉伯、西班牙: 均展现出
SCP和MCP的健康平衡,表明其研究环境既能自我维持又具有全球整合性。 -
巴基斯坦 (13篇,其中MCP 8篇): 相对较高的
MCP比例表明,这是一个新兴的研究社区,正在利用国际合作来提升其在该领域的贡献。总结: 这些发现共同揭示了机器学习在教育领域全球研究格局,高比例的
SCP象征着坚实的国家研究能力,而MCP则指向一个重视跨境合作的互联互通的全球研究社区。这种平衡对于领域发展至关重要,因为它促进了多样化视角的共享、多源数据的获取以及不同教育和技术方法的融合。
6.1.3. 高产期刊
下图(原文 Figure 6)展示了机器学习在教育领域的前10位高产期刊。

图6 机器学习在教育领域的前10位高产期刊
-
Computational Intelligence and Neuroscience (57篇): 领先该榜单,强调了该期刊在促进机器学习与认知过程及其教育应用研究中的重要作用,表明对探索学习过程的神经基础以及机器学习模型如何模拟或增强这些过程的浓厚兴趣。
-
Frontiers in Psychology (48篇): 紧随其后,强调了该期刊对心理学与教育交叉领域前沿研究的关注,其中机器学习工具和理论越来越多地被应用于理解和改善教育成果。
-
Mobile Information Systems (44篇) 和 Education and Information Technologies (43篇): 表明以技术为中心的期刊在传播机器学习在教育环境中应用研究的关键作用。
-
Wireless Communications & Mobile Computing (42篇): 进一步展示了移动技术在教育中的重要性,特别是机器学习在通过此类设备创建自适应和个性化学习体验方面的作用。
-
IEEE Access (33篇): 其广泛的范围表明开放获取多学科研究的重要性,以及机器学习在教育领域在更广泛的工程和技术研究中的相关性。
-
Journal of Intelligent & Fuzzy Systems (31篇), Mathematical Problems in Engineering (28篇), Security and Communication Networks (26篇), Scientific Programming (25篇): 这些期刊虽然更侧重技术和专业性,但凸显了该领域的跨学科性质,教育研究受到计算方法、工程、安全和编程进步的影响。
总结: 这些顶级期刊的贡献不仅体现在数量上,更在于它们作为思想交流的论坛,推动了传统教育范式的边界。期刊对机器学习研究的接纳反映了该领域动态演变及其作为教育创新关键组成部分的日益增长的认可。
6.1.4. 高被引文章
下图(原文 Figure 7)展示了机器学习在教育领域相关的十大被引文章。

图7 机器学习在教育领域相关的十大被引文章
该分析揭示了机器学习在教育及相关学科中影响最大的研究主题和方法。这些文章涵盖了生物信息学工具、数字土壤分类、交互式学习、细胞生物学、虚拟学习环境、MOOC 成功率、高光谱图像分类、学生表现预测、学生留存以及职前教师教育项目中的学习方法等广泛应用。
- Chen et al. (2020) - iLearn: 生物信息学工具,用于表征生物序列。该平台集成了各种算法和机器学习技术,为研究人员提供了一个多功能工具包。其易用性和自动选择最佳设置使其获得高引用,表明其在基因组学和计算生物学研究中的影响力。
- Brungard et al. (2015): 数字土壤制图 (DSM) 领域,比较了各种机器学习模型和协变量集用于土壤分类预测。其方法论的严谨性和实践建议,在环境科学和农业领域引起了研究人员和从业者的共鸣。
- Vos et al. (2011): 关于交互式学习任务对学生动机和策略使用影响的研究。结果表明,游戏构建比游戏玩法更能促进学生动机和深层策略使用,强调了主动学习策略在教育环境中的潜力。
- Sommer and Gerlich (2013): 机器学习在高通量细胞生物学中的应用,为显微镜图像分析的机器学习方法提供了全面指南。该评论因其在实验工作流程和数据分析优化方面的实践指导而受到引用。
- Waheed et al. (2020): 探讨了使用深度人工神经网络预测虚拟学习环境中高风险学生的方法。其模型优于传统方法,强调了机器学习在提升教育成果和支持数据驱动决策方面的潜力。
- Hew et al. (2020): 关注
MOOC成功,通过学生满意度而非完成率来定义,并利用机器学习算法和情感分析洞察影响学生满意度的因素。 - Liu et al. (2021): 提出了一种新型多任务深度学习方法,解决高光谱图像分类问题,特别是在存在未知类别且样本量较少的情况下,提高了分类准确性。
- Kotsiantis et al. (2004): 对机器学习算法在预测大学远程学习学生表现方面的比较分析。其对
朴素贝叶斯 (Naive Bayes)算法在准确性和易实施性方面的认可,为教育管理者和政策制定者提供了实际解决方案。 - Delen (2010): 深入探讨了高等教育中的学生留存问题,通过数据挖掘技术开发分析模型来预测大一学生流失,成为教育数据挖掘和机构政策制定研究的基石。
- Gordon and Debus (2002): 调查了职前教师教育项目中情境修改对学生学习方法的影响。其纵向准实验设计和发现与学习方法理论相符,为教师教育和课程开发提供了有价值的见解。
批判性分析:
-
技术复杂性与可解释性: 许多研究(如 Waheed et al., 2020)应用了深度学习和神经网络等高级机器学习算法,虽然提升了性能,但普遍缺乏对这些复杂模型可解释性的详细讨论,可能导致“黑箱”问题,影响非技术背景教育者的理解和应用。
-
积极偏倚: 研究结果倾向于突出机器学习在教育中的积极影响,例如 Vos et al. (2011) 强调互动学习任务的激励作用。这种积极偏倚可能掩盖机器学习应用未能显著改善甚至产生负面效果的情况,需要更平衡的报告。
-
研究范围与通用性限制: 许多被引工作(如 Kotsiantis et al., 2004 和 Delen, 2010)基于特定的教育环境或学生群体,这限制了其研究结果在不同教育系统、文化和学习环境中的通用性。
-
缺乏长期研究: 现有研究缺乏对机器学习干预在教育中长期影响的纵向研究,难以理解这些技术对学习成果、学生参与度和教育公平性的持续效应。
总结: 这些高被引文章展示了机器学习应用的广泛性、方法论创新和跨学科性。然而,高引用率并非唯一衡量学术意义的标准,还需结合研究质量、对学科知识的贡献深度以及解决复杂问题的能力来评估其价值和影响力。未来的研究应致力于提升模型透明度、扩大研究环境多样性,并开展长期研究以全面理解机器学习在教育中的作用。
6.1.5. 热点主题、演变和趋势
6.1.5.1. 关键词词云
下图(原文 Figure 8)可视化了机器学习在教育领域相关关键词的频率。
该图像是一个词云,展示了与机器学习在教育领域相关的关键词。关键词如“performance”、“classification”和“prediction”等,以不同的字体大小呈现,反映出其在研究中的重要性。
图8 基于机器学习在教育领域相关关键词的词云
-
“Performance” (51次): 出现频率最高,表明研究强烈关注教育干预和系统的成果和有效性,旨在评估和改进学生学习成果。
-
“Model” (43次) 和 “Classification” (37次): 表明研究重点是开发和应用预测模型和分类框架,用于预测学生行为、学习模式或学业成果。
-
“Prediction” (37次): 进一步强化了对预测未来教育状态或表现的重视,这对于个性化学习和早期干预策略至关重要。
-
“Student” (28次) 和 “Education” (26次): 作为该领域的核心研究对象和背景,强调了当前研究以学习者为中心的方法。
-
“Quality” (25次) 和 “Analytics” (23次): 反映了提升教育标准和利用数据驱动方法指导教育决策的努力。
-
“Academic-performance” (21次) 和 “Achievement” (22次): 与“Motivation” (22次) 和 “Engagement” (21次) 相结合,突出了不仅关注学业成绩,还关注影响成功学习体验的情感和参与因素。
-
“Higher-education” (21次): 表明大量研究集中在大学和学院,这些地方由于数据丰富和环境复杂性,机器学习应用尤为丰富。
-
“Recognition” (19次): 可能与教育数据中的模式识别或学生成就和行为的识别有关。
-
“Algorithm” (17次) 和 “Regression” (17次): 清晰表明研究的技术性质,深入探讨数据分析和模式识别的具体方法。
-
“Impact”, “School”, “Support”, “Systems”, “Models” (13-15次): 表明通过部署各种机器学习模型,对教育系统和支持机制在学校环境中的影响进行了全面考察。
-
“Neural-networks” (14次): 指向高级机器学习技术(如深度学习)在理解和增强教育过程中的应用。
-
“Outcomes” (13次) 和 “Science” (13次): 表示这些研究是以结果为导向且具有科学严谨性的。
总结: 词云反映了该研究领域既技术化又以人为本,其总目标是通过机器学习改进教育过程和成果。对表现、建模和预测的强调表明了该领域是面向未来的、以成果为导向的,并利用先进的计算技术更好地理解和增强学习者体验。
6.1.5.2. 主题图
下图(原文 Figure 9)提供了机器学习在教育领域关键词研究格局的可视化表示,根据其发展度和中心性识别核心主题、利基领域、新兴趋势和基础主题。
该图像是一个散点图,展示了与教育领域中机器学习相关主题的开发程度和相关程度。图中横轴代表主题的相关度(中心性),纵轴表示主题的发展度(密度)。不同颜色和大小的圆圈代表各个主题,如“抑郁”、“儿童”和“神经网络”。图中可见,某些主题处于显著的“基础主题”或“运动主题”区域,表明它们在当前研究中的重要性和影响力。
图9 机器学习在教育领域研究关键词的主题图
-
运动主题 (Motor Themes - 第一象限:高发展度,高中心性): 包括
achievement(成就),motivation(动机),engagement(投入),depression(抑郁),prevalence(流行),college-students(大学生)。这些主题在当前研究框架中是成熟且相互关联的,具有显著影响力,表明它们是文献中常见的焦点,并且对领域内其他主题产生重要影响。 -
利基主题 (Niche Themes - 第二象限:高发展度,低中心性): 包括
children(儿童),gender(性别),artificial-intelligence(人工智能),big data(大数据)。这些主题虽然发展程度很高,但相对孤立,表明它们是该领域内高度专业化的研究领域,可能在特定期刊或研究社区中具有深度知识,但与更广泛的研究格局连接较少。 -
新兴或衰退主题 (Emerging or Declining Themes - 第三象限:低发展度,低中心性): 包括
algorithm(算法),recognition(识别),neural-networks(神经网络),internet(互联网)。这些术语的特点是新颖或正在逐渐淡出焦点。它们的出现表明它们正在获得关注或正在失去重要性,但尚未与其他研究领域建立强有力的联系或在该领域内达到高发展水平。 -
基础主题 (Basic Themes - 第四象限:低发展度,高中心性): 包括
system(系统),technology(技术),framework(框架),model(模型),support(支持),outcomes(成果),performance(表现),classification(分类),prediction(预测)。这些是基础性主题,发展度较低但具有未来增长的巨大潜力。它们是研究领域结构的关键组成部分,代表着可能演变为热点或引领新研究方向的新兴领域。总结: 主题图是一种战略工具,用于识别各种研究主题的状态和相互关系。运动主题是综合和元分析的成熟领域;利基主题提供了跨学科研究的机会;新兴/衰退主题可以作为前瞻性研究的焦点;基础主题则是探索性研究和创新的肥沃土壤。
6.1.5.3. 主题演化图
下图(原文 Figure 10)展示了2000年至2023年间机器学习在教育领域研究焦点区域的演变。
该图像是一个纵向比较图,展示了在2000至2020年间,机器学习在教育领域中的研究主题演变。左侧表示2000至2017年的主题,中心部分为2018至2020年的主题,右侧为2021至2023年的主题,显示了各主题之间的联系和变化趋势。
图10 机器学习在教育领域研究关键词的主题演化
-
2000-2017: 主题如
higher-education(高等教育),quality(质量) 和outcomes(成果) 占据主导地位。higher-education延续至2018-2020年,表明对高等教育的持续关注。outcomes在后续时期转变为performance(表现),暗示了从广泛结果到更具体表现指标的转变,可能受到对量化结果和教育问责制日益重视的影响。quality到higher-education的转变则表明教育质量已被整合到更广泛的高等教育研究背景中。model从早期就存在,到2018-2020年演变为performance,表明从理论建模转向教育模型有效性的实际应用和测量。 -
2018-2020:
optimization(优化) 成为一个重要主题并延续至2021-2023年,强调了教育背景下效率和资源利用日益增长的重要性,这得益于数据激增和个性化学习路径的需求。performance在所有时期都是核心主题,强调对衡量和改进教育成果的持续关注。 -
2021-2023:
models和classification的出现表明对特定机器学习技术及其在分类教育数据中进行更精确干预的成熟兴趣。system在2018-2020年演变为analytics(分析) 在2021-2023年,反映了从对教育系统的广泛理解转向对这些系统内数据的更细致分析。这与学习分析作为利用数据支持教育决策和政策的领域兴起相符。prevalence(流行),self-efficacy(自我效能),covid-19(新冠疫情),mental-health(心理健康),neural-networks(神经网络),internet(互联网) 在最新时期出现,反映了疫情对教育的影响、学生心理健康的日益关注、高级机器学习技术的应用以及互联网教育的普及。总结: 主题演化图表明机器学习在教育领域是一个动态的领域,主题不仅在发展,而且在不同时期相互交织。它突出了该领域对外部事件(如疫情)和内部技术进步(如神经网络)的响应能力。该图作为领域发展史的记录,并为未来的研究轨迹提供了预测性视角。
6.1.5.4. 趋势主题
下图(原文 Figure 11)提供了基于关键词频率的趋势主题可视化,展示了2019年至2023年间机器学习在教育领域的研究兴趣和主题转变。
该图像是一个条形图,展示了2019年至2023年间与机器学习在教育领域相关的多个术语的发表趋势。通过不同长度的条形,图中呈现了不同术语(如‘模型’、‘预测’、‘分析’等)的研究热度变化,反映了相关研究主题的动态演变。
图11 机器学习在教育领域研究的关键词趋势主题
-
“Performance” (51次,中位数年份2022): 频率最高,表明对学生、教育系统或机器学习模型表现的研究在近年持续成为核心主题,关注评估和改进教育干预和技术的效率。
-
“Model” (43次,中位数年份2021): 出现频率高,表明在该时期早期对教育模型的开发和完善有显著兴趣,旨在利用机器学习能力。
-
“Prediction” 和 “Classification” (中位数年份分别为2021和2022): 持续受到关注,反映了预测教育成果和分类教育数据的重要性,这对于个性化学习和增强决策过程至关重要。
-
“Analytics” (中位数年份2021,2022年仍相关): 表明数据分析作为相对较新但已确立的趋势,被整合到教育研究中,与学习分析在教育机构中被广泛采用以获取学生学习洞察和系统优化相呼应。
-
“Achievement”, “Validity”, “Symptoms” (中位数年份2023): 这些主题近期才获得突出地位。
Achievement指向评估教育实践或机器学习应用成功的转变;validity表明对研究发现的稳健性和通用性的关注;symptoms则可能暗示了机器学习在识别教育挑战或心理健康问题方面的诊断用途。 -
“Students”, “Outcomes”, “Perceptions” (中位数年份2020-2022): 这些术语表明研究以人为本,探索学习者在教育环境中的体验、结果和观点,强调理解和改进学习者旅程以及教育努力的具体成果的重要性。
总结: 趋势主题分析揭示了一个既成熟又不断发展的领域。对表现、模型和分类的持久关注表明了研究方法和应用中的坚实基础。同时,近期与成就、有效性和症状相关的术语的兴起,表明一个适应性强的研究社区正在应对新兴挑战,并利用先进方法来解决这些挑战。这暗示了一个日益数据驱动和成果导向的研究社区,对研究的有效性和适用性、学生的福祉以及教育技术对学习和成就的直接影响越来越感兴趣。
6.2. 数据呈现 (表格)
本研究是一篇文献计量分析论文,其结果主要以图表形式呈现,并未提供传统意义上的对比实验结果表格。因此,此处不转录表格。
6.3. 消融实验/参数分析
本研究是文献计量分析,旨在概述现有文献的趋势和模式,而不是提出新的机器学习模型或算法。因此,论文中没有进行消融实验或参数分析来验证模型组件的有效性或超参数的影响。消融实验和参数分析通常是针对特定机器学习模型的研究中才会进行的。
7. 总结与思考
7.1. 结论总结
本研究通过对2000年至2023年间机器学习在教育领域应用的文献计量分析,得出了以下关键结论:
-
指数级增长和发展轨迹: 该领域的研究从2000年代初期的停滞状态,经历2018年的显著增长,并在2019-2021年间呈现指数级增长,于2022年达到研究高峰。尽管2023年出版量有所回落,但仍处于高位,这表明该领域已从初期探索发展到稳健的研究活动阶段。COVID-19 大流行对教育范式的冲击,进一步加速了对机器学习变革潜力的认可。
-
全球协作与多维度贡献: 来自不同作者(如 Liu Y.、Wang Y.)、机构(如 Monash University、University of Macau、北京师范大学)和国家(中国贡献显著,美国次之)的多元贡献,凸显了一个充满活力和国际化的研究社区。这种全球协作和跨学科性质对于机器学习技术在教育中的创新整合至关重要。
-
以结果为导向的研究焦点与主题演变: 主题分析(词云、主题图、主题演化图)揭示了研究对
performance(表现)、predictive modeling(预测建模) 和personalization(个性化) 的持续关注,表明该领域是以结果为导向的。同时,COVID-19、mental-health(心理健康) 和neural-networks(神经网络) 等新主题的出现,反映了该领域对外部事件和技术进步的适应性,以及对伦理、后勤和教学影响的日益重视。这些发现共同强调了该领域的动态演变及其对增强教育体验和成果的重大贡献,并强调了在整合机器学习技术时需要深思熟虑,确保教育进步在伦理上站得住脚并普遍受益。
7.2. 局限性与未来工作
7.2.1. 局限性
论文指出了文献计量分析自身的几个主要局限性:
- 量化指标的局限性: 文献计量分析主要关注可量化的指标,如出版物数量和引用次数,这些指标可能无法完全体现一个领域的成熟度或饱和度。仅仅依靠这些指标可能导致对领域发展状况的夸大,而缺乏对研究内容和质量的全面评估。
- 无法评估研究质量: 文献计量分析本身不评估研究论文的内在质量。文章数量或引用频率并不能直接等同于知识论上的影响力。
- 引用实践中的偏见: 引用实践可能存在偏见,例如性别偏见,男性研究人员可能不成比例地引用其他男性研究人员,从而扭曲了学术作品的感知影响力,忽视了女性作者和其他代表性不足群体的贡献。这会导致对高产研究人员或高被引研究的实际影响力的误判。
- 受影响因子和排名影响: 对引用次数和出版物数量的关注,可能更多地反映了学术界与影响因子和排名相关的普遍趋势,而非对研究质量的实质性评估。
7.2.2. 未来工作
基于研究发现,论文提出了几个未来研究方向:
- 深入探索机器学习应用对学生表现和学习成果的影响: 这不仅包括学业成就,还应涵盖学生福祉的更广泛方面,例如“症状”和“心理健康”等近期焦点所暗示的。
- 加强学习分析在教学实践中的整合研究: 随着“分析”日益突出,需要进一步调查学习分析在教学实践中的整合,特别是在日益普遍的在线和混合学习环境中。
- 验证机器学习应用的可靠性和通用性: “有效性”作为一个新兴主题,表明有机会深入探讨机器学习应用在不同教育环境中的可靠性和通用性。
- 关注数据使用和算法决策的伦理维度: 研究人员应考虑教育中数据使用和算法决策的伦理维度,确保该领域的进步对所有学习者都是公平和有益的。
- 探索更复杂的机器学习模型和基于互联网的教育技术: “神经网络”和“互联网”等关键词的出现,指向了更复杂的机器学习模型和日益重要的基于互联网的教育技术潜力。未来的研究可以探索为教育目的量身定制的先进神经网络架构,并检查普遍互联网接入对学习方式和机会的影响。
7.3. 个人启发与批判
7.3.1. 个人启发
这篇论文的文献计量分析为我提供了以下几点启发:
- 跨学科研究的广阔前景: 机器学习与教育的结合是一个典型的跨学科领域,其快速发展和多样化的研究主题表明,许多重要的突破和创新都发生在学科的交叉地带。这启发我应积极寻求不同领域的知识融合,不局限于单一学科的视角。
- 技术演进与社会需求共振: 论文清晰展示了机器学习技术成熟度(如深度学习兴起)与教育领域需求(如个性化学习、在线教育爆发)之间的相互作用,特别是 COVID-19 疫情的催化作用。这提醒我在关注技术发展的同时,更要思考技术如何响应并解决实际的社会问题,从而产生真正的价值。
- 数据驱动决策的潜力与挑战: 机器学习在教育中的核心价值之一是利用数据进行预测和优化。这强调了数据在教育中的关键作用,但也提醒我数据驱动决策并非万能,必须审慎考虑数据质量、算法偏见和伦理解释性等问题。
- 系统性分析的重要性: 文献计量分析作为一种宏观研究方法,能够帮助研究人员快速把握一个领域的全貌、主要趋势和关键贡献者。这种系统性、量化的分析方法对于初入一个新领域的学习者而言,是快速建立知识框架的有效工具。
- 伦理考量先行: 论文在讨论技术潜力的同时,反复强调了伦理考量(如数据隐私、公平性、人类互动替代)。这提醒我,任何新兴技术在应用时,都应将伦理和社会影响置于核心地位,避免“技术至上”的思维。
7.3.2. 批判
尽管本研究提供了全面的文献计量分析,但仍存在一些可以批判或改进的地方:
- 关键词选择的潜在局限性: 论文的搜索策略
TI = ('machine learning' OR 'deep learning') AND ('educat*' OR 'teach*' OR 'learner*' OR 'student*' OR 'class*')主要聚焦于标题关键词。虽然这有助于精确定位,但可能会遗漏在摘要或全文中讨论机器学习在教育应用、但标题未直接提及这些关键词的文献。未来的研究可以考虑扩展搜索范围至摘要或关键词字段。 bibliometrix工具的“黑箱”问题: 论文详细介绍了bibliometrix的功能,但对于初学者而言,如果能更深入地解释bibliometrix在生成主题图(如如何计算中心性和密度)和主题演化图(如何识别主题间的过渡)时所采用的具体算法或统计模型,将更有助于理解结果的内在逻辑。例如,主题聚类方法(如Louvain算法或Walktrap算法)和时间序列主题演化算法(如burst detection)的简要说明,将增强方法论的透明度。- 引用偏见分析的深度不足: 论文在“局限性”部分提到了引用实践中的性别偏见。虽然提到了
Dworkin et al. (2020)等参考文献,但并未在结果分析中实际运用文献计量方法来探讨本研究数据集中是否存在这种偏见。如果能在作者、期刊或国家分析中,对引用中的潜在偏见进行初步探讨(例如,分析高被引作者的性别分布,或不同国家/机构在引用国际合作论文时的倾向),将使批判性分析更具说服力。 - 缺乏对机器学习具体技术和教育阶段的细分: 虽然论文识别了
neural-networks等技术,但整体分析侧重宏观趋势。如果能进一步细分:- 机器学习技术类型: 哪些机器学习算法(如分类、聚类、推荐系统、自然语言处理、计算机视觉)在教育中应用最广?各自的应用场景和效果如何?
- 教育阶段: 机器学习在基础教育、高等教育、职业教育或终身学习中的应用有何差异?这可以从“高等教育”等关键词的出现得到启发,进一步展开细化分析。 这将为教育从业者提供更具体的指导。
- “2023年出版物下降”的解释可能过于乐观: 论文将2023年出版物数量的下降解释为“稳定深化阶段”,即从探索转向质量和实际应用。虽然这是一种可能性,但也应考虑其他因素,例如数据提取时间(2023年12月31日)可能未能完全覆盖该年度所有已被索引的出版物,或者领域在经历了高速增长后自然进入一个平台期。更谨慎的分析会同时讨论多种可能性。
7.3.3. 潜在问题、未经验证的假设或可以改进的地方
- 伦理考量的量化分析: 论文强调了伦理考量的重要性,但文献计量本身很难直接量化这些。未来的研究可以尝试通过关键词共现网络,识别“ethics”、“bias”、“fairness”、“privacy”等伦理相关关键词与具体机器学习应用或教育场景的关联,从而间接分析伦理议题在研究中的关注程度和演变。
- 具体案例分析的缺失: 尽管文献计量分析是宏观的,但在高被引文章部分,如果能结合几个代表性的“成功案例”或“失败案例”进行简要的深度剖析,将有助于读者更好地理解机器学习在教育中实际应用的复杂性,而不仅仅是停留在数据层面。
- 政策影响力的探讨: 论文目标是为政策制定者提供路线图,但对现有研究如何影响政策的探讨较少。未来的文献计量分析可以尝试纳入政策文件、政府报告或教育标准等非学术文献的分析,以更全面地评估研究的政策影响力。
- 软件使用细节的补充: 尽管提到了
bibliometrix R-package,但对于初学者,如果能提供一些关键函数(例如用于生成词云、主题图的函数名称)的示例或简要描述,将有助于读者复现或进行类似分析。
相似论文推荐
基于向量语义检索推荐的相关论文。