A systematic review and sequential explanatory synthesis: Artificial intelligence in healthcare education, a case of nursing
TL;DR 精炼摘要
本研究系统评估人工智能(AI)对护理学生知识获取、技能发展和态度的影响,采用序贯解释性混合方法进行分析。结果显示,AI干预能显著提升学生的知识和技能,并改善学习投入与自我效能感,表明AI在护理教育中具有重要潜力,同时强调了政策标准化与教师培训的必要性。
摘要
Aim: This review aims to explore the impact of artificial intelligence (AI) on knowledge acquisition, skills development, and attitudes among nursing students. Background: AI offers hopeful opportunities to enhance learning experiences and prepare future healthcare professionals. Methods: This was a sequential explanatory mixed-method systematic review. This review was conducted in line with the Preferred Reporting Items for Systematic Reviews and Meta-Analyses (PRISMA) guidelines. A comprehensive electronic database was searched to identify relevant studies. Eligibility criteria were studies examining the impacts of AI interventions on nursing students’ knowledge, skills, or attitudes. The methodological quality of the studies was assessed using the mixed-method appraisal tool. Results: Nine research articles were included in the review. These studies utilized both quantitative and qualitative methodologies to examine the impact of AI on nursing students. Quantitative studies found positive relations between AI interventions and knowledge acquisition, skills development, and attitudes toward AI among nursing students. Qualitative findings revealed the positive outcomes of AI in fostering learning engagement, self-efficacy, and confidence. Conclusions: AI shows potential for supporting knowledge acquisition, skills development, and fostering positive attitudes among nursing students. Implications for nursing practice and nursing policy: AI-driven interventions enhance nursing education by improving clinical decision-making, confidence, and knowledge acquisition. By integrating AI, nurse educators can develop more interactive, personalized, and impactful learning environments that may help students with the complexities of contemporary healthcare. Policies, standardized guidelines, and faculty development programs may be developed that can promote ethical AI integration, equitable access, and faculty training. These changes can be considered essential to maximize AI’s benefits.
思维导图
论文精读
中文精读
1. 论文基本信息
1.1. 标题
A systematic review and sequential explanatory synthesis: Artificial intelligence in healthcare education, a case of nursing (人工智能在医疗保健教育中的系统评价与序贯解释性综合:以护理为例)
1.2. 作者
S. Asli Bozkurt PhD, RN, CHSE (助理教授), Sinan Aydoan PhD, RN (助理教授), Fatma Dursun Ergezen PhD, RN (助理教授), Aykut Türkolu PhD (访问学者)。 作者分别来自马萨诸塞药学与健康科学大学、布尔杜尔穆罕默德阿基夫埃尔索伊大学、阿克德尼兹大学和波士顿大学。
1.3. 发表期刊/会议
International Nursing Review。该期刊是护理领域的重要学术出版物,发表高质量的护理研究和评论,在国际护理界具有一定的声誉和影响力。
1.4. 发表年份
2025年
1.5. 摘要
本研究旨在通过系统评价探讨人工智能 (AI) 对护理学生知识获取 (knowledge acquisition)、技能发展 (skills development) 和态度 (attitudes) 的影响。随着 AI 在医疗保健领域提供增强学习体验和培养未来医疗专业人员的潜力,本研究采用了一种序贯解释性混合方法系统评价 (sequential explanatory mixed-method systematic review),遵循系统评价和荟萃分析优先报告项目 (PRISMA) 指南。研究人员对综合电子数据库进行了搜索,以识别评估 AI 干预对护理学生知识、技能或态度影响的相关研究。通过混合方法评估工具 (MMAT) 评估了研究的方法学质量。最终纳入了九篇研究文章,这些文章均采用定量和定性方法来检验 AI 对护理学生的影响。定量研究发现 AI 干预与护理学生的知识获取、技能发展以及对 AI 的态度之间存在正相关。定性研究结果揭示了 AI 在促进学习投入 (learning engagement)、自我效能感 (self-efficacy) 和信心 (confidence) 方面的积极成果。结论表明,AI 在支持护理学生的知识获取、技能发展和培养积极态度方面具有潜力。对于护理实践和政策的启示是,AI 驱动的干预措施可以通过改善临床决策、信心和知识获取来增强护理教育。通过整合 AI,护理教育者可以开发更具互动性、个性化和影响力的学习环境,以帮助学生应对当代医疗保健的复杂性。此外,制定政策、标准化指南和教师发展计划对于促进 AI 的伦理整合、公平获取和教师培训至关重要,以最大限度地发挥 AI 的益处。
1.6. 原文链接
/files/papers/6939911daf4df128671a0d89/paper.pdf (PDF 链接,已正式发表)
2. 整体概括
2.1. 研究背景与动机
2.1.1. 核心问题
论文试图解决的核心问题是:人工智能 (AI) 在护理教育中,对护理学生的知识获取 (knowledge acquisition)、技能发展 (skills development) 和态度 (attitudes) 有何影响?
2.1.2. 问题的重要性与现有研究空白
当前,AI 正日益渗透到医疗保健领域,为增强学习体验和培养未来医疗专业人员提供了“充满希望的机遇” (hopeful opportunities)。AI 有潜力“增强患者结果” (enhance patient outcomes)、“优化流程” (optimize processes) 和“支持医疗实践的持续进步” (support the ongoing advancement of healthcare practices)。护理教育作为医疗保健领域的重要组成部分,也应积极拥抱 AI。
AI 在护理教育中具有多种应用,包括模拟 (simulation)、绩效评估 (performance assessment)、个性化反馈 (personalized feedback)、创新教育材料开发 (development of creative educational materials)、案例研究开发 (development of case studies) 和自主学习 (self-directed learning)。AI 还可以帮助护士顺利过渡到工作环境,提升其实际应用知识基础,同时降低培训成本,并自动化行政任务,让教育者能更专注于教学和指导。
然而,尽管 AI 在护理教育中具有潜在益处,但也存在挑战和空白:
-
过度依赖 AI 风险: 可能阻碍护理学生“批判性思维技能” (critical thinking skills) 的发展。
-
算法偏见: AI 算法可能“无意中增加其训练数据中存在的偏见” (unintentionally increase biases present in their training data),导致教育和患者护理结果的不平等。
-
数据隐私与安全: 使用 AI 工具涉及敏感学生和患者数据的收集和存储,引发“伦理和法律问题” (ethical and legal concerns)。
-
经济负担: 实施和维护 AI 技术的“财务负担” (financial burden) 可能分散其他必要教育组成部分的资金。
-
现有证据不足: 作者指出,尽管存在这些讨论,但目前尚缺乏“广泛的批判性文献综述” (extensive critical literature review) 来总结和解释 AI 干预对护理学生知识、技能和态度的潜在用途和影响。
因此,本研究的动机是填补这一文献空白,通过系统评价来系统地梳理和评估 AI 在护理教育中的实际影响,为 AI 的谨慎和周到整合提供实证基础。
2.1.3. 论文的切入点或创新思路
本论文的创新之处在于,它首次采用了一种“序贯解释性混合方法系统评价” (sequential explanatory mixed-method systematic review) 的方式,综合了定量和定性研究的结果,以全面理解 AI 对护理学生知识、技能和态度的影响。这种方法不仅量化了 AI 的效果,还深入探讨了学生对 AI 干预的感知和体验,从而提供了更丰富、更具洞察力的分析。
2.2. 核心贡献/主要发现
2.2.1. 主要贡献
本研究的主要贡献在于首次系统性地综合了人工智能在护理教育中对学生知识、技能和态度的影响。它不仅识别了 AI 带来的积极效益,还揭示了实施过程中面临的挑战和关注点。通过采用混合方法系统评价,本研究提供了一个全面的视角,融合了定量数据(关于效果)和定性数据(关于学生体验和感知),为护理教育者和政策制定者提供了整合 AI 的实证基础和实践指导。
2.2.2. 关键结论或发现
- 知识获取 (Knowledge Acquisition): 定量研究发现 AI 干预与知识获取之间存在正相关。AI 能够增加学生对教育的兴趣和自主学习 (self-directed knowledge) 能力。
- 技能发展 (Skills Development): AI 在提升护理学生的沟通技能方面显示出潜力,特别是在处理敏感话题时。然而,在某些技能(如乳房自我检查技能)上,AI 干预组的表现可能低于传统方法组,在临床推理技能方面也未显示显著改善。
- 态度 (Attitudes): AI 干预能显著提升学生对沟通技能的态度和沟通自我效能感 (self-efficacy in communication)。对 AI 的积极态度与更高的采纳意图相关,而焦虑和负面态度则可能阻碍 AI 的采纳。
- 学习投入与信心 (Learning Engagement and Confidence): 定性研究强调 AI 能增强学习投入、自我效能感和信心,尤其是在使用用户友好的 AI 工具时。
- 挑战与担忧 (Challenges and Concerns): 学生对 AI 缺乏互动性、真实性和情感深度表示担忧。此外,对工作流失的担忧也是学生们关注的一个重要方面。
- 政策与实践启示 (Implications for Policy and Practice): AI 驱动的干预措施可以增强临床决策、信心和知识获取。需要制定政策、标准化指南和教师发展计划,以促进伦理整合、公平获取和教师培训,从而最大限度地发挥 AI 的益处。
3. 预备知识与相关工作
3.1. 基础概念
3.1.1. 人工智能 (Artificial Intelligence, AI)
概念定义: 人工智能 (AI) 指的是能够辅助做出逻辑和合理判断的计算机软件。它涉及使机器能够模拟、扩展甚至超越人类智能的理论、方法、技术和应用领域。在医疗保健和教育领域,AI 通常指的是利用算法和模型来处理数据、识别模式、提供个性化指导或自动化任务。
3.1.2. 知识、技能和态度 (Knowledge, Skills, and Attitudes, KSAs)
概念定义: 在护理教育中,知识、技能和态度 (KSAs) 是一种广泛使用的框架,用于将学习结果分类为不同复杂性和特异性水平。它们是评估能力、绩效和成果的基本指标。
- 知识 (Knowledge): 指通过教育或经验获得的意识、理解和专业知识。它包括事实、概念、理论和程序性知识。
- 技能 (Skill): 指通过有意识的实践和持续努力而发展起来的执行任务的能力。这可以是认知技能(如批判性思维)或心理运动技能(如临床操作)。
- 态度 (Attitude): 指个体对想法、个体或情境表现出有利或不利反应的倾向。它反映了个体的信念、情感和行为意图。
3.1.3. 布鲁姆分类法 (Bloom's Taxonomy)
概念定义: 布鲁姆分类法 (Bloom's Taxonomy) 是由本杰明·布鲁姆 (Benjamin Bloom) 及其同事开发的一个教育目标分类系统,它将学习目标分为三个领域:认知领域(知识)、情感领域(态度)和心理运动领域(技能)。该分类法提供了一个结构,用于评估护理学生在不同认知、心理运动和情感领域的能力,确保所提供的教育符合学术标准和医疗保健环境的动态需求。
3.1.4. 系统评价 (Systematic Review)
概念定义: 系统评价 (Systematic Review) 是一种通过系统性地识别、选择、评估和综合所有现有相关研究证据来回答特定研究问题的研究方法。它旨在减少偏见,提供可靠和综合的证据。
3.1.5. 混合方法研究 (Mixed-Method Research)
概念定义: 混合方法研究 (Mixed-Method Research) 是一种研究设计,其中研究者收集和分析定量 (quantitative) 和定性 (qualitative) 数据,将两种形式的数据整合起来,并使用这些整合的结果进行解释。这种方法旨在为研究问题提供更全面、深入的理解。
3.1.6. 序贯解释性混合方法系统评价 (Sequential Explanatory Mixed-Method Systematic Review)
概念定义: 序贯解释性混合方法系统评价 是一种特定类型的混合方法系统评价,其特征是先进行定量数据的分析和综合 (QUAN),然后在此基础上进行定性数据的分析和综合 (QUAL),并利用定性结果来解释或深入理解定量结果。这种方法能够提供关于现象的广度(来自定量数据)和深度(来自定性数据)的理解。
3.1.7. PRISMA (Preferred Reporting Items for Systematic Reviews and Meta-Analyses)
概念定义: PRISMA (Preferred Reporting Items for Systematic Reviews and Meta-Analyses) 是一套用于报告系统评价和荟萃分析的指南。它旨在帮助作者提高报告的透明度和完整性,使读者能够评估研究的可靠性和有效性。
3.1.8. MMAT (Mixed-Method Appraisal Tool)
概念定义: MMAT (Mixed-Method Appraisal Tool) 是一种专门用于评估定性、定量和混合方法研究方法学质量的工具。它包含五套问题,每套问题针对不同类型的研究设计,帮助研究者系统地评估纳入研究的偏倚风险。
3.2. 前人工作
作者在引言部分提及了多项相关工作,主要围绕 AI 在护理教育中的应用、潜在益处以及面临的挑战。
3.2.1. AI 在护理教育中的应用示例
- 模拟、评估与反馈:
Baashar et al., 2022; Irwin et al., 2023; Swiecki et al., 2022提到 AI 可用于模拟、绩效评估和个性化反馈。 - 教育材料与案例研究:
Baashar et al., 2022提及 AI 可用于开发创新教育材料和案例研究。 - 自主学习:
Baashar et al., 2022; Irwin et al., 2023; Swiecki et al., 2022指出 AI 有助于促进自主学习。 - 过渡到工作环境:
Abujaber et al., 2023; Alzahrani et al., 2023认为 AI 能帮助护士更好地过渡到工作环境,提升实践知识并降低培训成本。 - 行政任务自动化:
Kilmon et al., 2010提到 AI 技术可以自动化排班、评分和数据管理等行政任务,减轻教育者的负担。 - 虚拟模拟:
Gillespie et al., 2021; Hameed et al., 2022强调 AI 驱动的虚拟模拟提供安全逼真的环境,供学生练习临床技能和决策,而不会危及患者。Rahman et al., 2022进一步指出,这些模拟也有助于理解“健康社会决定因素” (social determinants of health)。 - 预测分析:
Moseley & Mead, 2008; Rastrollo-Guerrero et al., 2020提到 AI 的预测分析能早期识别有学术或临床困难风险的学生,通过分析评估分数、出勤率和参与模式,使教育者能及时干预和支持。
3.2.2. AI 整合的挑战与担忧
- 过度依赖与批判性思维:
Glauberman et al., 2023指出,过度依赖 AI 可能阻碍护理学生批判性思维技能的发展。 - 算法偏见:
Borg, 2022警告 AI 算法可能无意中增加训练数据中的偏见,导致护理教育和患者护理结果的不平等。 - 数据隐私与安全:
Borenstein & Howard, 2021提出了使用 AI 工具时涉及敏感数据收集和存储的伦理和法律担忧。 - 经济负担:
De Gagne, 2023提及实施和维护 AI 技术的财务负担可能分散其他必要教育组成部分的资金。
3.2.3. 差异化分析
本研究与前人工作的核心区别在于,它不是简单地探讨 AI 在护理教育中的某一方面应用或提出其潜在益处和挑战,而是通过一种混合方法系统评价,对 AI 对护理学生 KSAs 的影响进行全面、综合且有实证支持的评估。虽然前人工作讨论了 AI 的应用和挑战,但本研究通过严格的系统评价方法,将这些分散的知识点整合起来,并利用定性数据深入解释定量结果,为 AI 在护理教育中的实际效益和局限性提供了更坚实的证据基础。特别地,它关注了 KSAs 这一布鲁姆分类法框架下的核心学习成果,使得研究结果更具教育实践指导意义。
4. 方法论
4.1. 方法原理
本研究采用了一种序贯解释性混合方法系统评价 (sequential explanatory mixed-method systematic review) 的设计。其核心思想是首先对定量研究的结果进行综合分析 (QUAN),然后对定性研究的结果进行综合分析 (QUAL),并最终利用定性结果来解释或深化对定量结果的理解。这种方法旨在通过结合两种数据类型的优势,为 AI 在护理教育中对知识、技能和态度的影响提供一个全面而深入的视角。定量数据提供了关于效果的广度信息,而定性数据则提供了学生体验和感知背后的深度洞察。
4.2. 核心方法详解 (逐层深入)
4.2.1. 研究问题制定
研究问题是使用 PICO (Population, Intervention, Comparator, Outcome) 元素框架制定的,这是一种在系统评价中常用的方法,用于明确研究的范围和目标。
- 定量研究问题:
AI基于的干预措施 (I) 对护理学生KSAs(O) 的影响是什么,与传统教育 (C) 相比? - 定性研究问题: 护理学生对
AI基于的教育干预措施 (I) 对其KSAs(O) 的益处和挑战 (O) 的看法是什么,与传统教育 (C) 相比?
PICO 元素解释:
- (Population): 人群,指研究对象。在本研究中是
护理学生(undergraduate and graduate nursing students)。 - (Intervention): 干预措施,指研究中施加的特定处理。在本研究中是
人工智能基于的教育干预(Artificial intelligence-based education interventions)。 - (Comparator): 比较器,指与干预措施进行比较的对照组。在本研究中是
传统教育(Traditional education)。 - (Outcome): 结果,指研究关注的衡量指标。在本研究中是学生们的
知识、技能或态度(knowledge, skills, or attitudes) 以及对益处和挑战的感知(perceptions of the benefits and challenges)。
4.2.2. 设计与报告指南
- 设计类型:
序贯解释性混合方法系统评价(sequential explanatory mixed-method systematic review)。 - 报告指南: 遵循
系统评价和荟萃分析优先报告项目(Preferred Reporting Items for Systematic Reviews and Meta-Analyses, PRISMA) 指南进行报告,以确保报告的透明度和完整性。 - 研究协议注册: 研究协议已在
PROSPERO注册,注册号为CRD42023428702-ID。
4.2.3. 系统评价七个标准步骤
本系统评价遵循了七个标准步骤:
- 制定定性和定量研究问题: 如上文
4.2.1节所述。 - 确定资格标准: 明确哪些研究将被纳入或排除。具体标准见下文
4.2.4节。 - 在多个数据库中进行全面文献搜索: 确保广泛覆盖相关研究。
- 识别潜在相关研究: 初步筛选搜索结果。
- 根据全文审查选择相关研究: 对初步筛选后的研究进行深入评估。
- 评估纳入研究的质量: 使用适当工具评估研究的方法学严谨性。
- 综合纳入研究的发现: 整合和解释所有纳入研究的结果。
4.2.4. 纳入和排除标准 (Eligibility Criteria)
研究的纳入和排除标准严格按照 PICO 原则制定,具体如下:
TA B LE 1 The inclusion and exclusion criteria
| The inclusion criteria | The exclusion criteria | |
|---|---|---|
| Population | Nursing students (undergraduate and graduate) | Studies related to patient education, nurses, or students other than nursing students |
| Intervention | Artificial intelligence-based education interventions | Studies that did not include AI-based educational interventions |
| Comparison | Traditional education | |
| Outcomes | Students' knowledge, skills, or attitudes | Studies evaluated other outcomes other than knowledge, skills, or attitudes |
4.2.5. 搜索方法
- 搜索词: 搜索词由相关的
医学主题词(MeSH words) 和其他相关关键词组成,具体列表在附录 A 中(原文未提供)。 - 数据库:
CINAHL COMPLETE(Cumulative Index to Nursing and Allied Health Literature)、MEDLINE、Web of Science、PubMed和ProQuest Central。 - 搜索时间: 在
2023年12月27日进行搜索,没有时间范围限制。 - 筛选流程:
- 首先评估标题和摘要。
- 然后审查全文。
- 最后使用
PICO纳入和排除标准选择符合条件的研究。
- 去重: 使用
Endnote X9.3.3软件自动去重,并由两名研究员 (A 和 B) 手动验证。 - 独立审查: 两名独立审查员 (A 和 B) 根据预定义的资格标准搜索标题和摘要。冲突或分歧通过讨论解决,或咨询第三名审查员 (C)。
4.2.6. 搜索结果与筛选过程
初始搜索策略在所选数据库中确定了 1922 项研究。移除重复记录 (n=72) 后,剩余 1850 项研究。审查标题和摘要后,根据纳入和排除标准排除了 1815 项研究。
剩余的 35 篇全文研究被评估资格。其中 26 项研究因各种原因被排除:
- 社论 (editorial):
- 不关注 AI (not focusing on AI):
- 不涉及学生 (not related to students):
- 非研究 (not research):
- 综述 (review):
- 不涉及护理 (not related to nursing):
- 撤回 (retracted):
- 重复 (duplication):
最终,有
9篇研究文章被纳入本次系统评价。
PRISMA 流程图:
该图像是PRISMA流程图,展示了在进行人工智能在护理教育中的影响研究系统评价时,文献筛选的各个阶段,包括识别、筛选和纳入的研究数量。最终纳入的研究数量为9。
4.2.7. 质量评估 (Quality Appraisal)
- 工具: 使用
混合方法评估工具(Mixed-Method Appraisal Tool, MMAT) 来评估纳入研究的方法学质量。 - MMAT 介绍: MMAT 包含五套问题,每套问题用于评估不同研究类型(定性、定量和混合方法)的质量。回答选项为“是”、“否”或“无法判断”。
- 评估原则: 虽然早期版本 MMAT 会计算总分(通过满足标准的数量除以 4),但最新版本建议对文章进行
整体评估(holistic assessment),而非仅仅依赖总分。 - 独立评估与共识: 两名研究员 (A 和 C) 独立审查研究。不一致之处由三名研究员 (A, B 和 C) 重新检查和讨论,直至达成共识。
4.2.8. 数据提取 (Data Extraction)
- 去重: 首先使用
Endnote X9.3.3软件去重。 - 独立筛选: 两名独立审查员 (A 和 B) 根据预定义的资格标准搜索标题和摘要。冲突或分歧通过讨论解决,或咨询第三名审查员 (C)。
- 全文评估: 检索并进一步评估可能符合条件的全文文章。记录排除全文筛选阶段的原因。
- 定性分析软件: 将符合条件的文章导入
ATLAS.ti定性分析软件,用于高效组织、分类、编码、标注和数据管理。 - 标准化表格: 使用标准化表格提取相关数据,包括:(1) 作者、年份和国家;(2) 目的/研究问题;(3) 设计;(4) 样本量;(5) 理论框架;(6) 工具(见 Table 2)。
4.2.9. 伦理考量 (Ethical Consideration)
所有数据和信息均来自公开可用的文献和数据库,因此无需伦理委员会批准。
4.2.10. 定量和定性发现的综合 (Synthesis of Quantitative and Qualitative Findings)
- 序贯解释性方法: 遵循序贯解释性方法,即定量 (QUAN) 综合先于并塑造定性 (QUAL) 综合,定性综合有助于解释某些定量综合发现。
- 第一步 QUAN: 将定量研究和混合方法研究中的定量结果结合到证据表中。
- 第二步 QUAL: 通过定性主题分析整合定性研究和混合方法研究中的定性结果。
- 新见解: 结合解释第一步和第二步的结果,旨在提供新的见解并揭示知识空白。
5. 实验设置
5.1. 数据集
本研究并未直接进行实验,而是对已发表的研究进行系统评价。因此,数据集指的是纳入系统评价的 9 篇研究各自所使用的数据集和研究对象。这些研究的样本量从 24 到 697 名参与者不等,研究对象均为护理学生(包括本科生和研究生)。
纳入研究的地理分布:
- 新加坡 (Singapore): 2 项研究 (Shorey et al., 2020, 2023)
- 韩国 (Republic of Korea): 3 项研究 (Han et al., 2022; Kwak et al., 2022a, 2022b)
- 土耳其 (Turkey): 1 项研究 (Simsek-Cetinkaya & Cakir, 2023)
- 西班牙 (Spain): 1 项研究 (Rodriguez-Arrastia et al., 2022)
- 沙特阿拉伯 (Saudi Arabia): 1 项研究 (Farghaly Abdelaliem et al., 2022)
- 台湾 (Taiwan): 1 项研究 (Chang et al., 2022)
5.2. 评估指标
本系统评价的评估指标是 AI 干预对护理学生 知识 (knowledge)、技能 (skills) 和 态度 (attitudes) 的影响。具体到每项纳入研究,它们使用了各自的评估工具和指标来衡量这些方面。
以下是纳入研究中使用的部分评估工具,以及它们可能对应的概念定义、数学公式和符号解释(如果原文提供了这些细节,则优先使用原文;否则,将提供通用解释):
5.2.1. 知识相关评估工具
- AI 认知 (AI Perception):
- 概念定义: 衡量学生对人工智能的理解、看法和信念。这通常通过问卷调查来评估学生对 AI 的认识程度、对 AI 在医疗领域应用的了解等。
- 数学公式: 通常通过李克特量表 (Likert scale) 评分,然后计算平均值、标准差或进行相关性分析。没有统一的数学公式,取决于具体问卷设计。
- 符号解释: 表示第 个学生的得分, 表示学生总数。
- 伦理意识 (Ethical Awareness):
- 概念定义: 衡量学生对 AI 应用中伦理问题的认识和敏感度。可能包括对数据隐私、算法偏见、责任归属等伦理挑战的理解。
- 数学公式: 如
The Test for AI Ethics Awareness,通常是得分制问卷。 - 符号解释: 同上,基于问卷得分。
- 自主学习 (Self-directed Knowledge) / 学习成就 (Learning Achievement):
- 概念定义: 衡量学生在学习过程中的主动性、独立学习能力或在特定知识领域的掌握程度。
- 数学公式: 例如,考试得分、前后测差异等。 其中, 为知识改变, 为后测得分, 为前测得分。
- 符号解释: 表示学生在干预后的知识得分, 表示学生在干预前的知识得分。
- 胎儿电子监测 (Electronic Fetal Monitor, EFM) 临床推理能力 (Clinical Reasoning Competency):
- 概念定义: 衡量学生在解读 EFM 数据并做出相应临床决策的能力。
- 数学公式: 特定于 EFM 案例的评估量表得分。
- 符号解释: 依赖于具体的评估量表。
5.2.2. 技能相关评估工具
- 沟通技能 (Communication Skills):
- 概念定义: 衡量学生在临床情境中与患者、家属或其他医疗专业人员有效交流的能力。
- 数学公式:
Communication Skills Attitude Scale或其他结构化观察量表得分。 - 符号解释: 表示沟通技能得分,范围通常为 0 到量表最大值。
- 临床推理技能 (Clinical Reasoning Skills):
- 概念定义: 衡量学生在复杂临床情境中收集、分析信息并做出判断和决策的能力。
- 数学公式: 评估量表得分。
- 符号解释: 表示临床推理技能得分。
- 乳房自我检查技能 (Breast Self-Examination Skills):
- 概念定义: 衡量学生正确执行乳房自我检查步骤的能力。
- 数学公式: 实践评估量表得分。
- 符号解释: 表示乳房自我检查技能得分。
5.2.3. 态度相关评估工具
- 对 AI 的态度 (Attitudes toward AI):
- 概念定义: 衡量学生对人工智能技术的总体情感、信念和倾向。
- 数学公式:
The General Attitudes toward AI Scale等量表得分。 - 符号解释: 表示对 AI 的态度得分,通常通过李克特量表汇总。
- AI 自我效能 (AI Self-efficacy):
- 概念定义: 衡量学生对自己能够成功使用 AI 相关工具或掌握 AI 相关概念的信念。
- 数学公式:
The Technology Acceptance Model(TAM) 中的自我效能子量表得分。 - 符号解释: 表示 AI 自我效能得分。
- AI 行为意图 (AI Behavioral Intention):
- 概念定义: 衡量学生使用 AI 基于的医疗保健技术的可能性或倾向。
- 数学公式:
统一技术接受与使用理论(Unified Theory of Acceptance and Use of Technology, UTAUT) 中的行为意图量表得分。 - 符号解释: 表示 AI 行为意图得分。
- 焦虑 (Anxiety):
- 概念定义: 衡量学生在使用 AI 或面对新技术时的紧张、担忧或不安情绪。
- 数学公式:
State-Trait Anxiety Inventory(STAI) 或其他焦虑量表得分。 - 符号解释: 表示焦虑得分。
- 满意度 (Satisfaction):
- 概念定义: 衡量学生对 AI 干预或学习体验的满意程度。
- 数学公式: 通常通过问卷调查的满意度得分。
- 符号解释:
Sat表示满意度得分。
5.3. 对比基线
在纳入的实验性研究中,常见的对比基线是传统教育 (traditional education)。这意味着 AI 干预的效果会与传统的教学方法(例如,课堂授课、书籍阅读、非 AI 辅助的模拟练习等)进行比较。这种比较旨在确定 AI 干预是否能带来显著优于传统方法的学习成果。
6. 实验结果与分析
6.1. 核心结果分析
本系统评价共纳入了 9 篇研究文章,其中包括 7 篇定量研究(Farghaly Abdelaliem et al., 2022; Han et al., 2022; Kwak et al., 2022a, 2022b; Shorey et al., 2023; Simsek-Cetinkaya & Cakir, 2023; Chang et al., 2022)、2 篇定性研究(Rodriguez-Arrastia et al., 2022; Shorey et al., 2020)和 1 篇混合方法研究(Chang et al., 2022)。
6.1.1. 定量研究结果
定量研究结果被分类为三个主题:知识、技能和态度。
6.1.1.1. 主题 1: 知识
在知识主题下,研究涵盖了自主学习知识 (self-directed knowledge)、AI 认知 (AI perception)、伦理意识 (ethical awareness)、自我效能 (self-efficacy) 和电子胎儿监护仪 (Electronic Fetal Monitor, EFM) 等定向知识。
- AI 认知与智能设备成瘾: Abdelaliem et al. (2022) 发现
AI 认知与智能手机成瘾呈正相关。83.6% 的学生对 AI 有高水平的认知。 - AI 伦理意识与自我效能: Kwak, Ahn, et al. (2022) 发现
AI 伦理意识与AI 自我效能呈正相关。 - 移动聊天机器人与学习成就: Chang et al. (2022) 评估了学生在
产科疫苗知识、传染病知识和孕妇接种决策能力方面的表现,发现移动聊天机器人学习方法显著提高了这些知识领域。 - AI 聊天机器人作为教学工具: Han et al. (2022) 使用 AI 作为教学工具,发现
EFM知识没有变化,但对教育的兴趣和自主学习水平显著增加。
6.1.1.2. 主题 2: 技能
技能主题涵盖了沟通技能 (communication skills)、临床推理技能 (clinical reasoning skills) 和乳房自我检查技能 (breast self-examination skills)。
- 沟通技能: Shorey et al. (2023) 发现 AI 帮助护理学生
改善了临床沟通技能。 - 临床推理技能: Han et al. (2022) 的研究中,AI
未能帮助学生改善临床推理技能。 - 乳房自我检查技能: Simsek-Cetinkaya and Cakir (2023) 发现,采用 AI 辅助乳房自我检查的组,其技能表现得分
显著低于标准化患者组。
6.1.1.3. 主题 3: 态度
态度主题包括对沟通技能的态度 (attitude toward communication skills)、乳房自我检查满意度 (breast self-examination satisfaction)、焦虑 (anxiety)、AI 自我效能 (AI self-efficacy)、AI 行为意图 (AI behavioral intention) 和对 AI 的总体态度 (overall attitude toward AI)。
- 沟通技能与自我效能: Shorey et al. (2023) 观察到,在 AI 辅助干预后,
对沟通技能的态度和沟通自我效能感显著增强。 - 乳房自我检查满意度与焦虑: Simsek-Cetinkaya and Cakir (2023) 报告称,使用 AI 进行乳房自我检查的参与者
满意度更高,但焦虑水平也更高。 - 焦虑与 AI 态度: Kwak, Ahn, et al. (2022) 发现
焦虑与对 AI 的负面态度呈正相关,而AI 自我效能与AI 伦理意识呈正相关。 - 智能手机成瘾与 AI 认知: Abdelaliem et al. (2022) 发现
智能手机成瘾与AI 认知呈正相关。 - AI 行为意图: Kwak, Seo, et al. (2022) 阐明,
AI 行为意图与绩效预期(performance expectancy)、努力预期(effort expectancy)、社会影响(social influence)、便利条件(facilitating conditions)、自我效能(self-efficacy) 和对 AI 的积极态度呈正相关。相反,AI 行为意图与焦虑和对 AI 的负面态度呈负相关。
6.1.2. 定性研究结果
定性研究分析识别出三个主要主题:学习增强和信心、用户友好界面和可访问性以及挑战和担忧。
6.1.2.1. 主题 1: 学习增强和信心
- 学习投入与理解: 移动聊天机器人学习方法“不仅具有娱乐性,而且促进了对母婴传染病预防和产科疫苗知识的理解,使学习更具吸引力” (Chang et al., 2022)。
- 深入探索与整合: 这种方法“能够深入探索和整合产科疫苗知识,提高教育女性和家庭的能力” (Chang et al., 2022)。
- 信心与支持: 聊天机器人“利用循证信息,增强护理实践中的信心,并为护理环境中的任何疑问提供快速、用户友好的帮助” (Rodriguez-Arrastia et al., 2022)。
6.1.2.2. 主题 2: 用户友好界面和可访问性
- 用户友好与安全实践: AI 工具具有用户友好的界面,确保可访问性并促进安全的实践环境。
- 技术与专业沟通: 与 AI 增强的虚拟患者的互动增强了学生在技术和专业沟通技能方面的信心 (Shorey et al., 2020)。
- 信息获取与紧急情况: 学生赞赏通过聊天机器人轻松获取最新信息 (Chang et al., 2022) 以及聊天机器人在紧急情况下的实用性和用户友好性 (Rodriguez-Arrastia et al., 2022)。
6.1.2.3. 主题 3: 挑战和担忧
- 专业接受度: “专业接受度可能更多地受到对未知事物的恐惧而非年龄的阻碍” (Rodriguez-Arrastia et al., 2022)。
- 互动与思维深度: 缺乏互动、信心和思维深度是 AI 学习中被注意到的问题 (Chang et al., 2022)。
- 真实性与情感深度: 虚拟患者程序因其“有限的真实性、情感深度、反应多样性和缺乏非语言线索”而受到批评,影响了感知效果 (Shorey et al., 2020)。
6.1.3. 定量与定性发现的综合 (Synthesis of Quantitative and Qualitative Findings)
综合定量和定性数据旨在评估 AI 对护理学生 KSAs 的影响。
- 知识与态度: 综合证据表明 AI 对学生的
知识和态度有益。AI 在护理教育中的使用与知识增加呈正相关(定量),而定性洞察强调了其对学习的积极影响。 - 负面态度与焦虑: 相反,
对 AI 的负面态度与焦虑增加相关,这可能降低学习成果。 - 心理运动技能: AI 对
心理运动技能的影响需要进一步研究,因为现有数据未能提供明确结论。
6.2. 数据呈现 (表格)
以下是原文 Table 2 的结果,展示了纳入研究的特征:
TA B LE 2 Study characteristics from all the included studies are shown in Table 2.
| First author, year, and country | Aim/research questions | Design | Sample size | Theoretical framework | Instruments | Results | ||
| Abdelaliem, 2022 Saudi Arabia | To investigate the relationship between nursing students' smart device addiction and their perception | Quantitative, descriptive, correlational, and cross-sectional study | 697 | None specified | The demographic data collection form The smartphone addiction | There was a significant correlation smart device addiction and the AI students. In addition, 83.6% of the levels of perception of AI. | ||
| Chang, 2022 Taiwan | 1Could the mobile chatbot-based learning approach promote students' learning achievement in an obstetric vaccination knowledge course when compared with conventional instruction? 2. Could the mobile chatbot-based learning approach promote students' self-efficacy in an obstetric vaccination knowledge | pre- and post-testing | Quasi-experiment with 36 | None specified | The AI questionnaire Test questions developed by researchers | The mobile chatbot for learning ir students' learning achievement reg obstetric vaccination knowledge, and learning experience. | ||
| Han, 2022 Korea | conventional instruction? To develop and evaluate the effect of an AI chatbot educational program for improving nursing college | Quasi-experimental study 61 (nonequivalent control group pretest-posttest | None specified | - The EFM clinical reasoning competency The confidence in fetal | There were no statistically signific differences in knowledge, clinical competency confidence, and feed satisfaction, between the experime and the control group. Interest in | |||
| Kwak, Ahn, 2022a Korea | To assess nursing students' ethical awareness, attitude, anxiety, and self-efficacy toward AI and identified the factors influencing behavioral intention to use AI-based healthcare | Cross-sectional study | 189 | None specified | The Test for AI Ethics Awareness The General Attitudes toward AI Scale The Technology Acceptance Model | in the experimental group than in group. A positive attitude toward AI and were the two variables that had a influence on nursing students' beh intentions to use AI-based health technology. | ||
| First author, year, Theoreticaland country Aim/research questions Design Sample size framework Instruments Results | ||||||||
| Kwak, Seo, 2022b To create and evaluate hypothetical Path analysis study 210 None specified The General Attitudes Positive attitude toward AI and facilitating | ||||||||
| Korea paths, incuding sel-effacy, axiy,and negative and positive attitudestoward the use of technology.Shorey, 2020 To investigate students' virtual Descriptive qualitative 24 None specified | toward AI Scale. conditions predicted intent to use, whereas the | |||||||
| path from negative attitude to intent to use was | ||||||||
| Singapore patient training experiences and studyperceived usefulness on their | developed by researchers | |||||||
| clinical facilitators' perspectives onental clinical communication skills. | ||||||||
| suggestions. Themes under clinical facilitators' | ||||||||
| evaluations included: (1) insights into students' | ||||||||
| communication skills and (2) approaches to | ||||||||
| improve communication skills. | ||||||||
| Shorey, 2023 To evaluate the effectiveness of | Longitudinal | 104 Bandura's | Communication Skills | Virtual patient training improved students' | ||||
| Singapore Virtual Counseling Application | quasi-experimental,single-group pretest and | self-efficacy | Attitude Scale | |||||
| Using AI on nursing students' | theory and | Communication | ||||||
| learning attitudes, communication post- test design with a | Herrington and | Self-Efficacy Subscale | ||||||
| self-efficacy, and clinical | colleagues' (CSES) | |||||||
| Intervention and | 103 None specified | The student description | ||||||
| 2023 interactive screen-based simulation | comparative study | |||||||
| Turkey and standard patient simulation on | ||||||||
| students' skills performance score,satisfaction, and anxiety in breast | ||||||||
| anxiety inventory | ||||||||
| Rodriguez-Arrastia,2022 | To explore the experiences and Qualitative descriptive | 144 None specified | Semistructured questions | |||||
| developed by researchers | ||||||||
| Spain | s | |||||||
以下是原文 Table 3 的结果,展示了纳入研究的质量评估:
| First author and year | Rodriguez-Arrastia, 2022 | Shorey, 2023 | Shorey, 2020 | Simsek-Cetinkaya 2023 | |||||
|---|---|---|---|---|---|---|---|---|---|
| Chang, 2022 | Abdelaliem, 2022 | Han, 2022 | Kwak, Anh, 2022a | Kwak, Seo, 2022b | |||||
| Screening questions | |||||||||
| S1. Are there clear research questions? | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes |
| S2. Do the collected data allow us to address the research questions? 1. Qualitative | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes |
| I | Yes | Yes | Yes | ||||||
| 1.. Are the qualitative dat colection methods adequate to address the research question? | Yes | Yes | Yes | ||||||
| 1.3. Are the findings adequately derived from the data? | Yes | Yes | |||||||
| ..Is | Yes | Yes | Yes Yes | ||||||
| 1.5. Is there coherence between qualitative data sources, collection, analysis, | Yes | Yes | Yes | ||||||
| and interpretation? | |||||||||
| 3. Quantitative nonrandomized 3.1. Are the participants representative of the target population? | |||||||||
| 3.2. Are measurements appropriate regarding both the outcome and | Yes | Yes | Yes | Yes | |||||
| intervention (or exposure)? | Yes | Yes | Yes | Yes | |||||
| 3.3. Are there complete outcome data? | Yes | Yes | Yes | Yes | |||||
| 3.. Are the confounders accounted for in the design and analysis? | Yes | Yes | Yes | Yes | |||||
| During the study perid, is the interventi mistered r exsue occurred) as intended? | Yes | Yes | Yes | Yes | |||||
| Quantitative descriptive | |||||||||
| 4.1. Is the smpling sratey relevant dres he researc qetn? | Yes | Yes | Yes | ||||||
| 4.2. Is the sample representative of the target population? | Yes | Yes | Yes | ||||||
| 4.3. Are the measurements appropriate? | Yes | Yes | Yes | ||||||
| .. Is the risk of nonresponse bias low? | Yes | Yes | Yes | ||||||
| ..Is helnal e ? | Yes | Yes | Yes | ||||||
| 5. Mixed methods 5.1. Is theren dequat ratnaleor sing miemethos de o | |||||||||
| address the research question? 5.. Are the different components of the study effectively integrated to | Yes | ||||||||
| answer the research question? 5..Are theututs o thentegrationo qualiative n qanaive | Yes | ||||||||
| components adequately interpreted? | Yes | ||||||||
| 5.4. Are divergences and inconsistencies between quantitative and qualitative results adequately addressed? | Yes | ||||||||
| 5.5. Do the different components of the study adhere to the quality criteria of each tradition of the methods involved? | Yes | ||||||||
6.3. 消融实验/参数分析
本系统评价是对已发表研究的综合,而不是一项新的实验研究,因此没有进行消融实验或参数分析。消融实验和参数分析通常是在设计和优化新模型或算法时进行,以评估其各个组成部分的贡献或不同参数设置的影响。
然而,从纳入研究的结果中可以间接看出一些关于不同 AI 干预措施(例如,移动聊天机器人、虚拟辅导应用、AI 辅助互动屏幕模拟)在不同 KSAs 方面表现的差异,以及这些干预措施如何影响学生的满意度和焦虑。例如,在 Simsek-Cetinkaya and Cakir (2023) 的研究中,AI 辅助乳房自我检查虽然提高了满意度,但也增加了焦虑,这表明 AI 干预的效果并非总是单一正向的,其具体设计和应用场景对结果有显著影响。这些差异为未来研究 AI 干预的具体参数或组件提供了方向。
7. 总结与思考
7.1. 结论总结
本系统评价全面探讨了人工智能 (AI) 在护理教育中对护理学生知识获取、技能发展和态度形成的影响。研究结果表明,AI 具有显著潜力,能够增强学生的知识,特别是在提升学习兴趣和自主学习能力方面。在技能方面,AI 有助于改善学生的沟通技能,但在某些心理运动技能(如乳房自我检查)和临床推理技能方面,其效果尚不确定或有待进一步优化。在态度方面,AI 能够培养学生对沟通技能的积极态度和自我效能感,并影响他们对 AI 技术本身的接受度和行为意图。然而,对 AI 的负面态度和相关焦虑可能会阻碍其有效采纳。
综合来看,AI 驱动的工具在提升学习投入、自我效能感和信心方面表现出积极作用,尤其当其具有用户友好界面和高可访问性时。但同时,研究也揭示了学生对 AI 缺乏互动性、真实性和情感深度,以及对工作流失的担忧。这些发现强调了在将 AI 整合到护理教育中时,需要采取周到的策略,不仅要关注技术优势,还要解决伦理、心理和社会层面的挑战。
7.2. 局限性与未来工作
7.2.1. 论文作者指出的局限性
- 样本限制: 研究结果受限于纳入研究的样本,这可能限制了结果的
普遍性(generalizability)。纳入研究的样本可能无法充分反映护理学生、教育机构或临床环境的多样性。 - 样本量较小: 较小的样本量可能降低研究的
统计效力(statistical power)。
7.2.2. 论文作者提出的未来工作
- 心理运动技能研究: 需要进一步研究 AI 对护理学生
心理运动技能发展的影响,因为现有数据尚未提供明确结论。 - 学生对 AI 的看法: 需要更多研究探讨学生对 AI 在护理教育和患者护理中的
想法(thoughts),特别是关于真实性和工作流失的担忧。 - 信任与整合策略: 需要开发策略来
建立信任(build trust) 并有效将 AI 整合到护理教育和实践中。
7.3. 个人启发与批判
7.3.1. 个人启发
这篇系统评价为 AI 在医疗教育,特别是护理教育中的应用提供了全面的视角,对我个人有以下启发:
- 混合方法的重要性: 采用序贯解释性混合方法系统评价,将定量和定性研究结果相结合,能提供更深入、更全面的理解。定量数据提供了“AI 有效”的证据,而定性数据则解释了“为什么有效”以及“如何有效”,这对于理解复杂教育干预的效果至关重要。这种研究设计值得在我的研究中借鉴,特别是在评估教育技术或社会科学领域的复杂干预时。
- 关注软技能的培养: AI 在提升沟通技能和自我效能感方面的潜力令人鼓舞。在教育中,除了硬性知识和操作技能外,沟通、同理心和批判性思维等软技能也至关重要。AI 提供的安全模拟环境,可以成为学生练习这些复杂技能的有效平台,尤其是在处理敏感话题时。
- 伦理与社会影响的考量: 对 AI 偏见、数据隐私和工作流失的担忧提醒我们,技术发展绝不能脱离伦理和社会背景。在推广任何新技术时,必须同步进行伦理指南的制定和使用者教育,以确保技术的公平、负责任和可持续应用。
- 教育者的角色转变: 随着 AI 自动化部分行政和教学任务,护理教育者可以有更多时间专注于指导、辅导和解决学生的个性化需求,从而提升教学质量。这要求教育者不仅要熟悉 AI 技术,还要具备利用 AI 优化教学的策略性思维。
7.3.2. 批判
尽管本研究具有重要价值,但我认为以下几点可以进行批判性思考:
- AI 干预类型的多样性与特异性: 论文将不同类型的 AI 干预(如聊天机器人、虚拟辅导应用、屏幕模拟等)进行综合。虽然这有助于提供总体概览,但不同 AI 技术的作用机制和适用场景可能存在显著差异。未来的研究可以更细致地分析不同 AI 干预类型对
KSAs各自的独特影响,例如,哪些 AI 技术更擅长提升知识,哪些更擅长培养特定技能。 - 心理运动技能的测量挑战: 论文指出 AI 在心理运动技能方面的效果不明确,甚至在乳房自我检查中表现较差。这可能部分归因于 AI 技术本身的局限性(例如,缺乏触觉反馈、真实度不足),也可能与心理运动技能的复杂性有关,它通常需要高度的身体协调、精确度和反复实践。未来的研究应探索如何通过融合触觉反馈、高保真虚拟现实或其他传感器技术来提升 AI 在心理运动技能训练中的有效性。
- 长期影响与持续性: 本研究评估的多为短期效果。AI 干预对学生
KSAs的长期影响,以及这些影响在学生进入临床实践后是否能持续,是现有研究未能充分涵盖的方面。未来的系统评价可以侧重于纳入具有长期随访数据的研究。 - 教师培训与政策落地: 论文强调了政策、标准化指南和教师发展计划的重要性。然而,这些建议的实际落地面临挑战,例如如何有效培训教师使用 AI 工具,以及如何克服机构层面的阻力。未来的研究可以探索 AI 在教师专业发展中的作用,以及成功的政策制定和实施案例。
- 样本代表性的潜在局限: 虽然论文提到了样本的多样性,但系统评价的结果仍然受限于纳入研究的地理和文化背景。不同国家和地区的教育体系、医疗实践和技术接受度可能存在差异。未来应鼓励更多来自不同文化背景和发展水平地区的研究,以增强结论的全球适用性。
相似论文推荐
基于向量语义检索推荐的相关论文。