ORCID
Constanza Mardones-Segovia: https://orcid.org/0000-0001-8204-4426
Shiyu Wang: https://orcid.org/0000-0001-7747-1028
Allan S. Cohen: https://orcid.org/0000-0002-8776-9378
Abstract
自然语言处理(Natural Language Processing, NLP)在教育测评中对文本作答的分析应用日益广泛。NLP 的关键环节之一是对被试的书面作答进行清理与结构化,以构建保留词汇语法、语义与语用特征的输入数据,从而支持相关特征的提取。本文旨在为教育测量任务中使用 NLP 技术提供基本方法指导,系统介绍文本预处理、特征提取及构建性题型文本数据分析的关键步骤。此外,文中还提供了一个基于 R 的潜在狄利克雷分配(Latent Dirichlet Allocation, LDA)分析示例,以展示该处理流程的实际操作。
Recommended Citation
Mardones-Segovia, Constanza; Yang, Yaxuan; Wang, Shiyu; and Cohen, Allan S.
(2025)
"自然语言处理在评估数据中的应用流程:基于R的教程,"
Chinese/English Journal of Educational Measurement and Evaluation | 教育测量与评估双语期刊: Vol. 6:
Iss.
2, Article 4.
DOI: https://doi.org/10.59863/ACPP4766
Available at:
https://www.ce-jeme.org/journal/vol6/iss2/4
DOI
https://doi.org/10.59863/ACPP4766
