动态与成果
动态与成果
刘杨:基于社交媒体的慕课学习者行为分析
随着慕课(MOOCs)的快速发展,数百万学习者在社交媒体上讨论在线学习,形成了丰富的教育大数据资源。然而,现有研究多局限于特定课程平台内的学习者行为分析,缺乏对跨课程、跨平台学习者整体画像的挖掘。社交媒体中的学习者讨论包含大量非结构化文本数据,如何从中精准识别学习者并分析其需求,成为优化在线教育的关键问题。
本研究聚焦以下核心问题:如何在嘈杂的社交媒体数据中精准识别慕课学习者;被传统平台忽视的“沉默学习者”在社交媒体上表达了哪些学习需求与体验;以及如何利用社交媒体数据为慕课设计更精准的教学干预策略。
我院高等教育研究所刘杨副教授联合北京师范大学张婧婧教授团队,对2013–2022年间221,336条包含“慕课”或“MOOC”关键词的新浪微博帖子进行系统分析。研究通过机器学习与深度学习模型对比、LDA主题模型等方法,取得以下创新性发现:
1. 学习者识别算法优化
TextCNN模型在词向量维度为150–250时表现最佳,显著优于传统机器学习模型(如SVM准确率为89.5%)。该模型适应微博短文本特征,为社交媒体教育数据挖掘提供了高效工具。(图1)
图1. 基于不同词向量维度的模型准确率比较
2. 沉默学习者的核心诉求
LDA模型识别出9类学习者讨论主题,归纳为“开放分享”与“自我呈现”两大维度:
——开放分享:包括课程推荐、平台使用体验、学习心得交流;
——自我呈现:涵盖证书展示、学习进度记录、作业考试压力等。
值得注意的是,学习者常在社交媒体表达负面情绪(如批评平台功能、教师授课方式),这些内容在正式课程论坛中较少出现。
图2. LDA主题的困惑度
3. 话题演变与外部事件关联
DTM分析显示,学习者讨论主题随社会环境动态变化:
——2013–2015年:以学习社区互动和平台体验为主;
——2016–2018年:证书分享和课程推荐成为热点;
——2019–2022年:疫情期间,学习监控、作业考试相关话题显著增加,证书分享热度下降,反映K–12学习者涌入及证书政策变化的影响。(图3)
图3. 文本主题强度随时间的变化趋势
本研究首次通过社交媒体大数据揭示了慕课学习者的真实行为模式,为理解“沉默学习者”提供了新视角。研究成果可为慕课平台优化教学设计、开发自适应学习支持系统提供数据支撑,推动在线教育向个性化、智能化方向发展。
上述成果发表于SSCI一区期刊《Innovations in Education and Teaching International》:Liu, Y., Zhang, J., Yang, Y., & Tao, X. (2025). The untapped promise of educational data on social media: A machine learning approach to unveiling online learners. Innovations in Education and Teaching International.
全文链接:https://doi.org/10.1080/14703297.2025.2561038
The untapped promise of educational data on social media A machine learning approach to unveiling online learners.pdf