高校工作的经验与启示 浅谈大数据技术对高校教学改革的启示

浅谈大数据技术对高校教学改革的启示

浅谈大数据技术对高校教学改革的启示 摘要:信息社会大数据技术对人们的生活和社会的发展产生了巨大的影响, 高等教育结合大数据技术适时改革是未来发展趋势。本文分析了大数据在国内外 高校教学中的应用探索,以及大数据技术对高校教学模式的影响,提出了在高校 大四学生中应用大数据技术进行教学改革探索的方案和措施。

关键词:大数据;大数据技术;教学改革;教学模式 大数据诞生于人们对数据搜集能力、传输能力、存储能力和处理分析 能力的发展和跨越基础上,已在各行业掀起了变革的巨浪,发展潜力巨大[1]。

著名管理咨询公司麦肯锡认为大数据是大小超出了常规数据库软件工具获取、存 储、管理和分析能力的海量复杂数据集。亚马孙认为大数据是任何超过了一台计 算机处理能力的数据量。从宏观角度来讲,大数据是融合物理世界、信息空间和 人类社会三元世界的纽带。谷歌借助云计算搜索引擎推动了大数据的应用和发展。

在教育领域,在教与学的过程中,也蕴藏着有价值的海量大数据,怎么有效挖掘、 分析和利用这些海量数据来促进教学,是当今教育界研究的热点内容。

未来十年将是一个“大数据”引领的智慧科技时代。随着QQ、微信等 社交网络的逐渐成熟普及,移动带宽迅速提升,云计算、物联网应用更加丰富, 更多的传感设备、移动终端接入网络,由此产生的数据急剧增长,速度比历史上 的任何时期都要多都要快。IDC在《数字宇宙膨胀:到2020年全球信息增长预测》 指出,数字信息每年按几何级数递增,到2020年,数据量将超出人们想象,达到 40ZB。据麦肯锡数据显示,2009年美国教育部某信息系统数据库存储的数据达 到近270PB,入选2009全美十大数据生产贡献排名,教育已成为大数据重要源泉 之一[2]。

教育意味着未来,抓好了教育,就预示着掌握了未来,所以教育始终 是民生之本,是国家和政府高度重视的领域,教育改革始终是一个不断探索的课 题。在大数据时代快速推进之际,探索新形势下的教育体制、模式和方法,对促 进我国教育发展具有长远意义。

1 国内外对大数据在高校教学中的初步探索 1.1 国外高校对大数据应用的探索大数据技术必将改变我们的生活,也必将推动教育模式产生巨大的变 革。2011年秋天,斯坦福大学一门人工智能网上课程受到热烈欢迎,190多个国 家约16万学生参加学习,2万多人通过了考试,获得认证。课程讲授者Thrun教授, 创办了在线教育平台Udacity。斯坦福大学的Ng教授,把自己的课程放到了互联 网上,全球有十几万人注册,在网上听他的实时讲授,同时还和斯坦福大学在校 生做同样的作业、接受同样的考核。Ng教授2012年4月成立了Coursera,和普林 斯顿、斯坦福、密歇根大学和宾夕法尼亚大学等大学结盟,提供社会科学、物理、 工程学等课程。2012年11月福布斯发表文章《一个人,一台电脑,1千万学生, 可汗学院如何重塑了教育》。因为“大数据”的技术背景,哈佛和麻省理工也把课 程免费上网,收集最多的学生学习行为数据,研究开发更好的在线教育平台,强 化学校品牌效应。

1.2 国内高校对大数据应用的探索 硬件的高速革新和软件的高度智能,国内也掀起了新一轮教育信息化 的浪潮。清华大学、北京大学、上海交通大学和复旦大学等,也都开始提供免费 网络课程。国内多个省市先后实施了建设教育信息化公共服务平台,推进数字校 园实验工作,建立 “数字化学习”试点学校,开发“微课程”,试点“微学位”,开 展“翻转课堂”活动、推进1对1“E课堂”教学实践等一系列教育改革新举措。

1.3 研究趋势 现代信息世界已经发酵出第三次工业革命,具体到教育和高等教育领 域,云、物联网和基于云和物联发展所带来的大数据趋势,是变革的技术因素, 向大数据时代、知识时代跨越。目前仅就知识而言,教育资源所经历的平台开放 时代、内容开放时代、校园开放时代是前所未有的。教育发展的未来模式将是:
视频成为主要载体,教育资源极其丰富;翻转课堂;按需学习;终生学习;不以年龄划 线;距离不再是问题,在学校之外在异地发生等等。

千百年来,知识载体的变化,决定了知识本身的价值。简牍时代,知 识被教师垄断,师生的等级观念由此诞生;印刷时代,知识变得廉价,教师的作 用变成讲授服务;信息时代,知识更容易获取,教师成为学生的朋友和教学过程 信息服务的组织者、主持人和教练。数据挖掘和数据分析软件可以阶段测验学生 表现,帮助教育者研究能够预测其效果的学习模式。面向服务、面向创新和面向 过程成为教育的重点,云和大数据为基础的教育资源共享、教育模式语言与教育 空间设计、学生个性和天性培养成为教育发展趋势。信息时代大量的知识创造和服务业的兴起,行业技能专能和社区教育,将不断壮大发展。高等院校的教学模 式、教学定位等都将有很大的变化,推动高校不断创新,成为新知识的生产中心, 而不是旧知识的传播中心,催生良好的管理和其他增值服务。

2 大数据对高校教学模式和教学实施的影响 2.1 大数据的4V特性在教育变革中的体现 大数据的4V特性是,Volume(海量的数据规模)、Velocity(快速的数据 流转和动态的数据体系)、Variety(多样的数据类型)、Value(巨大的数据价值)。现 代教育过程将产生大量的教育数据,海量的知识数据,随着信息技术和通信技术 的飞速发展,各种计算机和终端设备实现了前所未有的互联互通,教育内容实现 了跨越时空的自由流通。大数据的实时分析与处理,Hadoop(MapReduce技术的 基于Java的开源实现)等非关系型数据管理和分析技术和HadoopDB(MapReduce 技术和RDBMS的集成),能加速数据查询和分析,具有较好的扩展性和容错性, 智慧软件实时诱导跟进评价学生的在线学习。关系型数据库处理结构化数据,而 现在非结构化数据(用户评论、应用、位置信息、图片、音乐、视频等)占很大比 重(约为85%),产生智慧的大数据往往是这些非结构化数据[3]。视频教学和师生 间的网络互动交流将成为未来教育的重要方式,对学生学习过程的记录数据,将 对学生的教育规划进行智能化的指导和评价。通过对数据的分析和利用,预测未 来发展趋势,开发有吸引力的应用,将产生巨大的价值,为未来教育带来创新模 式。

2.2 大数据支撑的未来教育将成为一门实证科学(教育的数据化) 与医疗技术比较,原来的医疗靠望闻问切和经验为病人诊治,现代医 学更多的依靠各种检验化验和先进的医疗设备器械,通过报告单、可视化的影像、 X光片等精确数据,为疾病的判断和诊治提供科学的依据和证据。尽管病人会抱 怨,住院后让做各种检查,该做不该做的都做,但也无可否认,在大量诊查数据 的支撑下,现代医疗技术确实提高了很多,治愈率越来越高,人的寿命不断延长。

类似的,教育也将不再是单纯靠理念经验的积累和传承,道德良心自 律的学科,而将变成一门实实在在的实证科学[4]。把学生从入校后的所有相关 教育信息行为表现,都记录下来,根据这些数据,分析学生的学习过程和个性特 质,将为学生的个性化学习和个人成功提供有力的科学依据。大数据使得查探学生表现和学习途径信息成为可能,学生通过在线学 习平台进行学习,其学习行为数据将被记录,系统后台根据不断积累的行为数据 对学生进行评估,分析学生的思考习惯和思维模式,创建心理测量图,根据学生 的学习进展调整之后的学习内容和重点。实时记录学生的量化学习过程(上课、 读书、记笔记、作业、讨论、考试、考评等)和实验的过程结果等,这些数据将 作为课程最后考评的重要参考依据。通过聚焦于数据分析,教师可以用更有效的 方式研究学生学习状况和学习效果[5]。

2.3 未来教育在技术上的演进 2.3.1 教育技术的演进 教育经历了PC时代的数字化教育(传统的板书变成了PPT投影)、互联 网时代的社会化教育(知识的获取更加便利和普及,知识传播更加迅捷)、移动互 联网时代的范在化教育(教育不再受时间和空间的限制),现在进入了大数据时代 的个性化教育(视频将作为知识传播的主要载体)。传统网络教育、远程教育、网 上学堂只是把教育教学转换为视频,通过网络传播,使学生异地学习,只是学习 内容的网络化跨地域化。

大数据教育依托网络技术和大数据分析,将有更多的教育手段、要求、 方式和内涵等,更注重学生的因材施教、个性化培养、突出个体差异化发展和成 功。哈佛、MIT、斯坦福、耶鲁、普林斯顿、伯克利、宾夕法尼亚大学等纷纷把 自己的课程免费上网。新一代的在线学习平台和过去的重要区别,在于增加了行 为评价和学习诱导的成分,向全世界开放,让最多的学习者在上面学习、使用, 同时可以收集最多的数据,使用、研究、分析学习者的行为模式。

未来大部分的老师,是课堂的组织者、学习的引导者、学生学习行为 的分析者,而不是知识的讲授者。网络、视频和智能软件,为每一个学习者搭建 起一个学习情境,对学习者的学习过程和行为提供持续性的诱导、评价和支持, 帮助其培养科学有效的学习方法和习惯等。数据在网上自动整合和跳转,向学生 推送学校信息和建议。学生可以和其他学习者交流互动,寻求有效帮助。普适计 算的浪潮,网络终端将无处不在,学生可以在任何可以联网的地方学习,而到学 校去,则主要是做作业、答疑、讨论、考评等。

2.3.2 大数据教育技术1)大数据处理模式大数据的主要处理模式有两种:直接处理的流数据 处理(Stream Processing)模式和先存储后处理的批处理(Batch Processing)模式。数 据流的研究与技术应用已经有十几年的历史了,目前开发和得到广泛应用的代表 性开源系统有Twitter的Storm、Yahoo的S4、Linkedin的Kafka和Apache 的Nutch 等[3] [6]。批处理模式的典型代表是Google的MapReduce模型。

2)教育大数据分析技术教育分析技术来源于大数据在商业领域的应 用,如淘宝网根据用户的浏览轨迹推断用户对产品类别的偏好。教育分析技术以 学生群体为主体,借助于网络在线平台和移动终端软件,跟踪采集挖掘分析学生 学习的整个过程,以提高学生学习质量和学习效率,并对学生未来需求趋势进行 分析和预测, 拓展发展空间,提高竞争力[7]。深度学习和知识计算是教育大数 据分析的基础,可视化是数据分析的关键技术和数据分析结果呈现的关键技术。

深度学习深度学习的起源可以追溯到神经网络和后向传播(BP)算法, 2006年多伦多大学的Hinton等人提出无监督的逐层贪婪的预训练(greedy layer-wise pre-train)方法,掀起了深度学习的浪潮。近几年,深度学习在自然语 言理解、语音识别、人脸识别、图像搜索等应用领域取得了一系列重大进展[8]。

而在教育领域,深度学习研究集中在学生线上视频学习时间分析、学生参加网络 活动的行为分析等方面。

知识计算对大数据进行高端分析,需要从大数据中抽取有价值的知识, 构建成支持查询、分析和计算的知识库。目前,世界各国建立的知识库达50多种, 知识应用系统达100多种。知识计算的基础是构建知识库,包括知识库的构建、 多源知识的融合、知识库的更新等。教育领域,基于机器学习、信息检索和数据 挖掘的智慧软件构建了一个高度个性化的智能网络平台,实时反馈学习过程信息, 可以帮助对学生做出评价、对教育做出决策。

可视化技术可视化技术在大数据领域的应用主要表现在数据分析工 具的可视化和数据分析结果的可视化[9]。对大规模、高维度、多来源、动态演 化的大数据信息,开发可视化分析工具,使普通人员也可以轻松上手操作实现自 动分析。对大数据分析结果应用有效的可视化技术(交互式展示、超大图动态化 展示),有助于用户理解和辅助做出实时反馈和决策。教育领域,教师可以使用 数据可视化工具来研究学生的学习模式,修正课程以引导学生进行有效学习和满 足学生个性化学习需求。

2.3.3 大数据处理平台和工具在原有的关系型数据库RDBMS,很难处理大数据时代产生的大量非 结构化数据的背景下,基于Google三大核心技术GFS、MapReduce、BigTable的 Hadoop和NoSQL数据库技术应运而生,为海量大数据的处理提供了强大的技术 支撑。国内的教育大数据平台,也已经起步并开始应用,如超星公司的超星尔雅 和泛雅,已经和国内多所高校合作,用于这些高校的教学,其SPOCs和混合学习 的模式,正在渐渐被接受和付诸实施。

2.3.4 未来教育将是一项以支持和服务为核心的系统工程 源于网络和大数据提供的爆炸式的知识,未来教育不再是标准化、归 一化、规范化的教育,而是按需学习、终生学习,充分发掘学生自身原有的积极 性和天分,实现自组织学习[10]。

大数据时代使人们接收知识更加方便了,但是就和印刷术的发明和普 及,使人们接触知识的机会增多了,但教师的数量并没有下降,反而升高了一样。

大数据时代,对于爆炸的信息,需要很好的甄别、引导和指导,去除无用的垃圾 信息,所以对于学校和教师的需求不降反升。此时的教育,主要是根据学生的兴 趣和个性特质,建立“以学生为中心”的智慧教学模式,规划指导跟进学生的培养, 与学生有更多的互动和交流,以支持和服务为核心贯穿学生培养的整个过程。

3 大数据在高校教学改革中的应用实施 3.1 我院现状 大数据改变了高校教与学的模式,但这个过程是循序渐进的。我们学 院首先在大四学生中进行试点。

大四学生第七学期的学习有这样一些特点,学生基本分为三个阵营:
(1)外出培训工作;(2)考研考证照考公务员考选调生;(3)在校内继续学习。基于以上 情况,大四第七学期的课堂到课率普遍不高,对大四学生的课程考核也相对宽松, 这就造成大四第七学期的课程形同虚设,根本没有达到本专业的人才培养目的和 预期,而大四第七学期的课程又基本都是比较重要的专业课、实践课,是专业人 才培养方案中比较重要的部分,并对学生未来就业影响颇深。

3.2 改革措施基于以上情况,我们实施了以下改革措施。

1)个性化差异化教学:大四第七学期的课程全部作为选修课,设置的 门数和种类更加多样化,学生根据自己的兴趣和职业发展规划,自由选择其中的 4-5门课,选修够最低学分要求,对最高学分不进行限制,鼓励多选。

2)化解学生学习时间和地域限制的矛盾:学习方式改革,利用大数据 技术,借助网络,将课程教学视频根据教学安排,上传网络,使学生可以在任何 地点自由安排学习时间,这对于在外培训工作的学生,十分方便。对于校内考研 和学习的学生,也可以自由安排学习时间,提高学习效率。

3)重视学生学习的过程性评价:学生必须要完成规定的课程学习学时, 每次课安排有课前测试,课后测试及作业。课前测试,课后测试,学生能够实时 查看到测试成绩,课后作业要求学生在规定的时间内提交,课程教师要在规定的 时间内批改完毕,并将成绩发布到网上,供学生查看,对不合格的作业,要告知 学生重做。学生的课程成绩由学习的所有各阶段的所有成绩汇总而成,所以学生 必须重视和认真对待每次的学习、测试和作业。

4)师生互动交流:教师和学生间的互动交流方式多样,可以通过线上 论坛讨论答疑,也可以利用移动终端的便捷,建立课程QQ群或微信群,进行交 流。教师将作业、要求、提醒等信息及时发布网络和交流群中,引导督促帮助学 生完成课程学习。

5)对学生学习的过程性大数据进行分析:学习的过程性数据分析技术, 改变了传统教学的经验式模式,为学生提供高质量个性化的学习体验,辅助教师 根据数据分析结果,改进教学方式完善教学过程。将学生从选课、学习、考试结 课等所有阶段过程中,产生的数据进行汇总分析。根据学生的选课情况数据分析, 综合考虑调整专业课程设置,同时对学生选修课程行为进行适当宣传引导。对学 生学习的过程性数据进行分析,掌握学生学习情况,挖掘学生学习习惯和特点, 以实时调整课程难易度,根据学生特点突出个性化差异化人才培养。

6)教师角色的转变:在新的学习方式中,教师的角色也将发生改变, 由原来单一的知识讲授传授者,变为学生学习的知识传授者和学习引导者、督促 者、帮助者、考评者。教师将课程内容录制上传后,将不再为每个班一遍遍的重 复讲授,大量的时间将花费在教学的组织实施、答疑解惑和对学生学习的引导督 促激励监管考核上。学生将有更多的时间得到一对一的辅导和帮助。4 结论 大数据时代已经到来,未来十年,大数据在高校中有着广阔的应用前 景,将成为下一个创新、竞争和效率提高的前沿,我们应抓住机遇,适时改革, 使信息时代下的高校教育与时俱进,培养出更多的适应信息社会发展的高素质人 才。