大数据时代的教育畅想

2015-06-10

关于遗忘、发明与教育:“大数据”未来的若干可能

[ 民科院官方网站  www.cnein.ac.cn  1366695647  来源:]

  我们生活在一个被几何级爆炸的数据包围的时代,现在,这些数据被叫作“大数据”。

  大数据将深刻影响人们的生活、工作和生活方式——而反过来说,你留在数字世界里的任何踪迹都变成了数据的一部分。它包括你在社交网络上的每条口水吐槽和照片,你的地理位置签到,你点击的每一个“like”,你与任何人的“好友”链接,你在亚马逊上每一次“点击”的购买记录甚至你的每一次搜索内容……也就是说,每个人创造的数据就是“大数据”的一部分,每个人都是大数据的生产者和消费者。

  它延伸了诸多将数据应用于现实生活、工作甚至记忆的可能。以下是12月11日上午在北京云基地,《大数据时代:生活、工作与思维的大变革》一书的作者、牛津大学教授Victor Mayer-Schonberger与中国宽带产业基金董事长田溯宁视野下的关于未来大数据发展的几种可能性:

  大数据与遗忘曲线:Victor认为,随着数据的爆炸,大数据应该提供一种自动的“遗忘”功能,帮助人们分析、筛选其漫长经历中所获得的全部数据,有哪些是可以被遗忘、删除或丢弃的。比如在亚马逊上,每个人的购书记录都被看作是分析个人爱好、兴趣和口味的数据,用来推荐你现在/未来可能会喜欢的书。但这做的并不够,因为随着时间的推移,人的兴趣是可能会消退和改变的。未来的大数据分析应诞生一个聪明的“遗忘”机制,能根据时间、年龄、心理学和人们的行为的细节变化,自动帮人们“删除”一部分已经丧失了意义的历史数据。

  大数据与下一次产业革命:田溯宁认为,大数据应该被用于发现未来的下一个X光或阿司匹林,也就是为真正改变人类生活和进程做些什么。过去人们发现和发明一个东西,依据的通常是经验,以及具体的实验数据和样本,尚且不能从已有的经验和实际数据中,智能地分析、预测问题的症结在哪里,以及如何解决它们。科学发明是一项关于未来的事业,而大数据背后的挖掘与同样分析未来将把人们带向不可知的未来,帮助下一个震撼世界文明的发明的诞生。

  大数据与“好数据”“坏数据”:别忘了数据都是每个人创造的,其中的质量差异将可能导致人们使用数据的效果的差异。Victor认为,未来大数据分析将有效地帮人们分辨“好数据’和”坏数据”,从而将数据的效果最大化。他还列举了亚马逊的例子,那些被亚马逊推荐给我的图书和商品,其中从来没有被我购买甚至点击过的那部分,通常意味着这些是“坏数据”,因为它从来不曾被需要过。而那些被采购和频繁点击的数据通常意味着“好数据”,它更能反映一个人的真实心理、兴趣和消费习惯,将这些数据进行归类和分析,可能会更充分地利用数据本身。

  大数据与“相关性”:大数据的普及将使人们更好地发现和精确事物之间的相关性。事实上人脑和人的思维方式是并不擅长处理数据分析的。比如你问一家电影院的老板,今年最卖座的电影是什么,他/她告诉你的那个答案你可能也觉得是正确的答案,事实上通常都是错误的。而更多的问题出现在相关性上——比如人们突发的一场疾病,可能会被医生和自己诊断为是最近的一次食物中毒,人们似乎对这个结论达成了共识,然后“对症下药”,但这个结论很可能是错的,真实的原因可能是你最近去到的某个地方沾染了某种病毒或化学元素。在复杂的人的行为和生活场景面前,人们通常为一些“不相关”的结论做了太多无用功。而有了机器学习和数据分析,与一件事最具相关性的原因和症结就更容易被发现出来。

  大数据与教育:“在线教育”是个更热门的话题,而大数据也可以被应用于在线教育。Victor举例说,在Udacity和Coursera这样的“在线大学”,当教授发现自己录制的一段课程其中的 某几个环节或时间点,被学生们反复浏览和点击的时候,他通常会及时地意识到这可能是一个对学生来说难以掌握的知识点,或是一个自己的讲解表述有差失的地方,接下来就可以据此调整讲义。而对考试这件事来说,通过在线模拟测试,大数据可以用来分析和统一某个学生群体或个体对不同知识点的掌握情况,当某个知识点的题目被频繁做错的时候,系统就会在接下来的模拟测试中不断强化出现与这个知识点相关的题目,以巩固学习效果。这不是帮人“作弊”,反而是强化理解知识的方式。

教育的大数据在哪儿

[ 民科院官方网站  www.cnein.ac.cn  1366695769  来源:]

  从我们的日常工作考察,好像并没有什么大数据的存在,果真如此吗?其实学生、教师一言一行,所有学校里发生的事物,无不可以转化为数据。当每个在校学生都能用自己的计算机终端学习,包括上课、读书、写笔记、做作业、发博客、进行实验、讨论问题、参加各种活动等便是教育大数据一个来源。

  近年来美国的一些顶级大学纷纷把自己的课程推上互联网。如耶鲁网上开放课程、麻省理工网络开放课程等,其他国家也随之跟进,如英国公开学院开放课程。国内也在开发这类网上的开放课程。这些都将是教育大数据所在。与之相应的学生利用这些课程在网上学习,互动 、互助,又将生成一大堆数据。涂子沛的书里说:大数据,将成为我们下一个观察人类自身社会行为的‘显微镜’。和监测大自然的‘仪表盘’”。“利用这些数据进行‘行为评价和诱导’……。例如,师生可以随时对话,计算机能够记录你在一张幻灯片上停留的时间,判别你在答错一道题之后有没有回头复习,统计你在网上提问的次数、参与讨论的多少,然后在这个基础上,对你的学习行为进行诱导和评价。”“通过记录鼠标的点击,可以研究学习者的活动轨迹,发现不同的人对不同的知识点有何不同的反应,用了多少时间,哪些知识点需要重复或强调,哪种陈述方式或学习工具最有效。记录单个个体行为的数据似乎是杂乱无章的,但当数据累积到一定程度时,群体的行为就会在数据上呈现一种秩序和规律。通过分析这种秩序和规律,未来的在线学习平台才能弥补没有老师面对面交流指导的不足。”数据在网上的自动整合和跳转,将会成为我们新的生活方式。通过这种新的方式,互联网将向我们“推送信息”,而不再是我们在网上“搜索”信息。 “数据,是记录信息的载体,是知识的来源。数据的激增,意味着人类的记录范围,测量范围和分析范围在不断扩大,知识的边界在不断延伸”。这是传统的直觉 、印象无法比拟的——不管是对学生需求的分析以便向他们推送最适当的学习资源,还是根据学生的教育行为进行评价。对这点,书中又用一段关于自我量化的精辟论述来解析:自我量化是指利用计算机、智能手机以及各种新的电子便携感应器来记录自己学习、工作、运动、休息、娱乐、饮食、心情等等个体行为的情况,就像我们需要对体重、身高、、血压、心跳等物理指标进行监控一样。自我量化的主张者认为,为了更好地了解我们、提高自己,我们必须要用数据来记录、研究、分析自己的行为。其理由在于:人的感觉中存在盲点,直觉不可信任,理性思维也有局限,大脑即使有惊人的记忆力,也未必有惊人的信息加工能力。很多时候,我们会高估自己的理性,低估情绪对我们的影响。认识自己虽然很难,但非常重要。基于数据的记录和分析,可以帮助我们走出错觉、认识真正的自己。

  2007年,著名技术活动家、(连线)杂志的主编凯文,凯利[Kevin Kelly)和技术专栏作家沃尔夫(Gary WoIf )共同创办了一个网站,该网站已经成为自我量化运动的枢纽。像数据开放运动一样,自我量化的运动现在非常活跃,在美国、欧洲频繁召开各种论坛和会议。我们一直认为考试和老师的评语是有效测量学生成长方法。对应于“自我量化”指出的“必须要用数据来记录、研究、分析自己(学生)的行为。其理由在于:人的感觉中存在盲点,直觉不可信任,理性思维也有局限,大脑即使有惊人的记忆力,也未必有惊人的信息加工能力。很多时候,我们会高估自己的理性,低估情绪对我们的影响。”传统的评价系统是不是显得颇有些苍白。可不可以把凯文,凯利和沃尔夫共同创办的那个网站,引进到学校里来,改变原来那种靠不住的评价传统呢。

  有了大数据不等于万事大吉,要让它说话,也就是对我们的教育做出决策、对学生做出评价和把们需要的种种情况的分析呈现出来。涂子沛先生告诉我们:数据挖掘的技术可以根据用户过去的行为模式预测其信息的需要,为其配送个性化的信息,未来的语义网更是一个高度个性化的智能网络平台!数据挖掘是指通过特定的计算机算法对大量的数据进行自动分析,从而揭示数据之间隐藏的关系、模式和趋势,为决策者提供新的知识。之所以称之为。挖掘,是比喻在海量数据中寻找知识,就像开矿掘金一样困难。“数据挖掘是对数据进行挖山凿矿式的开采。它的主要目的,一是要发现潜藏在数据表面之下的历史规律,二是对未来进行预测,前者称为描述性分析,后者称为预测性分析.沃尔玛发现的啤酒和尿布的销售关联性就是一种典型的描述性分析,考察所有历史数据,以特定的算法对下个月啤酒的销售量进行估测以确定进货量,则是一种预测性分析。”我想起从前给学生写评语:“作业比以前完成的好(描述性分析)……今后应注意书写整齐(预测性分析)”拿来和数据挖掘比一比,就知道了传统教育对情况的描述和预测是多么的模糊和无效,是没有理由再继续维持下去了。

  其实大数据是客观存在着的,只是我们没有发现,让这个宝贝从身边溜掉了。

教育“大数据”就在你身边

[ 民科院官方网站  www.cnein.ac.cn  1366695959  来源:]

  美国NASA如何能提前预知各种天文奇观?风力发电机和创业者开店如何选址?如何才能准确预测并对气象灾害进行预警?包括在未来的城镇化建设过程中,如何打造智能城市?等等,这一系列问题的背后,其实都隐藏着大数据的身影——不仅彰显着大数据的巨大价值,更直观地体现出大数据在各个行业的广阔应用。这些行业应用也都更直白地告诉人们,什么是大数据……

  根据研究机构Gartner的定义,大数据是指——需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。从数据的类别上看,“大数据”指的是无法使用传统流程或工具处理或分析的信息。它定义了那些超出正常处理范围和大小、迫使用户采用非传统处理方法的数据集。

  通俗地讲,大数据具有4V特点:Volume(数据量大)、Velocity(实时性强)、 Variety(种类多样)、Veracity(真实性)。更为重要的是,大数据还具有Value(价值)的特点。让我们看看教育场景的大数据应用。

  情节概览:医疗和教育是一个国家和社会最具灵魂的领域——生理上和心灵上的塑造和完善。对于教育而言,关系到每个人的切身利益,而且伴随着每个人的成长旅程。

  教育可以改变人的命运。同样,教育方式和教育理念也可以改变人的一生。

  不同于以往的“赶鸭上架”式教育模式,借助信息技术在二十一世纪的教育模式将发生根本性转变。这些转变中,以“个性化学习”模式最具变革性。比如在重庆石堰镇中心学校,采用了一种“一对一 数字化学习”的模式推动传统教育的变革。

  具体做法是,通过引进英特尔“一对一数字化学习”项目,前期先在实验班开展实施,给每一个学生都派发个人学习终端(小电脑),并在一对一数字化教学环境下,加强互动教学与整合信息技术的培养,将传统的学习以教师为中心转变为以学生为中心的自主、交互式教学。如何实现个性化学习呢?让学生融入到快乐自主学习的状态,培养知识探究的求学精神,最后还会通过课程标准和学习评价系统,对每个学生在不同科目上的学习进度、兴趣爱好、知识关联上的不同针对性地做出教学指导和建议。目前,该学校已经全面开展了这种个性化数字学习模式。

  总结分析:“一对一数字化学习”并不一定是最理想的个性化学习模式,但却是目前最具实践性并帮助取得教育信息化改革突破的最好方式。个性化学习,会通过学生在自己的学习平台上的多媒体 学习资料、学习进展、互动(包括书面和音视频)、自主学习(利用平台主动学习相关领域科学知识 )帮助学生完善知识结构并加快学生对自身兴趣爱好的挖掘和特长的培养。

  除此之外的学习评价体系,也会根据每个学生的这些行为特征和学习内容,对每个学生的考核和科目设置进行评价,并最终帮助培养学生早日成为创新人才。虽然单个学生的的各种数据(结构、非结构 )量并不一定很大,但从整个教学模式的转变,尤其是在教育信息化改革的背景下,这种学习方式也体现出了基于大数据的个性化学习发展方向。

  可以预见,未来个性化学习终端,将会更多的融入学习资源云平台,根据每个学生的不同兴趣爱好和特长,推送相关领域的前沿技术、资讯、资源乃至未来职业发展方向,等等,并贯穿每个人终身学习的全过程,也就是笔者曾经谈过的:个人云平台中贯穿自己终身教育的应用。

本网站由阿里云提供云计算及安全服务