业界动态

当前位置:首页  工作动态  业界动态

教育数据开放是教育开放的重要组成部分

发布人:荣娟时间:2018-11-08浏览:356

2018413日,教育部印发《教育信息化2.0行动计划》,指出要构建一体化的“互联网+教育”大平台,整合各级各类教育资源公共服务平台和支持系统,实现教育数据等的有效共享并完善教育数据标准规范,促进政务数据分级分层有效共享(中华人民共和国教育部,2018)。教育信息化2.0的核心目标是以教育信息化全面推动教育现代化,全面提升教育品质,构建新时代教育的新生态(杨宗凯,2018),其具有以下八大特征:更加坚持时代引领、应用驱动、深度融合、教育治理,更加兼顾探索普及、区域差异、社会各方、顶层基层(任友群,2018)。

进入教育信息化2.0时代,我国教育信息化发展将追求更高层次和更广范围的数据开放,并以此为载体推动教育生态的优化与重构。教育数据开放是教育开放的重要组成部分,也应成为教育信息化2.0行动计划的基础性任务。早在20151010日,全国首届教育实证研究论坛就发布了《大力开放教育数据的倡议书》,提倡“更多地开放各级政府部门已经掌握的教育数据、更好地开放已经开发或正在开发的教育数据、更快地开放各级各类教育数据”(全国首届教育实证研究论坛,2015)。然而,目前教育界尚未对教育数据开放形成清晰的认识,仍存在一些基础性问题亟需澄清,比如教育数据开放的本质内涵是什么,有何特征?与教育开放的关系是什么?目前国际社会在教育数据开放领域有何战略举措?教育数据开放具有什么样的战略价值以及如何实施具有中国特色的教育数据开放?基于此,本研究将对我国教育数据开放面临的几个基础性关键问题进行探讨,期望能推动我国教育数据开放的进程与发展。


教育数据开放的概念

数据开放是大数据时代发挥数据价值的重要途径,也是大数据时代的重要特征和发展趋势之一。数据开放与开放数据既有联系,又有区别。我们可以把数据开放看作一种行为,把开放数据看作一种结果,数据开放是形成开放数据的前提条件和重要方式。开放数据是指对Web中产生或存在于Web中的各种类型的数据,按照用户特定的需求和相应的互联网协议、规则、框架进行的开发、加工、存储、组织等管理活动,最终目标是实现局域和全部Web空间的数据开放、互通与共享(谭健,2011)。开放数据遵循完整性、原始性、及时性、可获取性、机器可读性、非歧视性(任何人均可获取与访问)、非专有性(格式是通用的)、免许可性8项原则(Open Government Working Group2007)。

数据开放是指通过数据接口、网站等形式,在业务系统内部、系统之间或面向全社会,合理合法公开特定数据的获取与使用权限。数据开放的主体可以是个人、行政机构、企业、社会组织等。近年来,随着数据开放运动在各个国家和各个领域不断推进,其内涵亦在慢慢拓展。数据开放不仅是一项开放数据的运动,还是一种思维方式、一种文化,即让人们以更加开放、多元的思维平等、合理获取和使用数据,以满足个体、机构以及社会组织的发展需求。

教育数据开放是数据开放的一个子集,特指教育领域的数据开放。文献调研发现,目前尚未有学者或相关组织机构对教育数据开放进行明确地概念界定。本研究认为,教育数据开放是指将教育领域内(主要指各级教育行政部门、各学校以及教育培训机构)不涉及个人隐私、部门机密和国家安全的教育相关数据通过数据开放接口或数据开放平台(门户网站)等形式对外合理、规范化公开,以实现教育数据的创新应用与价值增值,推动教育事业高质量发展。

教育数据开放不仅是数据本身的开放,同时包含数据的采集、整理、发布等一系列数据操作过程的开放以及提供的各种数据服务的开放,比如应用数据辅助学生填报高考志愿、支持学校跟踪评价教育质量、促进个性化学习资源推荐等。需要注意的是,教育数据开放与教育信息公开不同。教育信息公开强调社会公众对教育领域各项信息的知情权,而教育数据开放更侧重于社会公众、组织机构等对教育数据的使用权。


教育数据开放的层次

根据数据开放的程度,可将教育数据开放划分为三个层次,分别是教育系统内部业务数据横纵贯通开放共享、教育系统与外部系统之间的数据开放共享以及中国教育与世界教育之间的数据开放共享(见下图)。



教育数据开放的层次架构

教育系统内部业务数据开放共享包括纵向开放共享和横向开放共享。纵向的数据开放共享是指各级教育行政部门(国家、省、市、县)之间以及行政部门和其管辖范围内学校之间的数据开放共享。横向的数据开放共享是指教育行政机构各部门(如省教育厅的办公室、财务处、政策法规处、基础教育处等)之间和学校各部门(如人事处、学生处、教务处、财务处等)之间的数据开放共享。随着互联网、云计算等技术的普及应用,各级各类信息化业务系统(如人事管理系统、学籍管理系统、资源管理系统等)主要采用提供标准化数据接口(如HTTP协议接口或Web Service接口)的方式公开数据,以供其他业务系统获取。我国正在推进的“三通两平台”建设工程,就是旨在通过纵向的数据互联互通构建一体化的国家教育管理信息化体系和国家教育资源公共服务体系。20184月,教育部发布的《中小学数字校园建设规范(试行)》在信息化应用系统建设方面也明确提出“应用服务之间应实现基础数据共享,避免出现‘信息孤岛’”。

教育系统与外部系统之间的数据开放共享是指教育行政部门、学校以及教育培训机构所持有的数据向交通、医疗、金融等行业以及社会组织与公众开放共享,以促进教育数据在整个社会的规范有序流通,激发教育数据市场活力,推动教育行业繁荣发展。进入“互联网+”时代,行业数据的开放共享以及产业效率的快速提升,正推动一体化、联动式的现代产业体系形成。比如,宁波市推出的“智慧校园卡”(中国宁波网,2015),集成了学生组织管理、在校情况推送以及学生校园内外乘车、消费等功能,初步实现了教育系统与金融、交通等行业系统数据的开放共享,对打造宁波智慧教育与智慧城市起到了很好的支撑作用。

中国教育与世界教育之间的数据开放共享是指中国教育领域的数据向其他国家适度开放共享,特别是“一带一路”沿线国家,实现全球教育信息与资源的合理规范开放,促进世界教育均衡与公平。超越国度的教育数据开放共享能够推动各国教育领域的深度合作,解决世界教育的基本矛盾,促进教育国际化,打造人类教育共同体。目前美国、英国、法国等国已经通过本国统一数据开放平台(如Data.govData.gov.ukData.gouv.fr等)对外开放教育相关数据集,促进全球教育领域的数据流转。


教育数据开放的特征

与政府数据、科研数据等的开放相比较,教育事业与业务本身的独特性导致教育数据开放呈现出三个显著特征:

第一,教育数据开放的数据体系呈现更高的复杂性。完整的数据体系是教育数据开放的基础与前提。大数据时代,根据其来源和范围,教育数据可分为个体教育大数据、课程教育大数据、班级教育大数据、学校教育大数据、区域教育大数据、国家教育大数据等6类(杨现民等,2015)。其中各层教育数据中均包含更多的细化数据,涉及大量过程性数据和结果性数据。此外,随着物联感知、视频录制、图像识别、平台采集(邢蓓蓓等,2016)等大数据采集技术的不断发展,半结构化与非结构化数据在教育数据中的比例亦随之不断增加。大数据时代教育领域内数据类型的不断丰富与数量的不断增加,使得教育数据开放的数据体系呈现出更高的复杂性。

第二,教育数据开放的价值转化周期更长。金融、交通、医疗等行业具有明晰的数据应用模式和流程,能够快速将拥有的数据应用于实践,实现从数据到经济效益的转化。与金融、交通、医疗等行业不同,我国教育数据开放正处于起步阶段,教育领域包含的数据纷繁复杂,对各类开放数据尚未形成明晰的应用模式与流程,难以在短期内看到开放数据带来的经济效益。此外,教育领域的开放数据增值具有隐形化特征,不能在短期内以直观的形式显现出来。如教育数据开放能够催生新的产业模式,增强经济市场活力;能够打破数据壁垒,汇聚数据,为政府、学校以及企业等管理水平的提升提供数据支持,减少其在人力物力方面的投入等。教育数据开放价值的非短期可见与隐形化特征使教育数据开放的价值转化周期更长。

第三,教育数据开放的隐私问题具有更高的敏感性。学习者、教师以及教育管理者是教育活动的核心参与要素,其学习、教学、管理活动是教育数据的重要来源。随着信息技术的不断发展,越来越多的关于学习者、教师以及教育管理者的数据被各种系统和设备所获取和利用,其中包含了大量的隐私数据。不同于其他领域,数据隐私在教育领域更加重要,不仅涉及学生成长、教师发展、家庭希望,也关系到社会发展甚至国家安全,其影响不可小觑(李青等,2018)。教育数据在各教育系统之间开放共享、向社会各方开放将涉及到大量学生、教师以及教育管理者的隐私数据,导致教育数据开放中的数据隐私变得更加敏感。