业界动态

当前位置:首页  工作动态  业界动态

高等教育学生数据的可靠使用 | 研究报告

发布人:赵怡晨时间:2018-09-17浏览:79

摘自:中国教育网络

随着学术事业进入了迅速变化的数字世界,高等教育界必须在界定学生数据的可靠使用以及符合伦理的实践方面做好准备和寻求更多人的协助。如今,几乎所有的学院和大学教师都把教学责任分担给了数字服务提供商。教学管理系统(Learning Management System,以下简称LMS)传送作业,在线论坛组织讨论,人工智能助教定制课程,多种多样的呼叫和会议平台远距离模拟面对面互动。所有服务都留下了教学效果、学习状况和用户选择的数字痕迹。这些信息可以用来提升学生产出、构建科学基础等。

在和学生相关的数据流中,哪些是可以主动地和其他数据流适当整合,而哪些是最好保持分离的?这些信息是否应该永久保存,如果不是,那么在什么情况下应该抹除?数字平台产出信息的使用者们是否应当承担某些义务?谁有权从这些数据中获利,以及这种商业活动要为此承担什么责任?这些都是教育者和厂商们需要面对的诸多关于信息伦理和政策问题中的一部分。

当今世界中,各个数字平台的拥有者(如AlphabetAmazonFacebook)已经在用户数据的生产和积累中获取了无法估量的利润,而且在当前的数据积累过程中,他们掌握的和人们有关的数据比世界历史上的任何政府都多。

现在是时候坦率地讨论如何定义学术界的信息实践伦理了,这也正是斯坦福大学在线教育高等研究中心(Center for Advanced Research through Online Learning, 以下简称CAROL)和Ithaka S+R组织的“高等教育学生数据的可靠使用”项目的背景。我们的目标很简单,也很有挑战性:首次明确地描述一些原则,为在数字时代的学生数据使用相关的院校政策提供一个框架。从我们的视角来看,这个探索应当以下列四项核心假设为中心:

第一,教育从根本上是人类的努力。教育可以采用丰富的技术(算法、黑板、机器、纸张)来支持和加强,但是不可能独立于人类行为而完成。

第二,教育仅仅有一部分是商业行为。教育也是公民行动,是塑造人们、群体、社会的实践和在代际之间传递文化遗产的实践。

第三,以教育来保持人文和公民品格不能被视为是理所当然的。人文和公民品格的保持是脆弱的,而且依赖于积极、勤奋、持续的努力来加以保护。

第四,信息和知识带来责任。认识到当前的教育实践并非是最优的,并且知道其改进方法。

我们正是出于这样的责任精神对当前的情况进行了调查,并提出了一个框架--充分利用数字创新来推动高等教育的关键改进。



正在涌现的学生数据使用场景

高等教育机构正在创新使用学生数据的多种方式。如今,随着计算资源的成本大幅下降,高等教育行业的剧烈竞争将招生和遴选变成了一个快速演进的技术领域。由于学院和大学能够使用的学生数据越来越多,而且分析能力也有所提升,他们可以比以往更精准地预测哪些学生会入学并且取得学业成就。全世界范围内的招生活动、录取决策和经济资助都通过复杂而精致的算法获得了信息支持。

尽管如此,招生录取甚至都未处于校园技术浪潮的中心。许多院校现在都基于描述学生产出的数据而做出业务决策。20032014年,佐治亚州立大学(Georgia State University,以下简称GSU)运用了学生保留和学业完成方面的数据来发现和解决其中的问题,将毕业率从32%提升到了54%。例如,对历史数据进行挖掘就可以找出那些学生持续表现不佳的课程,管理者们因此可以为这些课程建立同伴辅导形式的补充教学项目。从而进一步的观察展示出,尽管补充教学确实提升了许多课程的通过率,但是代数、微积分先修和统计仍然是阻碍。GSU的管理者和数学系为此重新设计了这些课程,采用了翻转课堂的方式,随后未通过率(Drop-Fail-WithdrawDFW)从2006年的43%下降到了2014年的19%

再来看看GSU2011年设立的“黑豹继续学业奖学金”(Panther Retention Grant)。数据分析表明,数百名学生在学习成绩不错的情况下,在距离毕业不足三个学期的时候退学。管理者们经过调查,确定许多学生因为在学期账单上有小额的未付学费而无法注册。为了解决这个问题,GSU创建了专门的奖学金项目,为这种情况的学生提供平均约900美元的奖学金。在黑豹继续学业奖学金的资助对象中,88%的学生能够毕业或者一年之后仍在继续学习,而来自继续学习学生的学费收入远远超过了这个奖学金项目的成本。

教师、辅导员和学生自己手中也掌握着预测性分析工具。早期预警系统汇聚和分析来自多个来源(成绩单、LMS日志文件、学生信息系统)的数据,并自动标记出与低概率学业成就相关的学生行为。像亚利桑那州立大学(Arizona State University,以下简称ASU)的eAvisor系统那样,有些系统是面向辅导员的,将学生活动相关的LMS信息与注册数据、学生个性背景等相集成。当学生偏离正轨时,辅导员们将接到通知并被鼓励进行干预。eAdvisor还利用描述个人学术表现的数据来为学生和辅导员提供注册课程的建议。

有些系统通常被称为仪表盘(Dashboards),是被设计用来向教师或学生提供汇聚而来的信息,从而可以帮助他们改善表现。利奥萨拉多学院(Rio Salado College)的RioPACE是一个广为人知的例子。这个工具将学生的群体信息和学术历史与LMS日志文件数据合并,用于预测学生在指定课程中取得成绩的可能性。这些预测被传送给教师,使他们可以根据需要运行定制分析,并运用得到的结果来为特定的学生提供支持。ASUeAdvisor也包含有一个面向学生的仪表盘。密歇根大学在科学、技术、工程和数学(STEM)的导论课中使用了E2Coach系统作为工具,根据不断更新的算法自动向学生发送个性化的课程表现信息。

此类程序的效能证据还比较有限,不过很有希望。有一项关于预测性分析对学生辅导支持效果的随机研究发现,和没有进行此类学生辅导的情况相比,采用InsideTrack公司提供的服务可以提升35个百分点的学生保留率。当前,在这一领域中还有两项随机试验正在进行,寻求在更大范围内验证这些发现。

其他的创新大多归属于适应性课件(Adaptive Courseware)的范畴内。这些系统是一些数据平台,通过采集学生活动的信息--任务耗费时间、任务表现、参与水平等,来为学生创建“个性化学习路径”,诸如此类。适应性课件系统提供仪表盘和分析工具,让教师能够看到个体学生和整个班级正在努力克服的难点。有些系统也为学生提供仪表盘,让他们更好地认识到自己的进展以及遇到的阻碍。尽管适应性课件仍然是一个相对较新的技术,现在也已经有了一些关于其有效性的描述性证据。2016年,在比尔及梅琳达·盖茨基金会(Bill & Melinda Gates Foundation)的适应性学习市场加速项目(Adaptive Learning Market Acceleration Program)的一项研究发现中建议称,适应性课件的实施策略非常重要,而且最有效的产出(也许是唯一的产出)要随着对课程的全面重新设计而逐渐积累。


不平衡的采用情况

尽管分析程序越来越常见,但是仍然只有少数的学院和大学进行了系统性的部署。根据毕马威(KPMG)在20157月对高级管理者们进行的一项调查 ,只有41%的受访者正在使用学生数据进行预测性分析,而且只有29%回应称他们拥有对自己的学生数据进行分析的内部能力,甚至即使是那些正在努力的院校也开始感觉遇到能力短板。2016年的大学校园计算调查(Campus Computing Survey )揭示出,不到五分之一的受访者将所在院校的数据分析投入评价为“非常有效”。在2015年的Ithaka S+R调查中受访的四年制学院教师代表样本中,回应称正在教学中使用某种形式的技术的是少数,尽管有63%的受访者回应称他们将会这样做。在EDUCAUSE分析研究中心(ECAR)的2017年教师与信息技术研究中,有16%28%的教师回应称,他们没有获得基于数据的规划和咨询服务,同时有23%34%的教师获得了服务但显然选择不使用这些服务。

不兼容的数据系统拖了院校内部变革的后腿。非常典型的情况是,复杂精细的分析需要的信息以不同格式分散在学生信息系统、注册记录和LMS日志文件中。有些学院和大学拥有相应的技术、财务和人力资源来合并数据,但是大多数都没有。

甚至在那些克服了组织管理方面挑战的院校中,创新也经常是边缘化的。要实现大规模的采用,必须要在管理者、教师和学生支持人员中维持一种迎接数据驱动实践并为之投入的校园文化,这可不是简单的事情。在2015年的Ithaka S+R调查中,只有35%的受访者回应称他们会因为利用技术改进教学方法而受到奖励或认可。

尽管数字技术在支撑和改善教学方面有着辉煌的前景,深层次的政治潮流却在推向另一个方向:教授的统治权。教授在教室和课程上的自主性是一项长期遗产,为教师们的教职特别是终身教职提供了强大的权力和声望。数十年间,终身教职的任命数量在不断下滑,同时学生服务和IT人员出现了增长,获得终身教职的人们往往相信有理由保卫残存的地盘。在这样的背景下,校园信息技术项目会产生出最新创新,而教授们容易将此解读为进一步抹除边界的行动,目的是要擦去那些他们长期拥有特权领域的标记。

风险中的商业

除了争夺校园地盘的前哨战以外,还有更实质的原因使得教育者们在迎接信息技术进行教学时保持谨慎。对学生学业前景的预测和应对方案之间的模糊界限是最重要的一个原因。新的教学分析的倡导者们总是在强调,在引导教学采用最有利于学生个体未来的方式上,利用学生此前的数据有着远大的前景。然而,同样的这些倡导者们却几乎没有提及学业追踪(Academic Tracking)这个长期和令人讨厌的传统。在这种传统中,基于所谓客观的、科学的方法来衡量学生能力,使对学业机会进行分层分类的做法得到了合理化。而学业追踪一直伴随并实质强化了种族和社会阶层的不平等,这个事实正是对教育技术行业几乎完全一致的乐观态度的重要制衡。

当然,这种乐观态度对于风险投资的初创企业至关重要,因为它们依赖于新的平台和算法实质性改进个人和组织行为的潜力。对戏剧性急剧提升学业表现的许诺也是初创企业游说投资者和客户的一部分。而且主要的教育捐助者都在私有的教育参与者上有更多投资,这个事实也增加了宣传效果。然而严峻的真相是,个体学习和组织提升方面的有意义的进展几乎都是渐进性的。取得良好商业进展和构建良好教育实践之间的时间差是真实存在的,而且硅谷的大吹大擂和学界的小心谨慎的奇怪混合也是全球教育技术社群中的典型特点。这种混合从长期来看对高等教育是好是坏还没有结论,不过短期内这将会导致在商业/学术的鸿沟两侧各方的大量误导信号和互相误解。

紧张关系还存在于对知识及其信息基础的财产性控制(Proprietary Control)和委托性控制(Fiduciary Control)之间。科技企业依赖于对知识产权的所有权,而且其价值是随着用户群体的增长而实现提升的。描绘教师和学生的数据让企业能够在改进算法和定制操作上保持竞争力,因而往往对这些企业的商业方案有关键意义。数据本身就可以作为商业资源或者作为商品化咨询专业能力的基础,因此对数据本身的权利也有其商业价值。

然而,学院和大学传承了一项由来已久的义务,即安全地保有学生的文凭记录直到永久。如果这些信息是在政府法规涵盖范围内,那么这项义务还具有法定的强制性。此外,为了能够验证或驳斥科学进展中的发现,学术研究也越来越要求数据的分享使用。对于教育技术和教学分析领域中的学术、商业、科学目的的数据使用,目前还没有建立共同接受的规程来评判其中的利益冲突。

最后,学业评价的透明度和复审学业评价的可能性是高等教育的标志性理念。学院和大学有着深厚的传统,允许学生(和教师)寻求重新考虑评价结果和请求独立评审。如果私营企业参与了学业评价,而且其系统要么计算不透明,要么是私有财产,或者两者皆是,那么这些传统也许就会受到挑战。计算系统可能会重现偏见,或者重现历史中不平等的学业路径和学业产出,而对于独立评审的障碍可能会导致难以确定这种问题是否存在。仔细监控和推翻计算决定可以降低这些风险,但是同时也削弱了这些系统的可靠程度和一般功效。

学院、大学以及它们多种多样的子单位各自采取了不同方式应对这些挑战,造成了伦理上和程序上都不平衡和高度不确定的形势。随着技术界著名的“行动倾向”(Bias Towards Action)而来的是长久存在的风险,即数据使用可能已经逾越了描述不清和尚在起草的伦理底线。但是程序上的谨慎本身也有伦理风险,即无法根据积累的知识而采取行动。这是为什么每个专业性的奋斗领域都持有承担双重义务的伦理传统:不要伤害,但在意识到有次优的实践和产出时也不要犹豫。


可靠使用的原则

法律、院校政策和伦理框架都是在二十世纪中产生用来指导教育信息的可靠使用的,而教育技术前沿的快速前行已经远远超越了它们的变革步伐。这带来了震撼性的再认知,同样也带来了对指导可靠教育实践的理念进行重新审视和描述的机遇。

正因为认识到这个机遇,20166月,斯坦福大学CAROLIthaka S+R召集了高等教育界的同行在加利福尼亚州举行会议。通过会议的准备工作和充分讨论,形成了学生数据使用的四条基本原则:共识、透明、启发改进、开放未来。

共识(Shared Understanding):教师、管理者、学生和第三方厂商都为数据产生过程做出了贡献。所有这些主体都应当在数据采集的基本原则和限制上取得共识。这里我们认识到,数字数据在根本上是多重属性的。尽管大多数关于数据伦理的探讨都将首要的数据所有权赋予了数据所描绘的个人,我们反而提议将所有数字数据视为联合投资。这些数据不仅有学生和教师的贡献,也要有那些创建和维护数字平台和受托持有数据的主体的投入,无论这些主体是非营利的大学还是私人企业。从这个角度上,描述特定某位学生的教学互动的信息并不只属于这位学生。相反,这位学生和其他为产生这些信息做出贡献的主体共享所有权。所有这些参与到这个教与学的联合投资的主体都应当有对信息使用及其限制的共同概念。

透明(Transparency):清晰的流程和评价是教育系统以人为本的标志,而且即便是教育系统发展得更复杂时也要保持这一点。学生有权获得:1.对描述他们并且由所在院校或者相关第三方组织受托持有的信息的性质和范围的清晰表述;2.关于他们将被如何评价的解释;3.请求以清晰明确说明的治理程序对评价进行复审的能力。我们要认识到,独立评审有着学术和科学上的标志性价值。机器学习时代对于维护这个价值带来了挑战,因为计算系统会通过程序来例行性地产生决策,而这些程序甚至连对系统创建者都是不透明的。我们相信,学术和科学的透明理念是绝对的,而且对任何基于实证证据的决定的合法性而言都是不可或缺的。在将数字技术应用到学术活动中时,透明性是设计和工程实施中必不可少的。

启发改进(Informed Improvement):教育组织有义务研究学生数据,从而使其教育环境的效率更高,并为普遍知识的增长做出贡献。这里要认识到,正如学术传统要求有透明性义务那样,它也要求面对证据就要采取行动的义务。教师和教学管理者拥有和存储了描述教学过程和产出的巨量信息。毫无疑问,其中有些信息会揭示出一些坏消息:某些教师会不成比例地奖励或者打击特定的某类学生;课程甚至整个项目几乎都没有产出可衡量的教学成就。尽管在过去,也许零散分布或者不存在的信息隐藏了类似的消息,当今的数据管理系统将会让问题的浮现成为日常。启发改进的伦理要求意味着教师和管理者将会根据不断积累的证据寻求弥补那些被揭示出来的问题场景。

开放未来(Open Futures):教育应当创造机会,而不是预先消除机会。教学、辅导和评价系统的建设和使用方式必须能让学生展示出超越本人或他人此前成绩的天资、能力和成就。数字技术在以学习改进人生方面富有前景,然而我们也要记住,同样的技术也可以用来阻碍机遇。我们相信创建这样一条指导性伦理是必不可少的,其中教育者们默认要有创造机会的理念,而非先发制人的应对方案。预测性分析应当用于赋能,而非追踪。正是因为赋能和追踪之间的差别难以指明,开放未来必须作为引导决策的一项重点理念。