首页 观点正文

成都信息工程大学舒红平谈应用大数据技术深化教育信息资源

\


  2月13日,成都信息工程大学软件工程学院院长、教授舒红平在CIO时代APP微讲座栏目作了题为《运用大数据技术深化教育信息资源应用》的主题分享,他对自己在教育领域的思考和想法作出了分享。

  2016年起,经研究,大数据应用是一个起点高、投入大、普惠难的场景。教育信息化从建设数字化校园进入到信息技术与教育融合创新的阶段,为下一步建设智能化教育提供了支撑。

  一、教育信息资源的定义

  教育信息资源是指经过数字化处理、可以在计算机或网络环境下运行的多媒体信息材料。广义的教育信息资源是指在教学过程中学生和老师所接触、获得的经过加工处理的一切教育信息来源;狭义的教育信息资源是指以电子化、数字化、网络化为技术特征的教育信息资源。

  二、数字化校园对教育信息资源应用存在“六大不足”

  1.总体规划有度,实施路径不明。

  总体规划是面向未来的、方向性的。如何利用现有的教育信息数据、教学运行和管理数据、教育行业数据,通过实施路径分阶段、分批次实现规划目标,其路径是不够明确的。究其原因是由于不具备对教育信息资源建设和应用的过程路径,效益评估缺乏。

  对策:深化大数据应用第一步是整合现有的多源数据,采用自上而下的数据思路,规划教学资源发展关键管控场景及指标,通过前置机、物联设备等,建立指标对应观测点数据、常规和实时采集渠道。交给存储、加工、计算形成发展指标和汇总计算及整体态势感知,从而周期性地或实时地对教学质量进行监控。

  通过建立教育信息资源大数据平台,以成都信息工程大学卓越人才、能力达成度和监控项目为例,集成整合教务、学生、教师、考试及就业等方面的数据,以学生成长成才目标进行各年级各阶段目标分解,将专业认证和审核性评估中的数据对应知识、能力及素质要求,以指标的方式分解到教学计划、教学大纲、课程及授课环节进行管理,学生学习效果对应知识、能力、素质达成等级进行动态评估和监管,从而有效提高教学质量。

\

  教育信息资源大数据平台的总体架构


  2.交汇循规蹈矩,独占滋生权杖。

  具体是指缺乏数据交换的平台和工具,使各个教学部门的业务数据难以及时分割、统一调度、有效共享,长期聚集的数据为滋生数据官僚提供了温床。

  对策:建立统一的数据资源目录和交换平台,根据成熟的数据交换标准建立跨部门的数据交换共享服务,采用分布式数据存储实现对面向服务的部门数据资源共享和交换。以教育信息资源大数据平台交换的经验和策略性介绍,需要建立目录接口规范、教育信息资源分类规范、元数据标准、教育信息资源标识符、编目规范、目录体系技术管理规范、异构数据库接口规范等等。资源目录需要建立信息资源主题目录、教育信息资源部门目录、教育信息资源交换目录,交换制度需要建立信息资源接入制度、资源共享奖励制度、信息资源查询制度、信息资源安全保密制度等相应的制度。

\


  基于可配的多种类数据源信息接入

\

  建立标准的数据资源目录和交换平台


  3.及时存储易行,整合计算难得。

  数字化校园面向职能的电子化和数字化,很好地解决了业务数据及时存储和信息资源灵活拓展问题,但进行专题的全局数据业务分析时,因缺乏灵活适配的计算模型,对多元数据的重组能力、分布式计算量大、多个业务计算模型组合难,成为应用起点高的突出表现。

  对策:通过大数据开源技术可实现分布式计算,但关键是应用计算模型是一个持续改进和优化的过程,可以通过试探性地构建分析模型、分析模型如何快速适配、分析模型如何叠加和优化等问题,提供具有共性特征的领域模型来降低整合难度。例如课程群的设置合理性和教学质量影响着因果关系分析:首先,判断课程群设置的合理性是否为教学质量原因的因果判断;其次,当判断出教学质量变化是由课程群设置的合理性引起后,再进一步分析教学计划设计是否影响教学质量,主要包括课程群的科目设置是否合理、课程群的先后关系设置是否合理。通过对“Linux体系和编程”这门课的教学质量分析,我们发现一般“操作系统原理”这门课学习比较好的学生其“Linux体系和编程”的成绩也是比较好。利用这个模型在“某课程的上课对象是不同学生群体时教学效果的变化”、“某课程由不同教师群体担任造成的教学质量的变化”两个应用中进行快速适配、优化。

\


  软件工程学院课程群


\


软件工程学院具有强相关关系的课程群网络


  4.专注部门精准,全局关联迷失。

  从学校全局角度讲,各部门和单元都有自己的一套数据分析工具或手段,单从某一视角,如从某个维度、线索对数据进行重构或再检索,甚至引入一系列数据的观测和采集,这必然引发追加IT投入,造成大的投入困境。

  对策:全局专题分析即是大数据明显的优势,又是大数据前期应用的短板,维持有必要以专题应用为导向,向全局大数据架构分析平台发展,以支持众多以专题分析、规模化应用的角度提升IT应用的产出比。以学生跨画像专题为例,需强调专题应用开发的特点、专题应用如何引导专题数据架构、专题应用如何验证IT投入,学生画像专题应用通过数据整合、分析挖掘出每个学生学习及生活状态,其中学习状态下涵盖专业课、选修课、体育课、自习、借书等为多,生活状态下涵盖吃饭时间、锻炼情况、经济情况、消费情况、同学关系等为多。建立学生在排名、预测方面的内容。

  5.人机查询丰富,学习机制简单。

  数字化校园中的系统大多是事务处理系统和管理信息系统,决策支持和管理系统少,系统的学习机制侧重于个性化服务。随着大数据应用的规模化推广,尤其是对某群体资源包、历史数据进行策略提取时,学习机制变得复杂化。

  对策:机器学习和可视化技术成为场景知识表达的利器,关注问题的表达和结构的可视化,将对教育资源的深度利用和体验为重点。以评教模型的优化为例,通过建立学生课程评教、问卷调查及同行评教的多模式评教方法,当评教模型面临的决策冲突、个案冲突反映的模型缺陷,通过机器学习机制,规避这种缺陷引起对评价模型的不信任。

\


  问卷调查评教

\


学生课程评教


  6.数据挖掘有余,场景开发不足。

  以业务为中心的数字化校园建设很重视对历史数据的挖掘分析,但这些分析多侧重于决策参考与知识发现,数据多来自于数据局势、多维数据分析角度。随着教育科学化、规模化管理的日益增强,教育管理的决策点也在不断增加和更替,动态提供面向不同决策场景的支持工具。

  对策:提供众创微服务开发工具和平台,使开发成为解释和洞察数据的工作。以互联开放大数据众创平台经验为例,需做以下几方面的工作:通过微服务提供微决策的支持;微服务开发中的构件化、可视化、服务化开发模式,代码自动生成、实施加载动态运行;微开发中场景的应用、用户的参与都是需要关注的。

\

  微服务平台架构


  三、总结

  深化教育信息资源的应用需要在深化管控、深化交汇、深化模型、深化专题、深化交互、深化规模上进行教育资源的应用。其中在深化管控方面进行统一规划、分步实施,标准化执行;在深化交汇方面建立统一数据资源目录和交换平台;在深化模型方面重视共性特征的领域模型;在深化专题方面以专题应用方式引导大数据平台总体架构;在深化交互方面关注于问题表达和结果可视化;在深化规模方面以微服务开发方式提供微决策支持。

 

责任编辑:陈近梅

分享: