当前位置:首页 > 教研论文 > 查看论文

教育大数据与教育测量发展的展望

 

  • 作者:裴智轶
  • 学校:
  • 学段:初中
  • 学科:其他

分享到 微信


  泛在学习时代的教育大数据将对教育产生革命性改变,这种观点已经被普遍承认。但是,这些数据从哪里来,如何采集,如何挖掘,如何反馈进入教育实践,我们似乎还没有做好准备。
  教育测量由来已久,指导教育测量的理论研究始于20世纪初,并在近几十年得到了快速发展。现有的教育测验理论,通常关注两类测验,其一要区分应试者的选拔类考试,其二是判断应试者能力水平的达标考试。选拔性测试,重点关注测验分数能不能有效的把应试者的真正水平区分开来。达标类测试重点关注测评分数能不能体现应试者的真正水平。但是,泛在学习时代,教育测量将深入到教育过程的各个环节,与现有的教育测量理论的使用情景有极大的不同,如何借鉴现有的测量理论,并产生新的测量方式,成为今后教育测量研究的重要方向。
  一、主要的教育测验理论
  现有的测验理论,大致可分为两大发展阶段,标准测验理论阶段和新一代测验理论阶段。标准测验理论现在占据主导地位,比如经典测验理论、概化理论及项目反映理论都属于标准测验理论,这些理论强调对被试宏观层次的能力水平测量及评估。而以认知诊断为代表的新一代测验理论强调测验应同时在能力水平和认知水平两种水平之下进行,强调用心理学理论,尤其是认知心理学理论来指导测验编制,从而使测验所测量的特质及对测量结果的解释具有心理学理论支持。
  经典测验理论由三部分构成,即关于测验真分数的假定、关于测量信度的理论和关于测量效度的理论。其方法体系则包括题目分析技术和测验的标准化技术两大部分。其中,测验的标准化技术主要包括题目编织的标准化,测验实施的标准化,阅卷评分的标准化以及分数的转换与解释的标准化共4个环节。经典测验理论的缺点主要有以下几个方面:第一,考生的能力参数严重的依赖于试题样本;第二,对考生能力参数估计的精度指标不恰当;第三,考试结果极易被人推广到不恰当的范围;第四,估计测量信度所依赖的经典平行测验假设在现实中无法满足;第五,题目参数严重依赖于考生样本;第六,题目的难度参数和考生的拟能力参数定义在不同的量表上。为了改善经典测验理论的不足,逐渐发展出概化理论和项目反映理论。
  概化理论中的分数,不再是经典测试理论中的真分数,而是根据决策的需要,在指定的条件范围内进行解释的全域分数。每次测量工作所涉及的条件不同,对测验结果的解释也不尽相同。概化理论的基本概念包括:全域分数与测量目标,测量侧面与观测全域和概括全域,相对误差与概化系数,绝对误差与可靠性指标。概化理论在测量被试在某一特定行为样本上的表现,给出分数的同时,还将指出这个分数可以在多大程度上代表着他的行为总体,可以推断到多长的时间范围。
  项目反映理论建立在经典测验理论的基础上。根据我们通常的经验,同一测试项目,能力水平越高的被试,答对项目的可能性就越大。同一被试,越容易的项目也就越可能答对。因此,项目反映理论就是依据这种概率的假设,以函数的形式,将对项目的作答结果与被试的能力和项目本身的特性做出了量化的联系。
  但是,传统的测验理论主要是关注考生所取得的教育成果,甚至是只就测验的结果对考生进行筛选,对于产生这些结果的原因,比如不同的认知结构、加工能力、认知策略无法做出合理的分析与解释。因此,新一代测验理论在宏观能力水平测验的基础上,更加注重信息加工过程的评估,引入了认知心理学为代表的新的心理学研究成果。
  认知测验理论在能力水平测验的基础上,强调测量三方面的认知特性:一是技能或知识;二是知识结构,知识结构不仅表明知识、技能的数量或多少,而且还表明如何对这些知识、技能进行组织;三是,认知过程。认知诊断强调测验要深入考察被试内部的心理加工过程。认知诊断测验需要构建相关任务解决的认知模型,确定认知属性和属性的层级关系等。
  二、泛在学习对教育测量的需求
  泛在学习的教育测量与主流的教育测验理论所研究的测量有很大的不同。比如关注日常学习,测量的目的是为了即时性的反馈;一般由教师在日常组织,通常利用5-10分钟的时间随堂进行,甚至是学生自行安排;重点针对每一个人的具体的知识点的掌握情况;试题的保密性要求低,以主流题目为主等等。因此,泛在学习的教育测量,应该有其自身的特点和要求。
  1、泛在学习的教育测量,主要的形式是与学生的课堂练习相结合,做到测、练一体,即时的采集数据,使用起来,必须简单易行,便于教师组织。因此提倡使用专家设计的组合式内容,既利于教师使用,测量效果也更加准确。
  2、泛在学习的教育测量,每堂课可以利用下课前的5〜10分钟作为学习内容的总体掌握情况的测量环节。这个环节,不同于以往的学生自主练习环节,必须有效的组织各种内容,各种难度,体现一定的区分度,有效的测量出学生的掌握情况。应该树立如果全体学生都百分之百掌握的课堂,是低效课堂的观念,敢于出难题,激发学生的思考。
  3、泛在学习的教育测量,即时作用是反馈教育效果,改进教学,合理组织练习。因此,对于测量的内容及测量目标的标记,不仅要标记所涉及的所有知识点,同时要标记对于同一知识点的不同的应用层次。
  4、泛在学习的教育测量,长期作用在于记录学生能力的发展过程。因此,不仅要测量学生对于具体的知识点的掌握情况,更要在测量时,对于学生的能力进行记录。例如,数学学科的计算能力,逻辑思维能力。
  5、泛在学习的教育测量是练测一体的。因此,对于无法顺利完成练习的学生,在练习的过程中可以提供提示,帮助掌握相关内容。同时,在测量指标的设定上应该予以设计。
  6、泛在学习的教育测量,使用者、组织者一般不掌握教育测量理论,因此测量结果的呈现形式,应该便于一般教师的使用。同时,数据的粒度不宜过细,以质性评价的指导性意见为主,弱化量化评价。比如,班级的掌握率是75%,或者78%,都可以呈现“较好”的质性评价。
  7、泛在学习的教育测量,结果以反馈为主,基本不作为评价指标,因此信度、效度等的要求,可以低于大规模测试。尤其是单次的测量更是以参考为主,如果结果无法明晰的得出结论,完全可以利用其他时间,再次开展测量。
  三、泛在学习的教育测量系统的基本要求
  根据泛在学习的教育测量的特点和要求,构建这样的测量系统,在测量系统的基本要求的基础上,应着重实现以下功能。
  1、具备完整的知识体系,同时能够标记各知识点之间的关系及强度。
  2、根据各学科特点,除了知识维度,应该有一些主要的能力维度,并可以分多个等级或者具体的数据进行记录。
  3、测量的试题,应该能标记所涉及的所有知识点,以及知识点的不同应用层次。
  4、对于测量的试题,对应与不同的教学目标,应该有广2套,以5-10分钟为完成时限的组合试题,覆盖各教学目标和教学层次。
  5、对于特定的试题,可以提供选择性的提示或者分步完成的功能,既作为分层次练习的一种形式,也便于学生学习。
  6、对于不同的教学目标,可以提供课前测量、讲授后测量、课后测量等不同的组合式的测量内容。
  这样的泛在学习的教育测量与练习系统,目前国内尚无案例,如果能够成功构建并不断的进行完善,必将成为教育信息化的利器,切实提高教师的教学效率,让教育信息化真正的起到教育现代化的核心作用。