时 间 记 忆
最 新 评 论
专 题 分 类
最 新 日 志
最 新 留 言
搜 索
用 户 登 录
友 情 连 接
博 客 信 息


 
暑假读书摘要(摘选)
[ 2014/9/3 14:10:00 | By: ashy ]
 

暑假读书摘要(摘选)
2014年的暑假已成为了过去,仔细回想一下,这个假期过的算不上充实,也没有更多的收获,仅有如下的一点点事情一一做了6天的远程研修,看了七八本书,跑了大两千公里的路,上过山(如登泰山)、下过水(学蛙泳),送过行、聚过会,历经喜怒哀乐忧,数品酸甜苦辣咸,如此而已!
读了几本名人传记,看了几本历史小说,阅览了“教育测量与评价”方面的三个版本的论著或书籍,并在“教育测量与评价”方面在了一点摘抄,
今摘选并发出一小部分来,已慰藉不学无术的自己。(该部分主要摘选自胡中锋主编的《教育测量与评价》第二版,广东高等教育出版社)
测量的定义
   多数人都接受史蒂文斯(S.S.Stevens)给测量下的定义:“从广义而言,测量系根据法则给事物分派数字。”此定义包含三方面特性:法则、
事物、数字。
   1.法则,测量的标准、依据和准则,即根据什么来进行测量。
   法则有好坏之分,好的法则可得到比较理想的测量结果,差的法则只能导致不准确的结果。事物的测量,其法则都有一个渐进、逐步精确的过
程,可以说,测量史是一个不断建立和完善测量法则的过程。
  2.事物,是测量的对象。其属性或特征。所测量事物是否具有一致性,是影响测量结果是否精确的一个重要原因。
  3.数字,是测量结果的表现形式,是区别测量与定性评价的一个标志。数字大多具有量的意义,即代表一定数值,具有自然数的特点,如区分性
、序列性或等级性、等距性和可加性。 在测量中,是根据事物的属性和属性的大小来分派数字的,因此,必须考虑数字是否具有如上自然数系统的功能,必须考虑事物的性质和指派数字的原则。

测量的三个要素
  物理属性的测量、精神属性的测量,都必须具备三个要素:
  1.单位,是用于计算的标准,使测量的基本要求,没有单位就无法测量。理想的单位举两个条件:一是要有确定的意义,二是要有相等的价值。
  物理测量的单位比较明确,教育测量的单位一般来说是相对的:它的意义比较模糊,相同单位不等值,因此,通常教育测量的单位不能直接加减
乘除。
  2.参照点,是计算的起点,参照点不统一,量数所代表的意义就不同,从量的结果就无法进行比较。参照点一般有两种:绝对零点和相对零点。
  3.量表,一般称为测量的工具,是具有一定单位和参照点的连续体。教育测量中所使用的量表多以文字试题的形式出现,也有以图形、符号、操
作要求的形式出现的。量表的种类和精确度各不同,分为类别量表水平、顺序量表水平、等距量表水平、比率量表水平。
    类别量表是最低水平的一种测量量表,用数字代表事物和事物的归类,没任何数量意义,不能做数量化分析,不能进行加减乘除。如1代表男
,0代表女。
顺序量表比类别量表要精确,其数字不仅指明类别,同时指明不同类别的大小等级或具有某种属性的程度。如品德评定等级、考试的名次、甚至考
试的原始分数等。
等距量表不仅有大小关系,有相等的单位和相对的零点,可进行加减运算,因没有绝对的零点,不能进行乘除。如温度测量、智力测验的分数。
比率量表是最高级和体现最精确的测量水平的一种测量量表,既有等距的单位,又有绝对零点,可加减乘除。教育测量的量表很难达到这一水平。

教育测量
  教育测量,是根据测量学的原理和方法对教育现象及其属性进行数量化研究的过程。主要包括对学生内在精神属性的测量,如测量
生的学习成绩、智力水平、的学习成绩、智力水平、品德状况、人格特征等等方面。因此,教育测量主要是一种间接的测量。
  教育测量的特点:1.测量结果的间接性。2.度量单位的相对性。3.测量对象的复杂性。4.测量目的的针对性。

  教育测量的误差问题。
  有三种情况会导致测量的误差:(1)测量的仪器和设备。测量工具的精密程度会影响测量的精确程度,测量时使用的仪器和设备越好,误差就
会越小。(2)所测量的事物的一致性程度。所测量的事物是否具有一致性,这是影响测量结果是否精确的一个重要原因。(3)测量者的因素。

  教育测量的作用:
(1)有利于提高教育、教学的水平。教育和教学的最后一个环节就是对成果的检验,同时在教育和教学的过程中,也需要随时了解教育和教学的
情况,诊断学生学习中存在的问题,实行因材施教,所有这些方面都需要用到教育测量的理论与方法。例如,如何编制测验、组织考试、评分以及解释分数等,都属于教育测量的内容。因此,正确地利用教育测量,有利于提高教育、教学的水平。
(2)有利于提高教育管理的水平。加强教育测量,能提高教育管理的科学性,能有效地改变长期以来形成的凭主观经验衡量教育效果的做法。教
育测量可以根据一定的教育目的,编制客观的标准化的量表,进行广泛的测量,作出科学的分析和评价,它对于合理地使用教育经费,科学地选拔人才,决定教育政策,进行教育规划等,都起着重要的作用,是教育管理不可缺少的手段。
(3) 有利于发展教育研究的方法。

教育评价。
   教育评价的认识确有某些共同特点:(1)承认评价是一个过程;(2)价值判断是评价的本质特征;(3)以一定的教育价值观为依据;(4)采用一切
可行的科学手段。初步把教育评价界定为:“教育评价是根据一定的教育价值观或教育目标,运用可行的科学手段,通过系统地搜集信息、分析解释,对教育现象进行价值判断,从而为不断优化教育和教育决策提供依据的过程。”必须明确:(1)教育评价的对象、范围和地位。(2)教育评价的目的和作用。(3)教育评价的依据。(4)教育评价的手段。

1.教育评价的意义:
(1)教育评价价是教育管理的重要组成部分。教育管理的各个环节都需要评价。有了评价的管理,能及时反馈信息,及时发现问题、解决问题,
这是一种闭合回路的管理系,是一种科学的管理。没有评价就没有科学管理,缺少评价,任何管理都是不健全、不科学的。(2)教育评价是深化教育改革的重要措施。3)教育评价是全面提高教育质量的重要手段。(4)教育评价是教育科学研究的重要内容。

2.教育评价的功能
(1)导向功能。它对教育目的的实现和方针的贯彻,有相当强的制约和保证作用。教育评价是根据教育目标进行的,它通过对现状与目标之间的
距离的判断,能有效地促进被评对象不断接近预定的目标。所以,教育评价具有导向功能。
(2)监督检查功能。社会各界要了解、考察教育的发展状况,教育行政(管理)部门要对学校工作进行指导与管理;学校本身也要对师生的教学活
动进行调节和控制;教师要对学生的学习进行监督和帮助,都需要通过一个具有检查监督功能的形式和手段,即教育评价。利用评价的这个功能,我们可以全面地掌握教育的各种情敏锐地发现问题并及时加以解决,对任务完成数量与质量进行控制,为促进、提高教育活动的有效性提供科学的依据。
(3)激励功能。通过教育评价,会激发被评者争先的欲望和情绪,从而创造出一种正式或非正式的竞争环境。在教育与教学管理,根据工作的特点
和活动的规律性,我们可以有意识地利用评价来强化评价对象间的竞争情绪,这样,不仅能起到激励先进、鞭策后进的作用,还可以使评价者预先设定的目标得以实现。
(4)筛选择优功能。在教育的实际工作中,经常要对教育的对象进行筛选择优。这就需要将众多的对象根据一个标准来衡量和判断,也就是要对他
们进行科学的教育评价。
(5)诊断改进功能。通过教育评价,可以发现教育、教学过中存在的问题和不足,然后针对这些薄弱环节提出改进的措施,这就是教育评价的诊断
与改进功能。

教育测量的质量指标
要衡量教育测量的质量,可以采用四个指标,那就是信度、效度、难度和区分度,前两个指标主要是对整个测量而言的,后两个指标则主要是对测
量的项目而言的。
信度信度指的是测量结果的稳定性或可靠的程度,亦即测量的结果是否真实、客观地反映了考生的实际水平。
具体而言,可以从三方面来理解测量的信度。(1)信度指实测值和真值相差的程度。测量的目的之一,就是希望通过测量得到的实测值能够接近
事物的真值的大小。由于各种原因,实测值一般不会完全等于真值,两者之差称为测量误差。则量误差越小,测量的信度就越高。(2)信度指统计量与参数之间的接近程度。统计量越接近参数,个统计量的可靠性便越高,因此,信度就越高。(3)信度指两次重复测量或等值测量之间的关联程度。如果对同一对象进行两次重复测量或者等值测量后,计算两次测量的相关系数(相关系数的计算,可参考任何一本教育统计学的教材),相关系数越高,说明测量的信度就越高;反之,就越低。
信度的类型。
稳定性系数又称重测信度。它是指用同一测验试卷,在先后两个不同时间内对同一组被试进行测验,两次测验实得分数的相关系数。稳定性系数是
估量信度最简单的方法,只需用同一份试卷对同一被试测验两次即可。使用重测法要注意几点:(l)重测法只适用于速度测验而不适呈用于难度测验;(2)所测的信度大小,常常受两次测验时间间隔长短影响;(3)第二次测验没有吸引力,不易引起学生的兴趣;(4)要实施两次测验,耗费人力、物力和时间较多。
等值性系数。当同一测验的一种型式不能或不适合实施两次时,就需要采用该测验的另一个平行型测验或者复份(复本)。复份在测验的内容、题
数、格式、难度、平均数、标准差等方面应与原测验一样,否则,估计的等值系数就会出现较大的误差。决定等值系数的方法.先实施第一次测验,然后在最短的时间内实施第二份等值的测验,再求它们得分的相关系数。这个相关系数即为信度的等值性系数。
采用复份法估计信度系数要注意:(1)两次测验试卷要等值,即在内容范围、题型、题数、难度、区分度等方面要要基本相同;(2)两次测验要尽可
能在较短的时距内进行;(3)确定两次测验I是否等值,还要考察两次测验结果的平均数与标准差;但在实际操作中,要编制两份等值的测验是非常困难的。
内部一致性系数。要根据一次测验来估计测验的信度系数。这就是内部一致性系数,即把一次测验人为地分成两个部分,比较两个部分的一致程度
,从而估计信度系数。
论文式测验的信度系数。
评分者信度。
提高信度的方法。信度系数究竟以多大为好,没有明确的标准,要看测验的目的和类型。对于学科测验,信度系数要求达到0.9以上,智力测验要
求达到0. 8以上,品德测验能达到0.6以上就算不错了。
测量误差的来源基本可分为三类:第一类误差产生于测验的本身;第二类误差与特定的实施条件有关;第三类误差包括被试本身的变化。
1,测验本身所引起的误差。测验本身的有些因素会直接产生误差。例如有些测验题目的格式,如判断题,猜测的可能性很大,这就引起测验的不
稳定性。如果测题的难度过大,以致每个被试大量猜测,则所有的被试的总分接近子随机分布,其变差大部分为误差变差。如果在任何测验中,猜测已成特征,则测题愈难,其信度愈低。另一方面,测验越易,分数离差越小,而信度也就越低。规定时限可以鼓励人们加速作出反应,但常常会引起不稳定的测验分数。测题的用词模棱两可也会引起不稳定的分数。又如测验本身的长度也会影响信度,一般说来,测题愈多,测验愈可靠。
测验所包括的测题样本也会引起测量误差。测题取样所引起的误差在测验的单一形式中也可能出现。如果测验是要测量单一特性,那么,这个测验
上的每一个测题都应该测量它,而不应该测量其他的东西。但是实际上,有些测题能测量多种心理特性,因此,在一个测验中所包含的特定测题的抽选就变成了一个误差的可能来源。
2.测验的实施所引起的误差。由于测验的经验日益丰富,测验的实施更加标准化,实施条件1的变化所引起的误差可能性就大为减少。然而,由于
对实施指导语1的错误理解,对答案纸的错划,时间记录的错误以及一些不能预见的干扰等,都会产生误差。对一组被试实施测验不是同一个主试,而是由很多的主试实施,以及主试本身在安排测验上有较多的余地,这些也会引起误差。此外,记分也会产生验和其他自由反应的测题格式,记分就很难做到完全客观,从而产生误差。
3.被试所引起的误差。这是最难控制的误差。甚至当我们具有测验的等同形式,在标准化的实施和记分程序下,测验的情境以最理想的方式加以
安排,由于被试本身的不一致性也会使测验的分数不一致。具体表现为:动机的作用;学习、发展和教育的影响;对于测验的经验;测验的焦虑;生理因素等。如果某个人或某一些人和大多数的被试动机不相同,就会引起测量误差。如果引起的是系统误差,甚至会降低效度。有时,学习经验是引起测量误差的因素。任何时候只要引入一种新的格式或一种新的反应程序,就有可能造成理解上的错误,从而给测验分数带来误差。测验的焦虑程度与能力、抱负水平以及测验的经验有关。过度的焦虑对于活动有不良的影响或引起偶然性的活动,从而带来误差。当被试在生病或处于疲劳状态的时候进行测验,所得的结果会与正常情况不同。有些测验,被试可能由于疲劳引起暂时的注意分散,从而被试不能作出符合自己日常行为或情感的反应。
提高测验信度的方法。
1.适当增加测验题目的数量。,测验题目的数量越多,题目的代表性就越大。这种方法既可提高信度,也可提高效度。因此,—次测验的题目不
能太少。但题目太多也无法操作。所以,只能适当增加测验题目的数量。
2.测验的难度要适中.因为测验的难度适中:能使测验的信度达到最大,也能使测验刁的区分度达到最大,所以,必须使测验的难度适中。
3.测验的内容应尽量同质。如果测验的内容过于庞杂,必然要求考生具有不同的能力、知识或技能,致使测验的信度降低。例如,外语、数学测
验的信度常高于语文、历史测验的信度。因此,为了提高测验的信度,测验内容应尽量同质。
4.测验的程序应统一。测验的程序统一包括试卷统一、测验开始时的指导语、回答问题的方式、分发及收回试卷的办法、测验时间的掌握等。特
别应该提到的是;考试的组织问题、监考问题,这是关系到测验信度的重要因素。要严防舞弊现象的出现,特别是集体舞弊现象,更不能出现泄露考题等恶劣行径。
5.测验的时间要充分。如果安排的时间不够,不能从容回答所行有问题,也就不能真实地反应应试者的实际水平。因此,测验的时间要充分。当
然,这里不是说,要保证所有考生都能做完试题,而是以大多数考生为标准来制定考试的时间。
6.评分要尽量做到客观化、减少评分误差。信度系数实际是根据实得分数算出的,如果评分不准确,信度也就不准了。因此,要求评分要尽量做
到客观,减少评分误差。对于主观性测验,首先要明确有关的评分标准;其次,最好是多个专家同时评一份试卷,或者是单个评分者反复多次评一批试卷,对于几次结果误差较大的,要复评。
最后,应试者参加测验的动机水平、积极性、疲劳程度也会影响测验分数,从而影响信度。引起应试者参加测验的强烈动机,提高其积极性,使其
保持旺盛的精力,都对提高测验信度有一定作用。

效度
效度是指测量结果的准确性和有效性的程度,亦即测量是否达到了预期的目的。我们可以从以下几方面来理解效度。
首先,测量的效度始终是对一定的测量目的而言的。一般而言,任何测量都有某种特定的目的和功能,判断效度的高低,就是判断测验达到目的的
程度。如果能正确、真实地测量出所想测量的东西,那么,对这一目的效度是高的。
其次,测量的效度也是对测量的结果而言的。一种测量工具只有经过实际测量,才能根据出来的结果判断它的效度。所以,也可以把效度理解为测
量的结果正确反映所欲测量的特性或功能的程度。不言而喻,对于任何一种测量来说,只有当它的测量结果真实、正确地反映所欲测量的功能和特性时,才能认为这种测量是较为有效的或效度较高的。
第三,一种测量的效度只是高或低的问题。因为,一种测量在编制时,总是针对一定目的而编制的。
第四,在教育测量中,效度问题比在其他领域的测量更为重要。
由效度的计算公式可以看出,如果随机误差分数的方差和系统误差分数的方差之和越小,则效度越高。在效度和信度之间,首先要重点保证是高效
度,因为高效度必然高信度;反之,则不然。(未完待续,2014年9月3日)


 

 
发表评论:
Powered by Oblog.