2022-05-24 | 文章來源:
相關(guān)建議:
全國特崗教師考試基礎(chǔ)知識概述
信度、效度、難度和區(qū)分度是衡量教學(xué)測試質(zhì)量最常用的四個指標(biāo),一般以客觀題的形式考查。具體來說,試題類型主要是定義和單項(xiàng)選擇題,并考察了四個測試質(zhì)量指標(biāo)之間的關(guān)系。對于很多考生來說,如何準(zhǔn)確區(qū)分這四個指標(biāo)是一個難點(diǎn),往往學(xué)完就忘,做題就錯。這里將通過比較和舉例,深入淺出地說明信度、效度、難度和區(qū)分度。相信通過這次學(xué)習(xí),這個考點(diǎn)將不再是一個難點(diǎn)。
1.可靠性
是指測試結(jié)果的一致性或穩(wěn)定性,即某項(xiàng)測試進(jìn)行多次后得到的結(jié)果的一致性。就像一張?jiān)嚲碓诙虝r間內(nèi)測試幾次,學(xué)生的成績保持在一個相對穩(wěn)定的范圍內(nèi),可以說這張?jiān)嚲淼目煽啃允歉叩摹P哦炔粌H包括測試結(jié)果在時間上的一致性,還包括不同評分者之間的一致性。就像一個考生的作文,幾個考官給的分?jǐn)?shù)相差不大,可以說這個作文考試的信度是不錯的。
2.有效期
指一個測試的正確性或準(zhǔn)確性,即一個測試能夠真實(shí)地衡量被測對象的程度。如果老師想檢查學(xué)生的數(shù)學(xué)能力,卻拿語文試卷來考,就很難測出學(xué)生真實(shí)的數(shù)學(xué)水平,也就是說,考試的效度較低。就測試質(zhì)量而言,效度是比信度更重要的指標(biāo)。
有效性與可靠性
論效度與信度的關(guān)系,也是共同測驗(yàn)中的一個難點(diǎn):信度高,效度不一定高;高效度和信度。下面通過一個生活實(shí)例來幫助考生理解。
小明用碎砝碼量了量體重。很多測量的結(jié)果都是20kg,但小明的實(shí)際體重應(yīng)該是60kg。測量結(jié)果高度一致,表明本試驗(yàn)的可靠性較高。但是這個量表并沒有準(zhǔn)確測出小明的真實(shí)體重,說明這個測試的效度較低。綜上所述,當(dāng)一個測驗(yàn)的信度高的時候,它的效度不一定高。
如果小明用正常的體重秤,多次測量的結(jié)果是60斤,這是小明的真實(shí)體重。本次測試準(zhǔn)確測出了小明的體重,結(jié)果一致,也就是說具有較高的效度和信度。在一定的時間內(nèi),真實(shí)的結(jié)果一般是相對穩(wěn)定的,所以只要真實(shí)的結(jié)果是可以測量的,多次測試的結(jié)果就會保持一個較高的一致性,即高效度和高信度。
3.困難
指的是考試的難度。對于參加考試的學(xué)生來說,難度是主觀的,同樣一張?jiān)嚲淼碾y度往往會因?yàn)榭忌哪芰Σ煌胁煌母惺?。為了更客觀地衡量考試的難度,提出了一個衡量難度值的公式,即難度值P=正確答案數(shù)(R)/被試總數(shù)(N)次;100%。當(dāng)P=50%時,一半人答對了,而當(dāng)P=100%時,所有人都答對了。即p值越大,難度越低,難度值與難度成反比。一般來說,測試的難度值為0.5,比較理想。
4.歧視
測試是指區(qū)分不同水平考生的能力。當(dāng)一次考試分化程度很高時,高水平考生得分高,中等水平考生得分中等,低水平考生得分低。高考是一個需要高度辨別力的考試。以考試成績區(qū)分考生,讓不同水平的考生進(jìn)入不同層次的學(xué)校。
Vs難度辨別
和區(qū)分難易程度也是一對相互關(guān)聯(lián)的指標(biāo)。一般來說,難度適中時,區(qū)分度較大。如果一張?jiān)嚲砣请y題,大部分人的分?jǐn)?shù)都集中在較低的區(qū)間。同樣,當(dāng)試卷全是簡單題時,大部分人的分?jǐn)?shù)會集中在較高的區(qū)間。這兩種情況都很難區(qū)分考生的水平。所以難度適中的時候,區(qū)分度就大。
只展示一小部分才能
下面我們試著一起做兩個例子,測試對身心發(fā)展規(guī)律的掌握程度。
1.【單項(xiàng)選擇】數(shù)學(xué)老師王老師想了解一下最近學(xué)生的數(shù)學(xué)學(xué)習(xí)情況,但是他錯把它當(dāng)成了英語試卷,這樣會導(dǎo)致這次考試的()降低。
A.難度b .效度c .信度d .區(qū)分度
【答案】b .解析:本題考察測試質(zhì)量指標(biāo)的信度、效度、難度和區(qū)分度。數(shù)學(xué)老師王老師想了解學(xué)生的數(shù)學(xué)學(xué)習(xí)情況,卻用英語試卷考試。這種測試的結(jié)果不能正確反映學(xué)生的數(shù)學(xué)水平,也就是測不到它想測的東西,也就是效度不高。所以,這個問題是b。
2.【是非題】信度高的測驗(yàn)效度也一定高。( )
【答案】 times。解析:本題考察考試質(zhì)量指標(biāo)的信度、效度、難度和區(qū)分度。一個測驗(yàn)的信度高,效度不一定高;當(dāng)一個測驗(yàn)的效度很高時,信度也一定很高。所以說這個題目是stem是不對的。