2015年1月8日 星期四

請教王文中老師之IRT相關問題

1. 基於"comparisons require stability"的理由,想請教王老師Rasch分析如何應用於量表前後測資料的驗證:
(1)目前有許多以Rasch驗證量表單向度之研究僅收一次資料即進行Rasch之驗證,此時所估計出的parameter(項目難度)是否就能代表這個量表的parameter?未來是否皆可使用此parameter估計個案之能力?

(2) 如果某一量表前後測item calibration的穩定度不佳(項目難度很不類似),item fitting的狀況也不是很一致,請問該如何解釋/處理?

(3) 有學者主張:量表前後測item calibration的穩定度高(以ICC分析前後測項目難度的一致性高),可將前後測分數合併作Rasch分析,找出項目難度的"generalized measure"。這個整合後的項目難度可用來代表量表實際應用時的項目難度,畢竟已通過不同時間點測量的考驗。請問這樣的作法是否合適?

2. 教育界推行「標準本位評量(standard-based assessment)」,即以等第制(A, B, C, D, E)描述學生的成績及訂立教學目標。 而復健界現今也開始提出"staging"的概念, 目的是使臨床工作者和個案容易了解評估分數所代表的意義。想請教王老師以下"staging"相關問題:
(1) 目前復健文獻較常用的"staging"方法為: bookmark method,即以Rasch/IRT的分析結果作為依據,再由專家或文獻回顧結果確定該建立幾個stage[有幾個切分點(cut-off points)], 再搭配項目難度決定切分點的分數。請問這樣做是否太過主觀?

(2) 經由文獻回顧找到其它二種"staging"的方法:
a. Rasch analysis+Guttman-type scales:先 以Rasch分析找出適當的項目(符合Rasch model),再從中挑出數個項目(自己決定),以Guttman-type的方式建立這些項目的評分方式,如:以符合Rasch model的4個項目構成basic mobility scale,並建立5個stages。最難的項目是「維持站立姿勢」,可以完成是stage 5,不能完成是stage 4。次難的題目是「在坐姿下移位」,可以完成是stage 4,不能完成是stage 3...。

b. Rasch analysis+Custer analysis: 先由Rasch 分析找出適當的項目(符合Rasch model),項目多少由自己決定的。之後以cluster analysis的方式分類個案的作答反應(如:決定了五個項目之後,其中一類個案的分數為01010)。Cluster analysis可將差不多能力的個案聚集在一起,且依能力高低形成不同的stages。

請問老師對於這二種staging作法是否認同? 

(3)目前「標準本位評量」在教育界已蔚為一種風潮,請問老師認為復健界是否有必要追隨教育界的腳步,推行"staging"?                                                                                                                                                                                                                                                             

沒有留言:

張貼留言