平板電腦版注意力測驗的發展: 請教王文中老師之IRT相關問題

1. 基於"comparisons require stability"的理由，想請教王老師Rasch分析如何應用於量表前後測資料的驗證：
(1)目前有許多以Rasch驗證量表單向度之研究僅收一次資料即進行Rasch之驗證，此時所估計出的parameter(項目難度)是否就能代表這個量表的parameter？未來是否皆可使用此parameter估計個案之能力？

(2) 如果某一量表前後測item calibration的穩定度不佳(項目難度很不類似)，item fitting的狀況也不是很一致，請問該如何解釋/處理？

(3) 有學者主張：量表前後測item calibration的穩定度高(以ICC分析前後測項目難度的一致性高)，可將前後測分數合併作Rasch分析，找出項目難度的"generalized measure"。這個整合後的項目難度可用來代表量表實際應用時的項目難度，畢竟已通過不同時間點測量的考驗。請問這樣的作法是否合適？

2. 教育界推行「標準本位評量(standard-based assessment)」，即以等第制(A, B, C, D, E)描述學生的成績及訂立教學目標。而復健界現今也開始提出"staging"的概念，目的是使臨床工作者和個案容易了解評估分數所代表的意義。想請教王老師以下"staging"相關問題：
(1) 目前復健文獻較常用的"staging"方法為： bookmark method，即以Rasch/IRT的分析結果作為依據，再由專家或文獻回顧結果確定該建立幾個stage[有幾個切分點(cut-off points)]，再搭配項目難度決定切分點的分數。請問這樣做是否太過主觀？

(2) 經由文獻回顧找到其它二種"staging"的方法：
a. Rasch analysis+Guttman-type scales：先以Rasch分析找出適當的項目(符合Rasch model)，再從中挑出數個項目(自己決定)，以Guttman-type的方式建立這些項目的評分方式，如：以符合Rasch model的4個項目構成basic mobility scale，並建立5個stages。最難的項目是「維持站立姿勢」，可以完成是stage 5，不能完成是stage 4。次難的題目是「在坐姿下移位」，可以完成是stage 4，不能完成是stage 3...。

b. Rasch analysis+Custer analysis: 先由Rasch 分析找出適當的項目(符合Rasch model)，項目多少由自己決定的。之後以cluster analysis的方式分類個案的作答反應(如：決定了五個項目之後，其中一類個案的分數為01010)。Cluster analysis可將差不多能力的個案聚集在一起，且依能力高低形成不同的stages。

請問老師對於這二種staging作法是否認同？

(3)目前「標準本位評量」在教育界已蔚為一種風潮，請問老師認為復健界是否有必要追隨教育界的腳步，推行"staging"？

平板電腦版注意力測驗的發展

2015年1月8日星期四

請教王文中老師之IRT相關問題

沒有留言:

張貼留言

2015年1月8日 星期四

請教王文中老師之IRT相關問題

沒有留言:

張貼留言

2015年1月8日星期四