測驗考試總結范文

時間:2023-03-20 06:34:30

導語:如何才能寫好一篇測驗考試總結,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。

測驗考試總結

篇1

國家公務員考試《行政職業能力測驗》是對未來從事行政工作的國家機關工作人員是否具備行政工作能力的一種可能性的測查與驗證。與單純以基礎知識和智力為主要考查對象的一般測驗不同,行政職業能力測驗考查的是人的基本資質與潛在能力,具體表現在考查考生是否具備快速、敏捷、準確地分析、解決問題的能力。

在國家公務員招錄考試發展的十余年里,《行政職業能力測驗》考試命題規律可概括為以下三點。

1、多樣性、廣泛性

國家公務員考試《行政職業能力測驗》包括言語理解與表達、數量關系、判斷推理、資料分析、常識判斷五種類型的題目。通俗地講,這種測驗在形式上涵蓋了對漢語基礎、邏輯、文史、社科、數學、時政、法律等各方面的綜合測試。這種廣范圍的題型及考點設計,正體現了公務員考試公正、公平的精神——不偏向于任何一門專業,保證“人人可參與,人人可發揮”,也保證日后從事公職的人員不是“偏才怪才”,而是各種能力均具備、各種崗位均可適應的全才。

2、基礎性、思維性

歷年國家公務員考試大綱的“測試內容”部分規定:行政職業能力測驗主要測查與公務員職業密切相關的、適合通過客觀化紙筆測驗方式進行考查的基本素質和能力。從歷年國家公務員考試與地方真題也可以看出,《行政職業能力測驗》90%以上的題目均為基礎性題目。這種基礎性既是針對某一專門學科而言,也是針對從事公務員工作所應知應會的基本素養而言。然而,基礎并非意味著簡單,這種基礎性是與思維性緊密結合的,考核的是“活生生”的知識,需要考生有“活”的思維來與之對應。

篇2

第一個方面是題型。

從備考的角度來看題型,那題型的量是更大的。考試前考生所要準備的,就是想方設法的擴大自己的題型庫,最簡單的方法就是做真題。現在從中央到地方,公布的真題大概有90套,考生能做40多套真題就已經足夠了,每一套真題和真題之間的題型差距也是比較大的,做了40多套對應付這次考試問題肯定是不大的。

第二個方面是題型后面的快速解法。

行政職業能力測驗的考試是一個時間的賽跑。每個題型所采用的方法的解答速度是不一樣的,所以考生在掌握題型的同時還要想方設法的找到這個題型最快捷的解答方法。

第三個方面是心態的調整。

第一階段是用十天左右的時間做題,這個時候做題,強調一個原則就是慢慢的做,不要太快,這時候做題很明確,目的在于分析和總結題型。這是一個新題型,它的特點是什么,又出現一個新題型,它的特點又是什么,一定要這樣的總結,十天的時間通過做真題的形式把你的題型庫擴大。

篇3

很多人認為,國家公務員考試,特別是《行政職業能力測驗》和《申論》兩門科目不需要做復習和準備工作,完全靠的是自身的能力和素質,其實提前準備一下還是大有益處的。相當一部分考生在走出公務員考試的考場后,都發出同樣的感慨:只要認真準備,國家公務員考試其實并不難。

公務員考試命題研究專家張奉均認為,考生應著重從以下幾個方面進行復習:

第一,考生要與時俱進,按照年度考試大綱的要求進行準備。他說,每年的考試大綱都對考生有不同的要求,這需要考生仔細地閱讀。如,從2005年的考試大綱看,《行政職業能力測驗》比以往主要有以下變化:一是原A、B類的職位劃分改為甲、乙類職位劃分,這也預示著2005年公共科目考試會有一定的變化;二是考題順序的調整,將言語理解與表達調整到第一部分,這給考生的答題時間的安排設置了一個考驗;三是恢復對數字推理題型的考查,這體現了對考生數理能力考查的重要性;四是恢復對事件排序題型的考查;五是常識判斷部分側重考察法律知識的運用,因此對基本法律常識的了解應成為考生備考的重點;六是取消了聽力理解。

第二,考前練習很重要。對大多數考生來說,公務員考試都是第一次,都還不是很熟悉,只有多做練習才能對考試的題型、考查點有一個全面的了解,在考試時才能作到心中有數。

第三,注重平時積累和方法總結。《行政職業能力測驗》的考題覆蓋面頗廣,包括法律、政治、經濟、人文、社會、科技和管理等方面的內容,臨時突擊做練習雖有幫助但更重要的是平時的積累。在數字推理和判斷推理部分主要考查考生的解題技巧,而不是考查考生的知識深度。

不管是報考哪一類職位的考生,關鍵是要熟悉《行政職業能力測驗》和《申論》的考試方法。

他提醒考生,不同的題型要用不同的方法和思路去解答,比如《行政職業能力測驗》中的判斷、推理等題目,主要靠平時的積累,不管是知識的積累,還是實踐的積累,都很重要。例如,推理題經常給出一系列日常行為事件,要求考生按行為發生的先后順序排序,這就需要考生有實踐的積累。

而數量關系和資料分析類的題目更需要技巧,這些技巧是和一個人的思維方式、價值觀相連的,所以,要通過考試,更需要方法和積累。“高分低能的考生肯定是無法通過這樣的考試的”,張奉均強調。

篇4

一、論證推理

論證推理題是指在論證分析的過程中需要補充某些部分,以加強或者削弱給定的結論。對于此種題型,根據論證角度的不同,其題型可以分為前提假設型、支持加強型、削弱質疑型和原因解釋型。

其中需要重點掌握的是削弱質疑型和支持加強型。對于這兩類題,首先要找到它的論點,明確需要削弱或者支持的論點是什么,然后找到論證過程,結合選項進行作答。

例1、市長任職的三年里經常被控對女性有性別歧視的態度。然而,他已經在他的管理層的19個高層職位中任用了5名婦女,她們中的所有人都仍在服務,這表明市長并不是一名性別歧視者。

以下哪項為真,最能反駁上面得出的結論?[2014年山西公務員考試行政職業能力測驗真題-83]

A.市長任命的一名高層職位的女性正準備辭職

B.市長所在的政黨的政綱要求他在高層職位里至少任命5名女性

C.三年前在市長選舉中,47%的女性投票支持這位市長

D.相鄰市的市長最近在高層職位任命了7名女性

解析:本題屬于削弱質疑型,削弱方式為他因削弱。要削弱的論點是“市長不是一名性別歧視者”,如果B項為真,則表明市長任用了5名婦女可能是其他原因,即任用5名婦女不能作為市長不歧視女性的證據,因而反駁了題干的結論。其他三項均不能反駁“市長不是一名性別歧視者”。所以選擇B選項。

例2、某鎮組織部姚科長在接受當地記者的采訪時說:“近年來剛進入機關的干部對下基層鍛煉的興趣普遍比以前強多了。我鎮的機關干部對于下基層的報名十分踴躍。這在幾年前幾乎是不可思議的。”

姚科長的結論基于以下哪項假設?[2014年山西公務員考試行政職業能力測驗真題-85]

A.機關干部下基層鍛煉,對當地的發展也起到推動的作用

B.對待下基層的態度是衡量是否有下基層興趣的重要標準

C.近年來進入該鎮的干部較前幾年的比起來有較高的綜合素質

D.該鎮機關干部對下基層鍛煉產生興趣,是由于基層待遇提高

解析:本題屬于前提假設型。B選項是必須假設的,否則下基層的態度和興趣沒有關系,那就不能通過報名踴躍得出興趣強的結論。所以B選項是必須假設的,所以選擇B選項。

提示:在這種題型中,要迅速找到題干的論據和結論,然后在選項中找到能把論據和結論聯系起來的選項,就是正確選項。

二、日常推理

日常推理題是在題干中列舉大量事實論據或理論論據,然后考查考生從中可以得出或無法得出某個結論。對于此類題型,首先要抓住題干的主體,因為偷換概念是我們日常生活中常犯的錯誤,也是題目設置的主要考點,在解題時要注意收斂思維,選擇與主體一致的答案。

例3、近期的食物監測表明:炸薯片中含有大量的鋁,長期食用會引起神經系統病變,表現為記憶力減退,視覺與運動系統協調失靈。

由此可以推出:[2014年山西公務員考試行政職業能力測驗真題-76]

A.少吃薯片可以防止神經系統病變

B.鋁在人體中的積累可導致神經系統病變

C.記憶力減退說明神經系統發生病變

D.視覺與運動系統協調失靈說明神經系統發生病變

解析:本題屬于隱性結論型。題干指出長期食用炸薯片會引起神經系統病變,前者是后者的充分條件。充分條件的假言推理否定前件(不食用薯片)不能否定后件(不病變),所以A項不能推出;炸薯片中含有大量的鋁,如果長期食用炸薯片,那么鋁就會在人體中積累起來,就會引起神經系統病變,所以B項可以推出;神經系統病變的表現有記憶力減退,視覺與運動系統協調失靈,前者是后者的充分條件,充分條件的假言推理肯定后件(記憶力減退,視覺與運動系統協調失靈)不能肯定前件(神經系統病變),故C項和D項均不能推出。所以選擇B選項。

提示:在這種題型中,要抓住題干的主體,如此題中的“鋁”,題干的主體和正確選項的主體通常是一致的,選項中常見的錯誤有偷換主體、夸大事實、以偏概全等,可以通過觀察選項的特征來排除錯誤選項,選擇正確答案。

三、形式邏輯

形式邏輯是運用邏輯規則進行的必然性推理,因此要求考生掌握必要的邏輯學基礎知識。山西省公務員考試行政職業能力測驗中常考的形式邏輯類題型為分析推理,此類題通常給出若干人或事物,要求利用互相間的關系,對其進行組合,實現一一對應。

有的考生對于此種題型的大量信息往往感到無從下手,為此總結了解決此類題型的有效方法。

第一步:對描述共同信息最多的條件進行分析,得到推理起點(最大信息優先);

第二步:尋找與已知結論相關的條件,繼續推理;

第三步:難以得到肯定結論時,運用假設法,找到邏輯矛盾,進而得到肯定結論。

第四步:重復第二步。

下面結合真題來說明此種方法的運用。

例4、在一次考試中,試卷上畫了五大洲的圖形,每個圖形都編了號,要求填出其中任意兩個洲名,分別有五名學生填了如下編號。

甲:3是歐洲,2是美洲

乙:4是亞洲,2是大洋洲

丙:1是亞洲,5是非洲

丁:4是非洲,3是大洋洲

戊:2是歐洲,5是美洲

結果他們每人只填對一半,請根據以上條件判斷下列正確的選項是()[2014年山西公務員考試行政職業能力測驗真題-76]

A.1是亞洲,2是歐洲

B.2是大洋洲,3是非洲

C.3是歐洲,4是非洲

D.4是美洲,5是非洲

篇5

    1 研究情況

   

    1.1研究對象重慶醫科大學已進入臨床專業課程學習階段的臨 床醫學本科學生。以自然班為對象隨機設立實驗組與 對照組,實驗組179人,對照組169人。

1.2研究方法在兩組學生的兒科學教學中實施不同的評價方 式,在授課教師、教學內容、教學方法、學時數、使用教 材等方面完全一致。實驗組采用“形成性評價為導向 的綜合評價”方法,對照組采用以期末考試為主的總結 性評價方法。將兩組學生的學習效果進行比較,并對 兩種評價方式的相關性、差異性進行統計分析。在課159程結束后,采用自制問卷對實驗組學生的學習狀態進 行調查并運用SPSS 20. 0軟件進行統計分析。

1.3評價方案本研究在充分征求授課教研室教師意見的基礎上 制定評價方案(見表1)。實驗組的評價內容由課堂紀 律、床旁示教討論、學習記錄檔案袋(網絡輔助)、期中 測驗、期末考試5部分組成。其中,課堂紀律、床旁示 教討論環節由評價者借助日常教學日志的客觀記錄完 成評價;學習記錄檔案袋(網絡輔助)、期中測驗、期末 考試環節設置了一致的評價標準,評價者依據標準即 可給予學生評價。學習記錄檔案袋的評價在重慶醫科 大學網絡教學平臺的輔助下進行,學習記錄檔案袋中 以案例分析、網絡學習、師生互動討論為基礎,包含課 后作業、學習與教學互動情況,為評價結果提供客觀可 信的依據。對照組采用傳統的期末考試總結性評價方 式,結果由考試成績數值構成。為了比較兩組學生的 客觀學習效果,對照組也參與了期中理論測驗,但測驗 結果不計入綜合性評價。為避免因評價者主觀因素導致評價客觀性、公平 性降低,評價內容盡可能采取能夠量化的方式,并輔以 過程記錄為客觀依據。同時,為了保證大樣本評價的 可操作性,兒科專業研究生擔任課程教學助教,由兒科 學課程組組織和培訓參與教學工作。評價者由課程教 師和助教共同構成,共計32名。評價者承諾嚴格按照 指標客觀、公正給予評價。同時,在課程教學過程中, 專業助教負責記錄教學日志及學生課堂紀律、課堂表 現,日志內容作為教學組教師評價的客觀依據之一,補 充和完善教師評價。

2學習效果分析

    課程考試是檢驗學習效果、評價教學質量、衡量教 學目標是否實現的重要手段。因此,以兩組學生的兒 科學期中、期末課程考試成績比較作為兩組學生學習 效果差異的評價指標。兩組兒科學課程期中、期末考 試采取同一時間、同一試卷考試,內容、題量、難度一 致。兩次的試卷命題均包括單選題、填空題、判斷題、 問答題、病例分析題五大題型,主要從基本知識點、初 步臨床思維、綜合分析問題等方面對學生的學習效果 進行考核。根據表2數據顯示,實驗組學生期中測驗、期末考 試以及總評成績的數據分布離散程度小,較對照組更 為集中和穩定。兩組學生期中測驗的客觀成績差異無 統計學意義(P = 0. 898>0. 05);兩組學生的期末考試 成績、總評成績均存在顯著差異,且差異均有統計學意 義(P<0. 01)。同時,實驗組學生對基本理論知識的 掌握較期中測驗時顯得更為牢固(期中65. 0±9. 6,期 末7 6. 8±8. 8 ),整體水平有提升;對照組的提升效果 明顯低于實驗組(期中64. 7 士 10. 5,期末72. 8 士11.2)。

在考試成績分布上(見表3)70 — 90分段中,實驗 組149人(占實驗組總數的83. 24%),對照組110人 (占對照組總數的65. 09%)不及格人數中,實驗組2 人(占實驗組總數的1. 12%),對照組為22人(對照組 總數的13. 01%)。根據學習記錄檔案袋以及課程教 學日志顯示,實驗組不及格的兩名學生除了期末理論 考試成績外,其余項目的評價結果均為“差”,評價的客 觀結果均在60分以下。

對兩組學生共同使用的期中、期末理論試卷進行 信度分析,克朗巴赫系數(Cronbach' Alpha)分別為 0.6654和0.8476,試卷信度可靠。從表2的數據結果 來看,實驗組學生體現出的知識水平和綜合能力水平 優于對照組,總體學習效果優于對照組。

2.2 實驗組綜合評價方式與學習效果的相關性分析教學評價的方式多種多樣。

   為了檢驗評價方式的 合理性和有效性,學生整體學習質量、學習效果的優良 成為了重要的衡量指標。因此,本研究將實驗組綜合 評價結果同學生學習效果進行相關性分析,檢驗“形成 性評價為導向的綜合評價模式”在兒科學課程教學中 是否合理、有效。分析數據見表4。根據統計學對相關系數的界定,1為正相關,一1 為負相關,0為不相關,當相關系數大于0. 8時,可以 認為兩個變量之間有很強的相關性。從表4的數據分 析來看,實驗組綜合性評價的總評成績均與期中、期末 成績呈顯著正相關,與期末成績的相關程度明顯高于 期中成績。可見,以形成性評價為主的綜合評價方式 長期、穩定實施,有助于學生學習效果的提高。

3實驗組學習狀態與感受調查

    兒科學課程教學結束后,就實驗組學習狀態與感 受進行調查,主要包括“學習壓力、學習負擔的學習狀 態與提高學習興趣、臨床思維能力、邏輯思維能力、溝 通交流能力、團隊協作能力的個人感受”個方面。發 放調查問卷179份,回收問卷174份,有效問卷174 份,有效回收率為97.21%。回收的問卷用Excel建立 數據庫,并運用SPSS 20. 0軟件進行信度系數檢驗,得 出問卷信度為0.816,大于0. 8,可以推斷此問卷的內 部一致性較高,可信度較好。詳細數據見表5。

根據數據顯示,實驗組大部分學生學習興趣很高, 通過兒科學課程的學習,建立了初步的臨床思維,提高 了自身的邏輯思維、溝通交流、團隊協作、主動學習等 四方面能力,在學習過程中并未感受到太大的學習壓 力和學習負擔。

4結論及思考

    4.1長期、穩定的以形成性評價為導向的綜合評 價模式能有效提高學習的學習積極性與主動性實驗組的評價方案涵蓋了整個兒科學的教學過 程。根據表4、的數據分析結果可以看出,在課程教 學結束時,綜合性評價對實驗組學生學習效果的影響 明顯高于期中時的影響。并且,與對照組相比,實驗組 的學習效果更好,兩者有明顯的效果差異。從表2、3、 5的數據對比分析結果來看,實驗組學生在以形成性 評價為導向的綜合評價模式引導下,以往學習中存在 的功利主義思想得到扭轉。大部分學生在學習過程中 更多地著眼于對基本知識的吸收、掌握,對自身思維方 式、綜合能力的訓練和提高。調查結果顯示,在綜合評 價模式的引導下,實驗組學生能夠更積極、愉快地投入 到兒科學學習中,表現出很強的學習興趣。

4.2 以網絡平臺為基礎的學習記錄檔案袋,有助 于師生互動反饋,顯著提升教學效果網絡平臺的運用,彌補了課堂教學時間有限、空間 不足的問題,為學生進一步鞏固及深入了解兒科學知 識、訓練兒科臨床思維,為師生間的有效溝通提供了更 廣闊的平臺。網絡平臺能將學生每次的訪問內容、案例 分析、學習互動以及教師評價的情況如實記錄,形成觀、動態的學習記錄檔案袋。教與學雙方都能從網絡平 臺中導出學生個人學習狀態及對應的評價信息,并能夠 借助這些信息,在教學過程中不斷總結與反思,指導或 修正后續階段的教學行為,使教學效果得到提升。

4.3 完善綜合性評價方案,提高評價效力 在實驗組的綜合性評價方案中,總結性評價以期 末考試的方式展開,而形成性評價則包括了多項內容: 學習紀律、學習態度、學習效果、綜合能力,等等。多種 因素的評價結果是否客觀、公正,直接影響最終的評價 效力。雖然本次研究盡可能擴大了評價者的數量,評 價者達到32名,即一個評價者關注5 — 6名學生即可。 但根據評價者反饋,在對學生學習表現進行評價時,床 旁示教討論等以鼓勵、引導為主要方式的環節,評價的 操作性和公平性仍難達到最佳狀態。究其原因是在具 體操作中,評價者往往會被個別表現突出的學生所吸 引,而忽略了對其余學生的關注和引導。因此在這些 環節中,評價者會由于主觀原因而使得評價結果的公 平性和客觀性降低,這也直接導致在進行綜合評價時, 評價的效力減弱。所以,評價方案應進一步細化,提高 可操作性,盡可能降低人為因素對評價結果的影響,提 高評價結果的說服力。

篇6

高等學校博士學科點專項科研基金聯合資助課題(20103604110002),國家自然科學基金(31100756),江西省高校人文社會科學研究青年基金(XL1003)。

通訊作者:戴海琦,E-mail:。

摘 要:群體不變性是等值的一個重要假設,即對不同的考生子群體等值函數一致。本研究對不同平行測驗定義下線性等值的群體不變性進行了理論分析和模擬研究,模擬研究REMSD指標通過六種不同加權方式計算。結果顯示,嚴格平行測驗在信度較低時REMSD指標更大;子群體均值差異和信度差異對REMSD的影響存在明顯的交互作用;REMSD指標在期望權重等權下的最大,在分數權重采用子群體比例加權最小。最后對結果進行了討論,對REMSD權重使用及進一步研究給出了建議。

關鍵詞:等值;群體不變性;平行測驗;同質測驗

中圖分類號:B841.2

文獻標識碼:A 文章編號:1003-5184(2012)01-0067-05

1 引言

等值(Equating)是實現平行測驗分數相互比較的重要技術。有些情況下,研究者也需要建立并非嚴格平行測驗的分數對應關系,如一些大型考試的內容進行了更新,此時新舊考試并非平行測驗,但不論從實踐還是從研究角度都有必要報告新舊考試的分數對應關系,此時稱之為鏈接(Linking)(Kolen,2004)。鏈接是實現不同測驗分數比較的一般形式,當鏈接的兩個測驗滿足了相同構念、等信度、對稱性、公平性、群體不變性等五個條件,即為等值(Dorans & Holland,2000)。即,等值是要求更為嚴格的鏈接。

近年來,研究者對錨測驗代表性、不同等值方法的穩健性進行了大量研究,花費了大量時間和精力收集測驗數據以進行等值,但很少有實踐者關注等值過程是否真正實現了測驗分數可比。Flanagan指出測驗的本質是抽樣,不同測驗在內容上的差異(包括平行測驗)使等值或鏈接對不同群體的敏感性存在差異(Kolen,2004)。所以必須考慮等值函數是否對所有被試唯一確定,若測驗間的分數對應關系不因被試所在群體而變化,則稱等值的群體不變性(Population Invariance,PI)成立。群體不變性是等值最重要的假設之一,在評估考試分數的公平性時起著重要的作用,在其不成立時使用統一的等值函數對被試而言是不公平的。

第32卷第1期

劉鐵川等 不同定義平行測驗等值的群體不變性

心理學探新2012年

近年來,在Dorans和Holland(2000)提出了群體不變性的量化評價指標之后,關于等值或鏈接群體不變性問題的研究才開始大量出現,對一些大型規模考試項目如美國大學預修課程考試(AP;Dorans,2004;Yang,2004;Von Davier & Wilson,2008)、學術性向測驗(SAT;Yi,Harris,& Gao,2008)、法學院入學考試(LSAT;Liu & Holland,2008)、大學代數考試(CLEP;Yang & Gao,2008)的等值或鏈接的群體不變性進行了研究。他們所提出的指標稱為均方根差異(Root Mean Square Difference,RMSD),比較在不同子群體和整個被試群體上計算出的等值函數的差異,公式如下:

RMSD(x)=∑jwj[ePj(x)-eP(x)]2σYP(1)

公式1適用于單組或等組設計下的觀察分數等值,也就是說被試群體P中的所有被試來自同一總體;其中,x表示測驗形式X的某個分數;eP(x)表示由全部被試數據估計出由X到Y的等值轉換關系;ePj(x)表示由子群體j的數據所估計出的等值轉換關系;分母σYP是全部被試數據估計出的Y測驗的標準差;wj表示對子群體Pj與全部被試P等值關系差異的權重。wj有兩種計算方法,其一是以子群體被試比例作為權重,公式為Nj/N,其中Nj為第j組被試數量,N為所有被試數量,此時應保證樣本數據中的被試比例結構能夠代表測驗的真實使用情境;其二是進行等量加權。

RMSD(x)是對個別測驗分數水平上評價等值的群體不變性,可以對等值差異求期望、再加權、開平方以得到總結性的指標,用來對整個測驗等值關系的群體不變性進行整體評價,稱為期望均方根差異(Root Expected Mean Square Difference,REMSD)。具體公式如下:

REMSD=∑jwj∑max (x)x=min (x)vxj[ePj(x)-eP(x)]2σYP(2)

上式中,wj可稱為期望權重,獲取方法同前;vxj為題目分數權重。vxj有三種計算方法,其一為子群體比例加權,公式為Nxj/Nj,其中Nxj為第j組中測驗分數水平x被試數量;其二為總體比例加權,公式為Nx/N,其中Nx為全部被試中測驗分數水平x被試數量;其三為等量加權,公式為1/max (x)-min (x)+1,Kolen和Brennan(2004)稱之為等權REMSD(ewREMSD)。分數權重的選擇取決于研究者的經驗,若研究對各個分數水平的等值準確性同樣重要,則宜用等權;若樣本數據能夠代表實際應用情境,則根據樣本數據的分數比例進行加權,Dorans和Holland(2000)傾向于使用總體比例加權,而Kolen和Brennan(2004)傾向于使用子群體比例加權。

錨測驗不等組設計(Non-Equivalent Anchor Test,NEAT)是很常見的等值數據搜集方法,但公式1、公式2只適用于單組或等設計下的觀察分數等值。為探索更復雜設計下的等值群體不變性,Von Davier,Holland和Thayer(2004)將RMSD(x)和REMSD推廣至NEAT設計下的等值群體不變性評價,但關注的仍是觀察分數等值。Von Davier和Wilson(2008)又將此指標應用于NEAT設計下項目反應理論下的真分數等值的群體不變性研究。

NEAT設計中,參加兩個測驗X、Y的被試分別來自總體P和Q,根據人口統計變量將P和Q分成多個子群體,對其中第j子群體加權合成后可以得到合成組子群體Tj(公式3)。對于RMSD(x)和REMSD公式中合成組子群體的權重,一種方法是設子群體權重相等;另一種方法是,根據P和Q子群體j的權重來加權計算,公式如下:

Tj=w(Pj)+(1-w)Qj,wj=w(wPj)+(1-w)wQj(3)

上式中,wPj和wQj為子群體j在P和Q中的權重;w為P的權重,可以根據P的比例來計算。NEAT設計下計算群體不變性指標還需要合成組在Y測驗上的標準差,由于只有Q群體的被試參加了測驗Y,所以無法直接得到合成組標準差,需要使用Tucker方法、或鏈線性等值方法計算(Von Davier et al.,2004)。

雖然群體不變性假設對等值質量至關重要,但關于REMSD指標加權方式及其影響因素的研究不多。本文將對不同平行測驗定義下線性等值函數差異進行理論分析,并在模擬條件下計算不同加權方式的REMSD指標,對影響線性等值群體不變性的因素以及加權方式對REMSD指標的影響進行探索。

2 不同定義平行測驗等值的群體不變性

測量學中對平行測驗有多種定義,如嚴格平行(Strictly Parallel)、Tau等價(Tau Equivalent)、基本Tau等價(Essentially Tau Equivalent)、同質(Congeneric)等。Brennan(2008)對平行線性等值下的REMSD公式進行了研究,他認為若兩測驗嚴格平行或滿足Tau等價的條件,并且各組被試在兩測驗上的分數分布都相同,此時無論信度水平如何,REMSD均為0,等值的群體不變性都成立,事實上此時沒有必要進行等值;若兩測驗滿足基本Tau等價,被試的測驗真分數相差一個常數,誤差方差不一致導致兩測驗信度不同,但一般情況下比較接近,此時群體不變性基本成立;若兩測驗同質,被試在兩測驗上的真分數存在線性關系,真分數方差與誤差方差都不一致,兩測驗所測構念相同,但信度水平相差越大,REMSD也越大,群體不變性通常不成立。

下面通過真分數等值函數對同質測驗的群體不變性進行分析。在同質條件下,測驗X與測驗Y所測構念相同,被試在兩測驗上的真分數存在如下線性關系(Holland & Dorans,2006):

TY=α?TX+β (4)

α=σY/σX?ρYT/ρXT,β=μY-α?μX(5)

公式(4)中,TX和TY為兩測驗上的真分數;公式(5)中,σX和σY為兩測驗觀察分數標準差,ρXT和ρYT為信度系數的平方根,μX和μY為兩測驗觀察分數平均值。上式與觀察分數的線性等值函數相似,但斜率系數增加了信度比值的平方根作為乘數。用a和b來表示測驗X和測驗Y觀察分數等值函數的斜率和截矩,可以得到下式:

a=α?ρXT/ρYT=

(α2?σ2XT+E2Y)/(σ2XT+E2X),b=μY-a?μX(6)

公式(6)中,σ2XT和σ2YT為兩測驗真分數方差,E2XT和E2YT為兩測驗的誤差方差。REMSD指標會受到子群體間等值系數差異的影響,若兩測驗滿足同質條件,不論被試屬于哪個子群體,公式(4)對所有被試成立(Brennan,2008)。此時,公式(6)中的斜率系數a對子群體相同,對于截矩系數,由公式(4)和(6)可得b=β+α?1-ρXT/ρYT?μX,可以看出滿足同質條件的測驗,若子群體分布均值不同,則觀察分數等值的截矩系數b也不同。

通過上式可以對其他三種平行測驗定義下的子群體等值系數差異進行分析。滿足嚴格平行條件的測驗,兩測驗信度相同,所以觀察分數等值的斜率系數a為1,截矩系數b為0,各子群體相同。滿足Tau等價的測驗,兩測驗信度不同,斜率系數a不為1,但各子群體相同;截矩系數b=1-ρXT/ρYT?μX,由于兩測驗信度不同,所以系數b不為0。滿足基本Tau等價的測驗,兩測驗的真分數方差與誤差方差均不相同,兩測驗信度不同,斜率系數a不為1,但各子群體相同;截矩系數b=β+1-ρXT/ρYT?μX。可以看出,對于Tau等價和基本Tau等價測驗,子群體觀察分數等值截矩系數的差異大小取決于他們在測驗X上的分數均值。

兩測驗信度水平差異也影響截矩系數的差異,Dorans和Holland(2000)認為實踐中兩個測驗信度不會完全相同,如鏈等百分位等值方法中,錨測驗中由于題目數量少,其信度要低于全長測驗,仍然可以獲得理想的等值結果。所以,他們認為信度是等值過程中需要考慮的次要因素。Liu和Holland(2008)對LSAT考試的研究發現,若兩平行測驗的信度相似,則等值過程通常具備群體不變性,他們認為只要測驗的穩定性達到一定水準,信度對平行測驗等值的群體不變性影響不大。Dorans和Holland(2000)給出了單組設計下平行線性等值下的群體不變性指標的上限公式,在這個公式中兩測驗的信度越高,則REMSD的上限值越小。需要注意的是,信度高只是使可能的上限更小,并不一定使REMSD的實際取值更小。

3 不同平行測驗定義下的模擬實驗

如前所述,在REMSD指標的計算中有兩次加權,期望權重wj可采用等權(ew)和比例加權(pw),分數權重vxj可采用等權(ev)、總體比例加權(pv)和子群體比例加權(gv)。所以REMSD可有六種組合加權方式,分別表示為ew.ev、ew.pv、ew.gv、pw.ev、pw.pv、pw.gv。本研究自編程序模擬不同平行測驗定義下的數據,通過計算上述六種不同加權方式的REMSD指標來評價各種條件下線性等值的群體不變性。

3.1 嚴格平行測驗

對嚴格平行測驗,兩測驗的信度包括08、06、04、02四種條件,其中一個子群體均值為70,真分數標準差為7,又更接近真實情境,另一個子群體的均值與之相同或相差一個標準差。在不同群體被試所占比例相同的條件下,REMSD指標中的期望權重采用等權和采用比例加權結果是一致的,而實際研究中不同群體的樣本量通常不一致,所以兩子群體樣本量分別設為1000、2000。每種條件重復100次。

表1呈現了不同條件下嚴格平行測驗的六種群體不變性指標的模擬結果。可以看出,在各種條件下,期望權重和分數權重采用等權時的REMSD指標取值要比其他加權組合方式更大。當子群體分布相同時,REMSD指標的分數權重采用總體比例加權和子群體比例加權的結果一致,當子群體分布不同時,采用總體比例加權的REMSD指標值總是大于使用子群體比例加權。隨兩測驗信度水平下降,六種權重組合的REMSD指標均增加。

3.2 同質測驗

對同質測驗,兩測驗信度水平分別為(0.8,08)、(0.8,0.9)、(0.9,0.8)三種條件,真分數等值斜率有0.9、1.1兩個水平,代表較易和較難的兩個測驗,真分數截矩設為1.75,其它設定與嚴格平行測驗相同。

由表2可以看出,在子群體分布均值相同條件下,由高信度測驗等值到低信度測驗的REMSD較小,兩測驗信度差異并不會使REMSD增加,而是略有下降;在子群體分布均值不同條件下,兩測驗信度差異會使REMSD增加較大,斜率為0.9時,由低信度測驗等值到高信度測驗的REMSD比由高信度到低信度等值的更小,斜率為1.1時趨勢相反,但不明顯。

Tau等價與基本Tau等價是同質條件的特例,結果與同質條件相似,限于篇幅不再呈現結果。對于這三種非嚴格平行測驗,與嚴格平行測驗條件下相同,兩個權重都采用等權下的REMSD最大,而期望權重采用比例加權、分數權重采用子群體比例加權時的REMSD最小。

4 討論和總結

本研究通過理論分析和模擬數據對不同平行測驗定義下的線性等值的群體不變性進行了探索,結果與前人研究有所不同。

對于嚴格平行測驗,本文第二部分的理論分析可以得出子群體等值系數無差異的結論。Brennan(2008)認為等信度條件下信度水平高低并不是等值群體不變性的必要條件,信度越小,REMSD取值越小。但模擬數據結果與此不同,隨著測驗信度水平下降,各種加權方式下的REMSD都會增加。需要指出的是,隨著測驗信度下降,誤差成分在觀察分數中所占比例變大,此時估計出的等值關系很少能反映真分數之間的對應關系,而更多是由隨機誤差所決定,而REMSD指標并沒有反映等值系數的估計誤差,這可能是理論分析與模擬結果不一致的原因。

對滿足同質條件的測驗,子群體等值系數差異主要在截矩系數,差異的大小可能會受到兩測驗信度差異和分數分布的影響。模擬數據進一步顯示兩個因素存在明顯的交互作用,子群體均值相同時,信度差異增加不會使REMSD增加,而子群體均值存在差異時,信度差異會使REMSD增加較大。由低信度測驗等值到高信度測驗與相反情形下的REMSD之間存在差異,但很小。

對于REMSD的加權方式,期望權重和分數權重采用等權時比其它加權方式要更大,當子群體分布不同時,分數權重采用總體比例加權的REMSD指標值總是大于使用子群體比例加權。以往研究認為指標權重的選取是主觀的,實際數據中分數分布通常存在差異,本研究以為REMSD指標中的分數權重采用子群體比例加權更為恰當。

本文對等值的群體不變性的分析基于各種定義下的平行測驗,對等值群體不變性的分析有一個重要的假定,即各子群體的真分數對應關系相同。但這個假設在實踐中可能不滿足,如測驗X對子群體是公平的,測驗均值相同,但測驗Y由于內容不當題目數量較多則存在功能差異,一個子群體的考生更擅長這些考試內容。那么在測驗X上得分相同的不同子群體的考生在測驗Y上得分會存在差異,所以兩測驗在內容上的差異可能導致子群體真分數對應關系不同,此時子群體等值函數的截矩與斜率均不相同,REMSD指標可能較大。可能由于這個原因,所以鏈接通常不滿足群體不變性(Kolen,2004)。

具備群體不變性的等值才是公平有效的,而實測數據中人口統計信息的缺乏限制了對等值假設的檢驗。無法使用不同的等值函數轉換分數時,如何解決群體不變性不成立時的等值對于實踐者來說也是一個難題。理論上,項目功能差異題目可對等值群體不變性產生影響,但影響方式、影響大小尚未有研究涉及。這些都是關于群體不變性的進一步研究所亟待解決的問題。

參考文獻

Brennan,R.L.(2008).A discussion of population invariance.Applied Psychological Measurement,32(1),102-114.

Dorans,N.J.(2004).Using subpopulation invariance to assess test score equity.Journal of Educational Measurement,41(1),43-68.

Dorans,N.J.,& Holland,P.W.(2000).Population invariance and the equatability of tests:Basic theory and the linear case.Journal of Educational Measurement,37(4),281-306.

Dorans,N.J.,Liu,J.,& Hammond,S.(2008).Anchor test type and population invariance:An exploration across subpopulations and test administrations.Applied Psychological Measurement,32,81-97.

Holland,P.W.,& Dorans,N.J.(2006).Linking and equating.In R.L.Brennan(Ed.),Educational measurement(4th ed.).(pp.187-220).American Council on Education /Praeger,Westport,CT.

Kolen,M.J.(2004).Population invariance in equating and linking:Concept and history.Journal of Educational Measurement,41(1),3-14.

Kolen,M.J.,& Brennan,R.J.(2004).Test equating:Methods and practices.New York:Springer.

Liu,M.,& Holland,P.W.(2008).Exploring population sensitivity of linking functions across three law school admission test administrations.Applied Psychological Measurement,32,27-44.

Von Davier,A.A.,& Wilson,C.(2008).Investigating the population sensitivity assumption of item response theory true-score equating across two subgroups of examinees and two test formats.Applied Psychological Measurement,32(1),11-26.

Von Davier,A.A.,Holland,P.W.,& Thayer,D.T.(2004).The chain and post-stratification methods for observed-score equating and their relationship to population invariance.Journal of Educational Measurement,41,15-32.

Yang,W.-L.(2004).Sensitivity of linkings between AP multiple-choice scores and composite scores to geographical region:An illustration of checking for population invariance.Journal of Educational Measurement,41(1),33-41.

Yang,W.-L.,& Gao,R.(2008).Invariance of score linkings across gender groups for forms of a testlet-based college-level examination program examination.Applied Psychological Measurement,32,45-61.

Yi,Q.,Harris,D.J.,& Gao,X.(2008).Invariance of equating functions across different subgroups of examinees taking a science achievement test.Applied Psychological Measurement,32,62-80.

Population Invariance of Linear Equating under

Different Definition of Parallel Test

Liu Tiechuan1,Dai Haiqi1,Zhao Yu2

(1.School of Psychology,Jiangxi Normal University,Nanchang 330022;

(2.Department of Psychology,Gannan Medical College,Ganzhou 341000)

Abstract:

篇7

一、教學課程計劃的改革

1.教學課程計劃要突出主要學科,保證學科之間的聯系

學校制定教學課程計劃時,要在分析各學科的性質、任務、特點及相互關系的基礎上,確定所要開設的學科、學科順序、開設時間、教學時數,規定教學的內容、范圍和時間等,學科設置要有主有次。語文是中學的主要學科,要從時間安排上高度重視起來。各學科之間要互相聯系、互相配合,不能互相隔絕、各自為政。教師在語文教學中可以適當地為學生介紹與教學內容相關的地理、政治、美術知識,學科之間的融合能促進學生開闊思路,提高學習的積極性,對語文教學有促進作用。

2.打好學習基礎,關注學生的發展

學生是學習的主體,按照課程計劃所執行的教學方式要符合學生的身心發展水平和接受能力,注重教學內容的趣味性和學生掌握知識的可能性,強調基礎知識的傳授和基本技能的養成。尤其是基礎知識,這是學生深入學習的根本,如果基礎的東西都掌握不了,更不用談學生學習能力的培養、道德的升華。在知識經濟的時代,要讓學生在牢固的知識基礎之上進行能力和整體素質的提高。

3.課程計劃要有統一性、穩定性和靈活性

語文教學要按照全國統一的教學大綱、新課標來指導教學,這樣才能保證教學的正確方向。素質教育改革的深入實施,使素質教育這個核心目標成為教學課程計劃的導向。具體到教學時間中,教師的計劃要根據教材內容,根據學生的情況進行編排,一旦形成,不能朝令夕改。教師在教學中的時間安排要嚴格執行,不能因為一些阻礙就把課程時間拖延,影響整體的計劃。當然,教師在具體的計劃細節上還要做到靈活多變,因為課堂教學面對的是學生,有很多不確定的因素,教師要根據學生的學習情況進行調整。

4.教師要開闊視野,學習先進的教學經驗

教師對課程計劃的制定要立足國內,放眼世界,縱向上總結國內以往課程計劃的成敗得失,橫向上比較國外相關的課程計劃,從中吸取可以借鑒的經驗。

二、考試評價內容的改革

傳統的考試以紙筆測驗為主要形式,突出了三個中心,即“教師中心”“教材中心”“課堂中心”,考試內容嚴重脫離實際,導致學生通過了考試,雖然成績優秀,但對知識地靈活運用等方面的能力不足。素質教育強調的是學生的全面發展,即知識和技能、過程與方法、情感態度和價值觀的發展。改革考試評價的方式方法就要更新理念,探索運用更多的考試形式和方法。

實施靈活多樣的考試評價方法,改變以往單一紙筆測驗的方式,可以考慮根據語文學科的性質和教學目標引入口試,如背誦、朗讀、理解表達等。注重引入表現性考試,教師可根據對學生基本素質的要求,設立反映學生情感和價值觀的表現性考試形式,給學生展示特長和興趣愛好的機會。例如,組織學生進行演講比賽、社會實踐等。考試形式多種多樣,紙筆測驗也應考慮改革。例如,倡導開卷的考試形式,開卷考試形式考察的重點在于學生分析和解決問題的能力,而不是強化記憶,教師在教學中要將日常測驗演變成學習過程。一般而言,考試評價總是居高臨下,評價對象處于被動地位,這種狀況不利于學生的發展,他們不能很好地理解考試評價的意圖,甚至為應付考試而不惜忽視被認為非重點的學習內容。改變考試評價觀,教師應認識到調動學生積極參與考試評價是促進其發展的重要舉措。對于學生而言,學習是終身的事情,要學會不斷地利用考試評價的方式來了解自己的進步,分析自己的成績,定向自己的發展。做到這一點需要學生對考試本身有一個深刻的認識,也需要積極地參與考試的整個過程,要清楚地認識到日常的考試不是為了選拔,而是通過測驗促動學生學習,獲得更好的學習效果。教師為了讓學生主動進行自我考試評價,可以讓學生自己出考題,為了讓學生不斷總結歸納自己的不足,可以給學生多次考試機會,進行差異性考試。

三、教學手段的改革

信息科技的發展,勢必帶來教學現代化的改革。現代化的教學手段最常用的是多媒體課件,它利用了計算機網絡、投影儀、幻燈機、錄像等方式,形成了視頻、圖畫、文字、音樂等多種功能的知識傳輸系統,具有傳統教學手段不具備的優越性,使用多媒體可以激發學生的學習興趣。傳統教學一般使用文字教科書、掛圖、教師的口頭語言和黑板書面語言等方式傳授知識,比較單一、抽象,語文課文的豐富內涵和場景不能體現出來,學生往往學得枯燥乏味。而使用多媒體進行教學刺激了學生的感官系統,教師利用多媒體教學課件使課文場景形象逼真地呈現出來,使知識變得生動、形象,學生的學習氣氛活躍,調動了其主動學習的積極性。多媒體的人機互動功能給教師和學生提供了良好地互動,教師可以通過Email和MSN和學生保持聯系,可以幫助學生解答在課堂上沒有理解的問題,與學生討論問題,形成交互式學習。教師甚至可以和學生聊天,作為他們的良師益友,可以聽聽學生的心聲,虛心聽取學生對教師的評價。新課改下的教學不再是傳統教育中的以教師為中心、以課堂為中心,而是以學生為中心。同時,學生可以自主上網學習,查找自己感興趣的資料,進行網上練習等,鍛煉了自主學習的能力。在運用多媒體的過程中,教師不能一味的“拿來主義”,要規避其不足之處,這樣才能發揮其實效性,促進課堂教學。例如,過分地強調課件的重要性,認為只有使用課件才能把課上好,甚至認為板書都是多余的,教師成了一個點擊鼠標的工具,電子板書占據了整堂課,學生不再認真做筆記,而更依賴于拷貝教師的教案。聽覺和視覺成了一節課最重要的環節,忽視了親手演練才是學生學習及鞏固知識最重要的環節。教師在制作課件時,為了提高學生的學習興趣,過多地加入了音樂視頻及其他一些動畫,雖然課堂氣氛變得很活躍,但課堂的重難點并不突出,教師只顧埋頭操作電腦,在課堂上缺乏與學生的溝通,無法對學生的行為進行有效監督,不能了解學生對知識的理解程度。所以,教師在利用多媒體教學時,要認真設計課堂教學計劃,做到用現代化工具輔助教學,提高課堂效率的目的。

篇8

【關鍵詞】財務管理;課程;考核

《財務管理》是大多數高校經濟、管理類各專業的必修課程,也是其他多個專業的選修課程。本課程主要介紹財務管理的基本理論和基本方法,使學生對財務管理有一個基本的認識,領會財務管理在現代企業管理中的作用,并能為本專業的學習提供幫助。要求學生明確企業財務管理的目標以及貨幣時間價值、風險與收益等基本概念,掌握財務分析、投資決策、籌資決策、收益分配以及企業價值評估等理論和方法。

《財務管理》課程考核是教學評價的重要組成部分,對實現教學目標具有重要的督導作用。設置得當的課程考核有利于調動學生的學習積極性、培養學生的創新精神和創造能力,并對教學起到反饋、調節、評價和促進作用。那么應該如何安排課程考核,才能起到以上作用?在從事多年財務管理教學的基礎上,筆者就以下幾個方面談一談自己的體會。

一、實行分專業考核還是統一考核

以往本門課程考核時,考慮到各專業班級之間評分的公平與可比性,以及教師命題、評價的可操作性和效率性,一般都要求統一命題,統一考核。但基于以下原因考慮,筆者認為分專業考核更為合理:

首先,雖然各專業開設的本課程教學總體目標基本相同,但課程定位不同。對會計學、財務管理專業,該課程(也稱中級財務管理)是核心課程;對經濟管理類其他專業,該課程是專業教育必修課;而對于經管類以外的各專業,如語言類,社科、理工類各專業,則是為擴展知識面而開設的選修課。

其次,學時安排不同。會計和財務管理專業的本課程學時安排比較多,以本校為例,一般有中級財務管理48或54學時,高級財務管理48或54學時;其他經管類各專業,本課程一般安排48學時或54學時,不分中級和高級課程;經管以外各專業,一般設置為選修課,只安排32學時的課程。

再次,教學重點不同。對于會計和財務管理專業,重點在于財務決策、財務分析等方法的具體應用上。比如講到項目投資決策部分,基本方法對這些專業的同學來說非常簡單,只要介紹清楚就可以,而后面的不同壽命期投資項目的決策,設備更新決策、考慮折舊和所得稅問題的復雜決策等才是研究的重點;但對于經管類其他專業的同學來說,由于會計方面知識學的比較少,復雜問題的決策不宜過多展開;而對于經濟和管理類以外得各專業,重點應該放在基本方法比如貼現分析的幾種不同決策方法上。

二、采用形成性評價還是總結性評價

形成性評價是指對學生日常學習過程中的表現、所取得的成績以及所反映出的情感、態度、策略等方面的發展做出的評價,是在對學生學習過程的持續觀察、記錄的基礎上做出的評價。形成性評價重視的是過程,具體可以采用觀察、提問、作業、測驗、問卷、案例分析、分組討論等手段。形成性評價應設置得較為頻繁,比如可安排一個章節或一個單元后的作業、小測驗等。

在《財務管理》課程中采用形成性評價的好處在于:

首先,可以及時獲得反饋信息,有利于教師改進教學。比如在課堂講解的同時,通過觀察學生對所講內容的反應,了解學生對所學知識的理解情況,可以隨時調整教學。

其次,促使學生及時掌握已學部分知識。如“貨幣時間價值”部分學習結束后,可以安排作業或者小測驗,促使學生及時回顧課堂所學內容,并加深理解,為以后投資、籌資等單元的學習掃清概念理解和方法基礎上的障礙。

再次,可以及時發現學生學習過程中存在的問題,比如通過提問、作業等發現部分同學在與折舊相關的現金流量分析上發生錯誤,教師可以對這部分內容重新講解,學生也可以及時發現自己有哪些理解上的偏差,存在哪些錯誤,并根據教師講評和自己的重新認識進行更正。

第四,增強學生學習積極性。通過教師的正面肯定,使學生通過情感反應加強了進一步學習的積極性,也通過學生的認知反應加固了其對正確概念、原理等的認識,校正了含糊的理解和不清晰的記憶。

第五,促使學生參與評價。比如在以往的教學中,安排問卷調查,請學生自己分析什么樣的評價方式更為合理,同學們也提出了很多建設性的意見。

當然,形成性評價在應用時也存在一些弊端,比如:如果不把形成性評價的結果量化并計入到學生最終成績中,學生的積極性和參與度不夠,如果量化并計入最終成績,其評價結果本身可能并不公允,比如提問時每位同學回答的問題不同;作業很難保證獨立完成;分組討論時部分同學不開口不參與;作業、測驗的評價難以標準化;頻繁評價的時間精力難以保證等等。

總結性評價則是在教學活動告一段落后,為了解教學活動的最終效果而進行的評價,也稱為“事后評價”。總結性評價最常用的手段就是學期末的考試,其目的是檢驗學生的學業是否最終達到了課程教學目標的要求。

在《財務管理》課程中采用總結性評價的好處在于:

首先,可以考察教學目標的實現程度,考察學生掌握知識、技能的程度和能力水平。通過期末的考試可以考察學生是否明確企業財務管理的基本概念,是否掌握了財務分析、投資決策、籌資決策、收益分配、企業價值評估等的理論和方法,是否具備財務決策分析等能力。

其次,便于評定學生的學習成績。總結性評價最常見的作用是評定學生的學習成績,通過對學生達到教學目標的程度予以確定并打出分數,評出等級。

再次,對教師的教學提供反饋。教師可以從評價結果中獲得有用的信息,了解學生對這門課程的掌握程度、存在的問題和難點,這些信息將會對教師下一次組織教學提供參考。

應用總結性評價也存在一些弊端:比如,學生不重視過程只重視結果,平時學習積極性不高,考試前臨時抱佛腳;總結性評價有一次考試定終身之嫌,忽略了過程的考核;基于考核時間的限制,難以覆蓋絕大多數知識點,也難于滿足對學生創新和創造能力的考核。

在實際應用中,對《財務管理》課程考核應將總結性評價和形成性評價相結合。在形成性測試時,不要簡單地只打分數,而應通過適當形式地讓學生知道他是否已掌握了該單元的學習材料。如果學生掌握,應明確指出;如果沒有掌握,也要盡可能予以鼓勵并提出改進建議。在進行總結性評價時,要采用合適的考核形式,設定適當的考核難度,選用多種類型的考核題目,保證評價結果的客觀、公正,能夠反映出學生對知識和技能的掌握程度以及學生的能力。

三、采取開卷、閉卷還是論文形式

在總結性評價時,應該選用哪種考核形式呢?目前普遍采用的有閉卷考試、開卷考試和論文幾種形式。

在《財務管理》以往的教學中,筆者和同事都傾向于采用閉卷考試的形式。從評分角度來看,閉卷考試確實有不少優點,更適合標準化評分。閉卷考試的特點是:第一,有利于直接考查學生的識記、理解和應用能力,也是對學生多方面基本能力素質的考查。第二,試題形式封閉,有利于培養學生思維的敏捷性和流暢性。第三,閉卷考試不允許學生攜帶任何與考試無關的資料和工具,不允許學生交頭接耳,可能會給學生造成緊張的氛圍,影響其發揮。

采用開卷考試,考生可以自由查看資料,但是仍應獨立完成。與閉卷考試相比,開卷考試的試題更具開放性,更加靈活,為考生回答問題提供了充分的思考空間,有利于學生充分發表自己的見解,展現自己的能力,發揮自己的水平。開卷考試的特點是:第一,有利于考查綜合能力素質。開卷考試時,試題的提問角度不是直接的,大多不是能從書面上直接找到答案的問題。第二,試題形式比較開放,只有對系列知識的融會貫通,才能靈活地駕馭問題的回答,進而發表個人的獨特見解。第三,開卷考試允許考生翻閱隨身所帶的各種資料,考試環境相對寬松,能夠減輕學生的考試壓力。

以寫論文作為考核形式,對教師來說,命題的工作量大大減輕;同時學生也沒有考試壓力;論文也比試卷更能反映學生的綜合運用能力和創新能力。但是論文無法像閉卷或開卷考試那樣,有比較大的考核知識點覆蓋面,學生可以只選擇自己比較熟悉或感興趣的部分內容展開論述;論文寫作時學生可以參考大量資料,有的同學會在網上下載大量資料照搬或者抄襲,對此難于完全杜絕;論文的評分不像試卷那樣易于標準化,采用百分制評分并不太合適,也難以體現客觀和公正。

對會計和財務管理專業,建議采用閉卷筆試的形式,考核內容覆蓋面廣,既考核財務分析,財務決策等的方法掌握程度,又考核基本知識點和背景知識了解情況,考慮到這些專業的同學多有參加注冊會計師考試的需要,因此在題型安排和難度設置上可以部分參考CPA考試的情況,但對于CPA考試中未考察的實務以外的知識點等仍應考察。

對于金融、國貿、經管、市場等其他經管類專業,難度應該降低,考核基本概念、理論知識和復雜程度一般的分析決策等技能的掌握情況,另外考慮到和本專業結合的要求,可以采用開卷或閉卷筆試加論文的方式考核,開卷或閉卷筆試可以考察學時基本知識點和基本方法的掌握情況,論文又能促使學生結合本專業具體情況,選擇部分問題展開研究。

經管類以外的各專業,由于是作為擴展知識面開設的課程,只要學生能了解基本理論,應用基本方法解決經濟生活中的簡單問題即可。因此只考核基本知識點,最基本的決策和財務分析能力,可以采用有條件的開卷考核方式。

參考文獻:

[1]李宇,易松芝.財經類院校課程考試改革研究[J].當代教育論壇,2011(3).

[2]笪強生,翟晶.大學課程考核改革探索性研究[J].出國與就業(就業版),2010(19).

篇9

關鍵詞:課程考核方式;改革;過程考核;全面評價

目前,我國高職院校《大學語文》課程的考核主要分階段性測試與期中期末考核的方式,而一般情況下,大部分教師都采取作文考核或卷面測試的方式。作為傳統考核方式,作文或卷面考核固然可以全面考核學生對所學知識的掌握程度,而且各種題型教師和學生都很熟悉,操作簡單,因此沿用至今。但是這兩種傳統考核方式也存在許多弊端,如(1)“一刀切”的考核形式,無法滿足職業教育“以能力為本位”的本質需求,只能考查學生對所學知識的掌握程度,而不能全面反映學生語文素質和能力水平。(2)沒有針對不同階段不同教學內容采取相應的測試形式,考試形式單一。(3)傳統考核方式的評卷尤其是作文批改工作量大,必然導致效率不高,并且在分數的驅使下,必然會對語文課堂帶來“功利教育”的負面影響,學生不重視平時學習,到期末考試時臨時抱佛腳,不能真正體現學生的真實學習狀況。這些都在一定程度上制約了教學水平和教學質量的提高,降低了學生對語文課程的學習興趣,也影響了大學語文教學改革的深入推進。

為此,我院在不斷推進大學語文教學改革的過程中,嘗試進行課程考核方式改革,探索提升教學質量的有效方法,把考核貫穿到日常教學過程中,改變對學生“一次性評定”的方式,力求對學生的學習語文的過程中各節點進行質量控制,激發學生學習主動性,以更全面的評核學生的學習情況。現從改革理念、改革目標、改革內容以及結果和成效等方面來談談。

1改革理念

高職教育是素質教育和職業能力教育,教學過程尤其是評價過程對于學生學習態度和學習信心的促進都起到很重要的作用。要讓層次不同的每一個學生都能主動發展,都能獲得成功的體驗,就必須改革目前這種終極式的、以知識再現為主的、一刀切式的考試模式,建立新的語文考核方式,突出過程評價、注重興趣培養及能力訓練,讓每一個學生都在學習的過程中獲得成功的情感體驗,從而激發他們的主體精神。

2改革目標

我院大學語文已不再是空談素養,簡單學習幾篇文章的所謂“高四語文”,而是根據高職學生需求,加強應用文寫作和口語表達,把能力與素養相結合,已取得了較好的教學效果。本次考核方式改革項目試圖從高職語文課程考核方式的變革入手,尋求解決傳統語文教學模式、考核模式不足的方法,以期將語文課堂育人、能力培養的本質目標最大化。主要目標如下:

1)以我院高職語文“能力為核心”的教學理念為依據,現代教育測量理論為指導,合理編制高等職業院校語文考試評價模式,力求考核模式的科學性和適用性。2)培養學生平時學習的自覺性和創造性,建設踏實的學風,促使學生注重學習過程,充分利用平時時間努力學習,使學生在較短時間內掌握基礎的實用寫作及口語表達的技能。3)全面正確客觀的評價學生的學習情況。能使我們真正的掌握學生的學習狀態、看到學生的學習成果,檢驗自己的教學效果。

3考核內容

為配合大學語文的教學改革,切實提高教學質量,根據高職教育的培養目標和教學要求,我院基礎課部語文教研室經過集體討論,對現有的課程考試模式進行了改革,建立以“能力測試”為中心的考核模式,以充分發揮考試在教學和人才培養中的教育作用、引導作用和導向作用。具體方案如下:總評成績=平時成績(30%)+應用文寫作環節成績(40%)+口語表達環節成績(30%)+獎勵附加分。

考核方式的改革主旨是為了評價學生學習全過程,測試學生是否達到既定能力目標。

通過三個學期的實踐,語文課程的考核方式已大致定型。前兩個學期,我們取消了“期末考試”,設計了專用練習本,按照既定方案實施課程考核,分階段、全過程地考查學生在“寫作”和“口語”方面的學習情況。以“出勤率”、“平時作業”、“課堂表現”記錄學生的平時成績,“寫作”成績由一次隨堂階段測驗和一次合作完成的任務書綜合評定,“口語”成績由演講(拍攝視頻上交)和一次課堂情景模擬綜合評定,然后按照比例計入總分。最后為鼓勵學生進行課外延伸學習,給學有余力,表現優異的學生進行適當加分,一并計入總分。

從這兩學期學生的學習成績看來,學生開始重視過程學習,作業水平有所提高,不及格率有所下降。但某些合作完成項目,仍存在部分學生渾水摸魚的現象,為此,教師修訂了練習本,要求學生在作業中注明本人在合作項目中為團隊具體做出何種貢獻,情況有所好轉,公平性得到提升。

在考核方式改革實施過程中,我們通過及時反饋和總結,進一步對高職語文考核方式的可行性進行論證,不斷改進考核方式。

第三學期,在大學語文教學改革不斷深入探索的過程中,我們把“寫作”+“口語”的模塊化教學進一步深化為打破模塊的“活動單導學”的教學方式,把“口語”和“寫作”的教學內容融合在一起,以“活動單”為學生的學習指引,在一個活動項目中,結合與該活動有關的相關知識能力點,涵蓋“說”“寫”“素養”三方面內容。因此,原有的方案把“說”和“寫”進行相對獨立考核,顯然已不夠適合現有教學方式。因此,在第三學期,我們把考核內容稍作修改,在不改變“說”和“寫”的能力指標評價的基礎上,以“活動單”為單位進考核項目包含了任務完成、演講視頻、現場模擬、階段性測驗,采用“筆試”+“口試”的形式,對學生知識掌握(階段測驗)、能力應用(任務完成、演講視頻、現場模擬)和素養提高(團隊協作、探索分析)進行了全方面的考評。

修訂過的考核內容更多,計分更細致,也能更詳細地對學生的學習狀況作如實反映,評價更為全面。

4考核方式改革的創新點

(1)注重平時成績、全面評價考生。前兩年教學改革中實行的考核方式,雖然已經注意到了寫作和口語的分項考核,相當程度改善了評價模式,但是由于期末考試成績仍然所占比重較大,仍有部分學生存在平時糊弄,考前突擊的現象,而有些同學認為做試卷才是考試,把學習的功夫過多用于考場上,記背理論知識,對平時老師布置的項目、任務卻敷衍了事,甚至不重視口語測試,這些都不利于學生創造性和主動性的發揮,阻礙了創新思維的培養與發展。為培養學生學習的自覺性和創造性,促使學生充分利用平時時間努力學習,本學期我們經過集體討論,結合我們的課程改革實際,決定期末不再舉行大規模卷面考試,考核成績分別由平時成績、寫作成績、口語成績組成,具體由平時作業、課堂表現、單元測驗、項目操作、課堂實訓等環節構成、設立相應指標體系和能力點,構建了一套相對全面、客觀、合理的考核體系。這樣的考核方式強化了學習過程的重要性,加強了對學生的學習過程評價,促使學生在平時多下功夫,逐漸積累,真正投入學習中,利于學校學風建設。

(2)考試方式多樣化、考試內容側重能力培養,改重寫輕說為說寫并重。傳統的考試一般采用終結式考核方式,對于學生學習成果的檢驗僅來自于那一場考試,對學生的考核方式比較單一,經過了兩年的教學改革,大學語文的考核方式已經作了較大改進:增加了口語考試,寫作部分雖仍以試卷為主,但是以材料寫作題為主,并采取了開卷的方式。在本次考核方式改革中,我們決定舍棄呆板的卷面考試方式,全力挖掘學生的學習潛能,弱化記憶性成分,強化學生對知識的實際應用能力,分析和解決問題的能力,允許學生以合作者身份介入命題,采用完成任務書,操作項目、角色扮演等多種新型考核方式 。

(3)建立良好的反饋機制。在原來的教學過程中,由于考試是期末一次性終結考試,學生考試結束,就意味著本門課程學習的終結。考試中存在的問題,教師不能與學生進行反饋與交流。學生不知道自己差在哪里,不明白的問題一直是問題,而任課教師也難以在教學中及時了解學生對知識的掌握程度,不能了解學生為何會出現那些問題,也就無法對教學做出必要的調整。本次改革后,由于設立了分階段的測驗和完成任務書,每次測驗后或者完成某項任務后教師都能及時把測驗情況和任務完成情況反饋給學生,存在的問題老師能很好的跟學生進行交流,學生能有所收益,而反饋過程也為任課教師改進教學提供了參考。學習成為了一個良性互動的過程。

5考核方式改革的結果與成效

(1)考核方式改革后真正體現了對學生知識、能力、素養的全面考核。例如:單元測驗從學生知識體系入手,采用開卷形式、考題設計以知識為基礎,能力考核為主旨。活動單的完成全面考查了學生分析問題、解決問題的能力,在考核過程中,學生團隊協作、自主鉆研等素養得到全面提升,獎勵積分的方式促進學生不算自我完善、自我加壓,在課外繼續進行延伸學習。

(2)改革后的考核方式突出過程評價、注重興趣培養及能力訓練,讓學生們都學習的過程中獲得成功的情感體驗,從而激發他們的主體精神。例如:學生文字表達作業在校報上集結發表(校報某期副刊專版、近期校報又會發表),激發了學生的學習興趣,獲得成功體驗,有利于學生學習積極性的提高。學生通過團隊協作完成活動方案,在全班展示,有的甚至在生活中付諸實施并獲得成功,學生主體精神得到全面發揮。

(3)新的考核方式獲得學生好評。在考核方式改革的兩年中兩次對語文學習開展問卷調查,問及“你覺得改革后的考核方式如何?” 絕大部分的學生都認為新的考核方式“較好的考核了學生的總體學習情況”。每學期的師生座談會上學生對于考核方式改革均給予大力肯定,他們認為,這種考核方式較為公平全面地體現了他們的學習狀況,并且通過這樣的考核方式,培養了他們多方面能力,比如團隊協作能力、口語表達能力、探索研究自主學習的能力,使他們更喜愛語文課程的學習。學生在考核中完成了活動方案的制作、演講視頻的拍攝、個人營銷等能力展現。

(4)學生成績有所提高,不及格率降低。從三學期的成績統計看來,學生在適應了新的考核方式后,學習興趣增強,學習主動性得到提高,總體成績逐步上升,不及格率較以前有較大幅度的降低。

課程考核是為了了解學生對知識的掌握和運用的教學效果。合理的考核方式能引導學生進行自主的研究性學習,發揮考試的診斷、評價、反饋、導向和激勵的功能,促進教學改革的深入發展。因此,我們只要潛心研究,大膽探索,不斷總結提高,就能摸索出一條適合高職人才培養需求的考核方法,進一步促進我院大學語文教學改革,從而達到我院“給予能力,以人為本”的人才培養目標。

篇10

(一)文件筐測驗的概念

所謂文件筐測驗,也稱公文處理測驗,屬于情景模擬面試方法的一種,是評價候選人能否勝任特定管理崗位的常用情境模擬技術之一。公務員面試文件筐測驗手段最初來自于企業選拔領導干部時常用的方法,目前廣泛應用于領導行為、培訓、工作滿意度、績效評估、組織公民行為、組織信息加工、決策、壓力管理、組織氣氛等諸多領域的研究。

公務員面試的主要目的是要考核考生的基本素質是否與公務員崗位要求相匹配,尤其要考核考生處理公文的能力。由于申論目前采用提出問題、分析問題與解決問題的模式,在一定程度上不能充分地考核考生處理公文的能力。而文件筐測驗方法則恰恰是針對這一缺陷而設計的面試方法。

在公務員面試中,文件筐測驗往往用于在限定角色、限定時間、限定背景、限定條件的前提下,通過要求考生處理諸如記錄、報告、請示、聲明、通知、總結、函電函件、備忘錄、待審批簽發的文件、統計資料和報表等日常公務來考察被試者的計劃、組織、預測、決策和溝通等能力。一般只給日歷、背景介紹、測驗提示和紙筆,考生在沒有旁人協助的情況下回復函電,擬寫指示,做出決定,以及安排會議。評分除了看書面結果外,還要求考生對其問題處理方式做出解釋,根據其思維過程予以評分。

(二)文件筐測驗的特點

文件筐測驗把被試者置于模擬的工作情境中去完成一系列的工作,與通常的紙筆測驗相比,較能反映被試者的真實能力水平。與結構化面試、無領導小組討論等其他測評技術相比,它提供給被試者的背景信息和測驗材料以及被試的作答都是以書面形式完成的,一方面考慮到被試者在日常工作中接觸和處理大量文件的需要,另一方面也為每一位被試者提供了工作的前提條件和機會相等的情境。文件筐測驗可以同時對大批量的被試者進行測試,這也是其他情境測驗方式所無法比擬的。

文件筐測驗是評價擔任特定職務的管理人員在典型職業環境中獲取、研究有關資料、得體處理各類信息、準確做出管理決策、有效開展指揮、協調和控制工作能力及其現場行為表現的綜合性測驗。文件筐測驗作為評價技術手段體系的一個重要組成部分,一直被認為是選拔領域有效的甄選工具之一。與其他面試方法相比,文件筐測驗具有全面性、針對性、準確性、公平性、復雜性、難以把握等特點。

1.全面性

文件筐測驗要求考生在限定條件下,迅速準確地處理一系列公文,這就要求考生必須全面調動自己的知識儲備與經驗積累,不僅僅是要保證公文格式的完整準確,而且還必須能夠對特定文件所涉及的背景知識(如業務知識)、操作經驗以及其他能力要素有全面的把握。也就是說,考生在考場強刺激環境下,必須能夠迅速調用自己與待處理文件有關的一切要素,才能夠取得優秀的成績。而且公文筐測驗是一套公文的組合,可以同時從多個維度上評定一個人的管理能力,這些能力是知識、經驗和智力相互作用和整合的結果,具有綜合性。

2.針對性

結構化面試和無領導小組討論往往存在一個共同的缺陷,即考試題目常常陷入過于抽象、過于籠統、過于概括的境地,這種籠統性使公務員面試的針對性在一定程度上有所弱化。從而導致考試本身的信度與效度也隨之下降,不利于選拔符合職位崗位要求的最佳人選。而文件筐測驗則不同,題目一般都會具有很強的實踐性與操作性,針對某一個或某幾個特定的公務,這些公務都是考生在進入工作崗位之后常常要處理、要面對的公務。考生在考場上的表現,在一定程度上能夠反映出考生在進入工作崗位之后的表現。

3.準確性

文件筐測驗最大的優點在于其具有較高的表面效度,它模擬的是真實工作情境,測驗材料是實際工作的樣本。作為一種情境模擬技術,文件筐中有的公文材料采用手寫體,有的函件采用報考單位的信箋書寫,這使其具有較好的模擬效果,比傳統的認知測驗和人格測驗更能吸引被試者投入測試,也有利于考官根據考生的處理態度、處理方式、處理結果來直觀而準確地判斷考生潛在的素質是否能夠與職位崗位要求形成最佳匹配。文件筐測驗高度仿真和接近管理實戰,非常有利于激發被測評者的積極性和創造性,對于在很短的時間內全面、準確掌握管理者的能力、潛能以及個性心理特征的某些關鍵要素具有不可替代的重要作用,是不折不扣的“管理者實戰演習”。兩小時左右的文件筐測驗對被測評者自身綜合素質狀況、工作經驗積累、專業知識和相關知識的系統整合與嫻熟應用的考察效果為其他許多人事測驗所望塵莫及。據統計,歐美發達國家和日本在選拔、評價管理人員時最常用的技術就是評價中心,而評價中心中文件筐測驗的使用頻率高達95%。文件筐測驗效度和信度極高(信度相關系數為0.92)。研究表明文件筐測驗具有良好的內容效度。雖然文件筐在測驗過程中采用的是靜態的考察方式,但是其材料包羅萬象,范圍廣泛,任何靜態的測評要素,比如背景知識、專業知識、操作經驗以及能力傾向等都可以隱含于文件之中,通過文件處理這種形式對被試者的潛在能力和綜合素質進行考察。

文件筐測驗中的成績與實際工作中的表現有很大的相關,對被試者未來工作績效有很好的預測能力,即該測驗具有良好的預測效度。因此,只要被試者能夠妥善處理文件筐中的各類文件,評價者就有理由認為被試者在一定程度上具備了勝任新職位所需要的素質。西方有研究者觀察了51人的工作實際績效后發現,工作績效與文件筐測驗之間的相關度高達0.42;還有人發現文件筐測驗的績效與日后三年內的晉升之間的相關度為0.32。

4.公平性

文件筐測評的技術手段,與其他面試手段不同,它常常采用團體測評的方式。所有考生同時對一個文件筐進行處理。由于這種處理一般都是以書面形式完成的,因此基本上可以排除相互之間的影響和干擾,也排除了結構化面試入場次序不同所導致的不公平現象(比較典型的是:結構化面試中,最后一個入場接受測評的考生,在表現相同的情況下,成績往往會比先入場的考生要低,這與考官的心理變化有關)。與結構化面試考官獨立打分不同,文件筐常常由考官組進行討論之后,才對考生的表現做出綜合評價,這有助于提高公文處理的信度。

5.復雜性

文件筐測驗的復雜性體現在專家命題、培訓考官、考生答題、考官評分整個面試過程。專家在命題的過程中,必須考慮到考生所報考職位的特點與要求,考慮到題目所涉及的公務在日常工作中的代表性與全面性,還要盡可能降低外在因素對準確判斷考生潛質的消極影響,很大的題量、很長的考試時間,對考官自身的素質提出了較高的要求,采用文件筐測驗,會使得面試時間成倍地增加,也使得面試的成本大大增加,這無疑也加大了面試的難度。

6.評分的困難性

由于文件筐測評具有很強的針對性,因此就不僅僅對考生的素質提出了更高的要求,對考官評分的要求也大大提高。在我國公務員面試中,考官組成的規則決定了同一個考官要對大量報考不同部門不同職位的考生進行面試與測評。而不同部門、不同職位所面臨的日常公文又具有一定的區別,考官很難對所有部門與職位的日常工作都相當了解,加之個人素質、機構性質、工作理念的差異,使得文件筐測評從工作分析、能力分析到選擇材料、題目成型,都存在著較大的困難。

一份文件的處理,除了個人素質的原因外,機構、氛圍、管理觀念等不同的組織,具有不同的評價標準。顯然政府機關與公司企業、私營企業與國有企業對有關文件的處理是大相徑庭的。在我國從事實際工作的人們往往缺乏對招聘單位管理或經營狀況的深入了解,因而文件如何處理才能充分表明考生具備招聘職位所需素質,專業人員與實際工作者往往存在理解上的差異。因此,評分不容易把握。

二、文件筐測驗的題目編制

文件筐測驗的題目編制與結構化面試大同小異,除了共性之外,其題目編制還有以下幾個特點:

(一)工作分析

工作分析是文件筐測驗題目編制的第一步,也是文件筐測驗題目編制的根本指針。命題人需要根據招考職位說明書,對各個與文件筐測驗相關職位工作的特點、必備的知識、經驗、能力進行充分的調研了解,以便題目的編制能夠充分體現出招考職位的素質要求。工作分析的方法可以是面談、現場觀察或問卷。通過工作分析,命題人基本上可以確定文件筐測驗需要測評哪些要素,各個要素能夠得到測評的程度以及所占權重。

文件筐測驗一般可以考查以下要素:

1.書面表達及其理解;

2.統籌計劃能力;

3.組織協調能力;

4.洞察問題和判斷、決策能力;

5.任用授權能力;

6.指導控制能力;

7.崗位特殊素質,如法規條例知識。

(二)文件設計

在進行了充分的職位調研,確定需要測評的要素及所占權重之后,命題人就需要進行文件設計的工作。文件設計工作的第一步,是選擇文件種類,例如報表、備忘錄、批示、請示、信函、通知、報告等。一般情況下,命題人可以選擇其中的一個文件種類,如統計報告,也可以選擇幾個文件種類進行組合式命題。文件設計工作的第二步,是確定每個文件的具體內容,如文件假定的背景(包括考生的身份設定、考生所處場景),文件的具體要求、具體格式,工作的具體內容。如果文件數量較多,則時間以2~3小時為宜。文件的簽發方式及其行文規定可以忽略,但文件的行文方向(對上與對下,對內與對外等)應有所區別,特別要注意各個文件測評要素的設計。一個文件不同的處理常常可以體現不同的要求,對文件的處理方式要有所控制,確定好計分規則或計分標準,要求測評要素與評分標準做到一一對應,須盡量避免一個測評要素對應兩個及兩個以上評分標準,或者測評要素與評分標準無法對應的現象。

整個文件筐測驗的設計要特別注意兩點:

一是測驗材料難度的把握。目前國內對各個職位應具備何種程度的知識、經驗和能力缺乏客觀可靠的依據,難度的把握比較困難。把握不準,材料過易或者過難,都容易導致考試成績缺乏科學的區分度,不利于選拔最優秀的人才。

二是要注意材料真實性程度的把握。完全杜撰的材料,考生可以根據一般知識推理,處理的結果沒有針對性,看不出考生的水平差異,考生被錄取后需要經過較長時間的培訓和適應才能勝任工作。完全真實的材料,過于偏重經驗的考查,忽視潛能的考查,最后選拔到的人無疑是完全與招聘單位文化氣氛相同的人,違背了引入外來人才、給單位輸入新鮮血液的本來目的。同時完全真實的材料,使招聘考試本身對單位內部考生和單位外部考生不公平,同樣的能力水平,內部考生被錄取的可能性更大,結果給人留下“一切都是內定,考試不過是走形式”的印象,這對真正想引進外部人才的單位尤其不利。

三、文件筐測驗的實施

文件筐測驗可以單獨測試,但為了節約時間和成本,也可以集體施測,實施過程分準備、測試和評分三個步驟。

1.準備

主要指測驗材料和測試場所的準備。給每個考生的測驗材料,事前要編上序號,答卷紙也要有相應序號,實施前要注意清點核對。答卷紙主要由三部分內容構成:一是考生姓名(或編號)、應聘單位和職位、文件序號等;二是處理意見(或處理措施)、簽名及處理時間;三是處理的理由。文件序號只是文件的標識順序,不代表處理的順序,應允許考生根據輕重緩急調整順序,但給所有考生的文件順序必須相同,以示公正。測試的場所要求比較寬敞、安靜,每個人一桌一椅,相互之間無干擾。為了保密,最好所有考生在同一時間完成。如果文件內容涉及到招聘單位內部的一些情況,測試前應對所有考生提供培訓,介紹相關情況,縮小內部考生和外部考生對職位熟悉程度的差別。

2.實施