Đổi mới việc viết câu hỏi và xây dựng đề kiểm tra

Lý luận dạy học đại học hiện đại đã chỉ ra rằng Kiểm tra-Đánh giá hoạt động

học tập sinh viên là một thành tố quan trọng của quá trình dạy học. Hiện nay trên thế giới cũng

như trong nước đã có một số nghiên cứu về Kiểm tra-Đánh giá, tuy nhiên các tài liệu này có

mục đích nghiên cứu hơn là ứng dụng. Vì vậy bài viết này tập trung vào vấn đề kỹ thuật, sử

dụng lý thuyết trắc nghiệm cổ điển và hiện đại đề xuất một số giải pháp đổi mới hai khâu quan

trọng nhất của qui trình Kiểm tra-Đánh giá sinh viên, đó là viết câu hỏi và xây dựng đề kiểm

tra.

16 trang | Chia sẻ: phuongt97 | Lượt xem: 673 | Lượt tải: 0

Nội dung tài liệu Đổi mới việc viết câu hỏi và xây dựng đề kiểm tra, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên

c của đề kiểm tra. Hình dưới đây biểu diễn đường cong đặc trưng của một đề kiểm tra, cũng gọi là đường cong điểm thực, có tiệm cận phải bằng điểm tối đa của toàn bộ đề. Đường cong cho phép xác định điểm kỳ vọng mà một sinh viên có năng lực θ nào đó đạt được khi làm đề kiểm tra đang xét. 2.2 Hàm thông tin của đề kiểm tra Mỗi một câu hỏi trắc nghiệm cung cấp một lượng thông tin nào đó về năng lực cần đo của các sinh viên. Ở đây chúng ta sử dụng hàm “hàm thông tin của câu hỏi” (Item Information Function) theo định nghĩa của Birnbaum A. Đối với một đề kiểm tra, “hàm thông tin của đề kiểm tra” (Test information Function) là tổng các hàm thông tin của các câu hỏi có trong đề. Từ định nghĩa hàm thông tin cũng cho thấy đề kiểm tra càng có nhiều câu hỏi thì giá trị của hàm thông tin càng cao, tức là đề kiểm tra có nhiều câu hỏi thường đánh giá năng lực sinh viên tốt hơn đề có ít câu hỏi. Tùy theo tính chất của các câu hỏi tạo nên đề trắc nghiệm mà hàm thông tin có giá trị lớn (tức đo chính xác) ở khoảng năng lực nào đó và có giá trị bé (tức đo thiếu chính xác) ở khoảng năng lực khác. Do những đặc điểm trên, hàm thông tin là một công cụ vô cùng quan trọng của lý thuyết IRT, nó giúp thiết kế các đề kiểm tra cho phép đo đạc năng lực theo các mục tiêu xác định. Kỷ yếu công trình khoa học 2014 – Phần I Trường Đại học Thăng Long 47 2.3 Đánh giá đề kiểm tra bằng so sánh năng lực sinh viên với độ khó câu hỏi Biểu đồ dựa trên mô hình RASCH, biểu diễn đồng thời học sinh theo năng lực và câu hỏi theo độ khó trên cùng thang đo với đơn vị lo-git. Thang đo nằm bên trái nhất của biểu đồ. Học sinh được biểu thị bởi dấu “xxxxx” được xếp theo năng lực từ thấp đến cao. Nó cho thấy “phân phối” của số học sinh trả lời câu hỏi. Bên phải đường phân cách là câu hỏi (biểu thị bởi số thứ tự của nó) được xếp theo “độ khó” của nó. Nếu năng lực của học sinh “bằng” độ khó của câu hỏi (trên biểu đồ xếp ở vị trí ngang nhau) thì cơ hội trả lời đúng là 50/50. Nếu một học sinh ở vị trí tương đối cao hơn so với câu hỏi thì nhiều khả năng học sinh trả lời đúng câu hỏi đó. Ngược lại một học sinh ở vị trí thấp hơn so với câu hỏi thì nhiều khả năng học sinh trả lời sai câu hỏi. Kỷ yếu công trình khoa học 2014 – Phần I Trường Đại học Thăng Long 48 VC_SC1 nam 2013-2014 Wed Aug 20 10:17 2014 MAP OF LATENT DISTRIBUTIONS AND RESPONSE MODEL PARAMETER ESTIMATES --------------------------------------------------------------------------------------- 3 |1 | | | | | | | | | | | | | XX| | X| | XX|2 | 2 XX| | XX| | XXX| | XXX|14 15 | XXXXXXXX|17 34 | XXXXX| | XXXXXX|30 | XXXXXX|25 | XXXXXXXXXXX|18 | XXXXXXXXXXXX|10 | 1 XXXXXXXXXXXXXXXXX|60 | XXXXXXXXXXXXXXXXXXX|23 24 39 | XXXXXXXXXXXXXXXXXXXXXX|3 52 | XXXXXXXXXXXXXXXXXXXXXX| | XXXXXXXXXXXXXXXXXXXXXX|4 | XXXXXXXXXXXXXXXXXXXXXXXXXXX|32 42 | XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX|33 | XXXXXXXXXXXXXXXXXXXXXXXXXXX|16 | XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX| | XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX|9 22 | XXXXXXXXXXXXXXXXXXXXXX|5 21 38 41 | 0 XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX|20 28 40 45 47 | XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX|19 | XXXXXXXXXXXXXXXXXXXXXXX|27 35 50 | XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX|26 29 31 46 | XXXXXXXXXXXXXXXXXXXXXXXXXXXXXX|51 | XXXXXXXXXXXXXXXXXXXXXXXXXXX|49 | XXXXXXXXXXXXXXXXX|7 8 37 54 | XXXXXXXXXXXXXXXXXXXXXX|36 57 | XXXXXXXXXXXXXXXXXXXXXXXXX| | XXXXXXXXX| | -1 XXXXXXXXX|13 48 | XXXXXXXXX|53 55 58 | XXXXXXXXX|43 | XXXX| | XXX| | XX|6 | XXX|12 56 | | | | | X| | -2 | | |44 | |59 | | | |11 | | | | | | | ======================================================================================= Each 'X' represents 0.5 cases ======================================================================================= 2.4 Độ tin cậy của bài trắc nghiệm (Reliability) Độ tin cậy là một khái niệm cho biết bài trắc nghiệm đo năng lực thí sinh với một sự ổn định có thể. Độ tin cậy của bài trắc nghiệm thể hiện ở sự ổn định của kết quả đo qua các lần đo khác nhau, nghĩa là, kết quả ở các lần đo không khác nhau hoặc sự thay đổi nếu có là rất ít. Ở giáo dục thường sử dụng phương pháp Alpha-Cronbach hoặc Kuder-Richardson 21. Cả hai cách tính trên đều có giá trị từ 0.00 đến 1.00 trong đó giá trị càng lớn thì độ tin cậy càng cao. Mặc dù không có các giới hạn tuyệt đối cho các hệ số tin cậy “có thể chấp nhận được” (do độ tin cậy thường bị ảnh hưởng bởi rất nhiều các yếu tố khác nhau), nhưng “kinh nghiệm” chỉ ra rằng: Nếu bài kiểm tra chỉ được sử dụng để xếp loại học sinh thì hệ số tin cậy thấp nhất phải là .08, còn nếu bài kiểm tra được sử dụng cùng với các hình thức đánh giá khác hệ số tin cậy đó là giá trị từ 0.60 đến 0.70. 2.5 Độ giá trị (Validity) Độ giá trị của bài trắc nghiệm là thông số nhằm xác định xem bài trắc nghiệmcó đo đúng đối tượng đo hay không. Độ giá trị của câu hỏi trắc nghiệm dùng đánh giá kết quả học tập cần quan tâm đến các tiêu chí giá trị cơ bản: mục tiêu, nội dung, giá trị tiên đoán, trình độ,... Về giá trị mục tiêu: đề kiểm tra trắc nghiệm phải bám sát mục tiêu đào tạo, đồng thời phải xác định mục tiêu chúng ta cần đo là gì, mức độ nhận thức đến đâu. Đề kiểm tra trắc nghiệm đạt được mục tiêu đề ra là đề kiểm tra có giá trị. Kỷ yếu công trình khoa học 2014 – Phần I Trường Đại học Thăng Long 49 Về giá trị nội dung: một đề kiểm tra trắc nghiệm được coi là có giá trị nội dung khi các câu hỏi trong bài là một mẫu tiêu biểu của tổng thể các kiến thức, kỹ năng,mục tiêu dạy học. Mức độ khái quát của nội dung đề thi so với nội dung chươngtrình dạy học là căn cứ để xác định giá trị nội của đề kiểm tra. Về giá trị tiên đoán: thể hiện mối quan hệ giữa điểm số của bài trắc nghiệm vớimột số tiêu chí khác phản ánh năng lực, hay thành quả ở tương lai. 3. Đề kiểm tra tương đương Trong kỳ thi phải dùng nhiều đề kiểm tra khác nhau (để chống quay cóp hoặc do thời điểm kiểm tra khác nhau ), để đảm bảo tính công bằng thì yêu cầu các đề kiểm tra này cần phải tương đương. Giả thiết rằng các câu hỏi trong các đề kiểm tra này đều đã được định cỡ, tức là đã biết các tham số (độ khó, độ phân biệt ). Dựa vào lý thuyết IRT, người ta có thể xác định được đường cong đặc trưng và hàm thông tin của các đề kiểm tra này mà không cần dựa vào kết quả bài thi của sinh viên. - Phương pháp dựa vào lý thuyết trắc nghiệm cổ điển: Để xét 2 đề kiểm tra có tương đương hay không người ta chỉ chú ý đến tiêu chí sự phân bố của các câu hỏi có cùng độ khó, độ phân biệt theo ma trận đề. Tuy nhiên các tham số của câu hỏi theo lý thuyết trắc nghiệm cổ điển không phải là bất biến đối với tổng thể thí sinh mà chúng ta muốn xác định năng lực, do đó mức độ “tương đương” của 2 đề kiểm tra không thể khẳng định được. - Phương pháp dựa vào lý thuyết trắc nghiệm hiện đại: Ngoài tiêu chí sự phân bố của các câu hỏi theo ma trận đề người ta còn dùng thống kê để đo mức độ “tương đương” của 2 đề, do đó chính xác hơn phương pháp dựa vào lý thuyết trắc nghiệm cổ điển nhiều. * Sử dụng hàm thông tin Nếu như ta quan tâm đến các đặc điểm thông tin của đề thì nên so sánh 2 hàm thông tin có tương tự nhau không. Sau đây là thí dụ 2 hàm thông tin của 2 đề tương đương: Kỷ yếu công trình khoa học 2014 – Phần I Trường Đại học Thăng Long 50 * Sử dụng đường cong điểm thực Nếu như ta quan tâm đến điểm số của đề thì nên so sánh 2 dường cong điểm thực có tương tự nhau không. Sau đây là thí dụ 2 đường cong điểm thực của 2 đề tương đương: C. Kết luận Những năm gần đây, trường Đại học Thăng Long đã có nhiều đổi mới về nội dung dạy và phương pháp dạy học như: cấu trúc lại chương trình một số môn, cập nhật kiến thức mới, đưa nhiều môn học tự chọn, môn học các kỹ năng mềm Đặc biệt về phương tiện dạy học, nhà trường đã trang bị các phòng học đa phương tiện, nhiều phần mềm, thư viện điện tử Tuy nhiên việc kiểm tra, đánh giá hoạt động học tập của sinh viên chưa có sự thay đổi tương xứng, đặc biệt chưa cập nhật được lý thuyết đo lường hiện đại vào kiểm tra đánh giá. Vì vậy, việc đề xuất các giải pháp đổi mới kiểm tra, đánh giá hoạt động học tập của sinh viên trong Kỷ yếu công trình khoa học 2014 – Phần I Trường Đại học Thăng Long 51 trường Đại học Thăng Long trên cơ sở lý thuyết trắc nghiệm cổ điển và hiện đại là rất bổ ích. Câu hỏi TNKQ sử dụng để đánh giá một khối lượng kiến thức lớn, phân tán và phủ kín cả mục tiêu dạy học, còn câu hỏi Tự luận lại được dùng để đánh giá trình độ suy luận của sinh viên. Khi viết câu hỏi TNKQ cần lưu ý “Đáp án” là sự lựa chọn chính xác hoặc tốt nhất cho câu hỏi hoặc vấn đề mà bạn đưa ra, “Phương án nhiễu” là câu trả lời hợp lý (nhưng không chính xác) đối với câu hỏi hoặc vấn đề được nêu ra trong câu dẫn; còn đối với câu hỏi Tự luận chú ý cách đặt câu hỏi ở các mức độ tư duy. Khi viết xong câu hỏi cần đánh giá chất lượng câu hỏi trước khi đưa vào sử dụng. Đánh giá câu hỏi nên phối hợp cả hai phương pháp là đánh giá theo tiêu chí và đánh giá dựa vào thống kê. Đề kiểm tra là phương tiện đánh giá kết quả học tập của sinh viên sau khi học xong một chủ đề, một chương hay toàn bộ chương trình lớp học, cấp học. Xây dựng đề kiểm tra nên phối hợp cả hai phương pháp trắc nghiệm cổ điển và hiện đại, đặc biệt đánh giá đề kiểm tra cần dựa trên lý thuyết IRT. Bài viết cũng đề cập đến một số đề kiểm tra cho các loại hình đánh giá như đề kiểm tra đánh giá đầu vào, đánh giá quá trình và đánh giá tổng kết, đặc biệt có vai trò của Ngân hàng câu hỏi trong việc xây dựng đề kiểm tra. Tài liệu tham khảo [1]. Bộ Giáo dục và Đào tạo (2009), Sự phát triển của hệ thống giáo dục đại học, các giải pháp đảm bảo và nâng cao chất lượng đào tạo, Báo cáo số 760/BC-BGDĐT ngày 29/10/2009, Hà Nội. [2]. “VIETNAM READING AND MATHEMATICS ASSESSMENT STUDY”, World Bank inVietnam June 2004. [3]. Lâm Quang Thiệp (2010), “Đo lường trong giáo dục. Lý thuyết và ứng dụng”, trường Đại học Quốc gia Hà Nội. [4]. Lâm Quang Thiệp (2012) “Đo lường và đánh giá hoạt động học tập trong nhà trường”, NXB ĐH Sư phạm. [5]. ACER ConQuest Generalised Item Response Modelling Software 2007 THE INNOVATION WRITING ITEMS AND DEVELOPING TESTS Abstract: Modern teaching theory has shown that Educational Assessment of Student is an important component of the teaching process. Currently the world as well as in the country has researchs of Educational Assessment of Student, but the purpose of that documents is more theory than applies. Therefore, this article focuses on technical issues, using classical test theory and item response theory, propose some innovative solutions two most important stage of the process of Educational Assessment of Student, which are written items and elaborate test. Multiple-choise item sused to evaluatea large area of knowledge, dispersing and covering all their objectives, and essay items to be used to evaluate students' reasoning. When writing multiple-choise items, note"Correct answer" is the correct choice or best for item or issues that you brought up, "Distractors” area reason able answer (but not exactly) to with questions; also for essay items pay attention questions at levels of thinking. When written items to verify the quality of questions before.

Các file đính kèm theo tài liệu này:

doi_moi_viec_viet_cau_hoi_va_xay_dung_de_kiem_tra.pdf