Tiến sĩ Sái Công Hồng: Thi đánh giá năng lực sẽ ổn định, tin cậy, phân loại cao

Giáo dục 24h

Thùy Linh

(GDVN) - Kết quả cho thấy, các hợp phần của bài thi đánh giá năng lực có khả năng phân loại rất tốt.

LTS: Kỳ thi Đánh giá năng lực của Đại học Quốc gia Hà Nội đã được tổ chức thí điểm từ năm 2014, trong đó có 2 năm thực hiện đánh giá trên diện rộng với số lượng gần 65.000 lượt thí sinh năm 2015 và gần 85.000 lượt thí sinh dự thi năm 2016.

Vừa qua, Trung tâm Khảo thí Đại học Quốc gia Hà Nội đã tiến hành phân tích, đối sánh kết quả thi của các năm và đánh giá tương quan giữa điểm thi đánh giá năng lực với điểm thi Trung học Phổ thông Quốc gia và kết quả học tập năm lớp 12 với mẫu khảo sát khoảng 1.600 sinh viên đã trúng tuyển vào một số trường Đại học thành viên và khoa trực thuộc của Đại học Quốc gia Hà Nội.

Để bạn đọc hiểu rõ hơn về kết quả phân tích này, Báo điện tử giáo dục Việt Nam có cuộc trao đổi với Tiến sĩ Sái Công Hồng (Giám đốc Trung tâm khảo thí Đại học Quốc gia Hà Nội).

Tòa soạn trân trọng gửi đến độc giả!

PV: Được biết, kỳ thi đánh giá năng lực của Đại học Quốc gia Hà Nội có thể sẽ còn được nhân rộng hơn nữa vì tính khả thi và trách nhiệm xã hội của kỳ thi này mang lại.

Là người đứng đầu trung tâm khảo thí, ông đánh giá như thế nào về kỳ thi đánh giá năng lực qua quá trình phân tích kết quả bài thi sau 2 năm áp dụng?

Tiến sĩ Sái Công Hồng: Kết quả phân tích tổng điểm bài thi đánh giá năng lực năm 2015 và năm 2016 cho thấy phổ điểm bài thi đánh giá năng lực năm 2015 và năm 2016 không có sự khác biệt, phổ điểm của cả hai năm đều có phân bố chuẩn, cân đối cả hai phía.

Điều này khẳng định với các câu hỏi thi và đề thi được chuẩn hóa theo quy trình khảo thí hiện đại có độ tin cậy và độ phân biệt cao, tính giá trị hay nói cách khác khả năng đo năng lực của các câu hỏi thi là không đổi theo năng lực của người trả lời câu hỏi.

Điều này được thể hiện trong phân tích, đối sánh phổ điểm của bài thi đánh giá năng lực năm 2015 so với năm 2016 vừa qua của Đại học Quốc gia Hà Nội dưới đây:

 

Từ phổ điểm ở hình 1 cho thấy:

Năm 2015: điểm trung bình là 76,60 với độ lệch chuẩn là 14,586.

Năm 2016: điểm trung bình là 75,21 với độ lệch chuẩn là 13,936.

Như vậy, độ biến thiên của điểm thi năm 2016 gần như là không thay đổi so với năm 2015 (18,88% năm 2015 và 18,5% năm 2016). Hay nói cách khác, bài thi đánh giá năng lực đã được chuẩn hóa, có mức độ phân hóa tốt.

Để khẳng định chắc chắn cho các luận điểm này chúng tôi tiếp tục phân tích, so sánh, đánh giá kết quả thi của các từng hợp phần của bài thi đánh giá năng lực là Toán, Ngữ văn, Khoa học Tự nhiên và Khoa học Xã hội của các thí sinh tham dự thi năm 2015, 2016.

Kết quả cho thấy tính ổn định, phân loại, của các hợp phần qua 2 năm hoàn toàn tương đồng nhau và có thể khẳng định các hợp phần của bài thi đánh giá năng lực có khả năng phân loại rất tốt.

Điều này được minh họa trong hình 2, 3, 4 dưới đây:

(Nguồn: Phân tích kết quả thi đánh giá năng lực của Đại học Quốc gia Hà Nội).
(Nguồn: Phân tích kết quả thi đánh giá năng lực của Đại học Quốc gia Hà Nội).

Đặc biệt khi chúng tôi tiến hành phân tích, so sánh chi tiết điểm trung bình và độ lệch chuẩn của các phần Toán, Ngữ văn, Khoa học Tự nhiên và Khoa học Xã hội trong 2 năm 2015 và 2016 thì sự tương đương về kết quả của hai thông số này gần như không đổi.

Điều này được minh họa trong biểu đồ so sánh ở hình 5 dưới đây:


Với phân tích sâu này kết hợp với phân tích tổng thể bài thi đánh giá năng lực, có thể khẳng định bài thi đánh giá năng lực đã đo đúng được năng lực của các thí sinh tham gia dự thi và có tính ổn định rất cao với toàn bài thi và từng hợp phần của bài thi.

PV: Qua quá trình phân tích kết quả dữ liệu, ông có đánh giá gì về tương quan giữa điểm thi đánh giá năng lực và điểm thi Trung học Phổ thông Quốc gia?

Tiến sĩ Sái Công Hồng: Năm 2015, chúng tôi đã tiến hành khảo sát khoảng 1.600 sinh viên đã trúng tuyển vào một số trường Đại học thành viên và khoa trực thuộc của Đại học Quốc gia Hà Nội để đánh giá tương quan giữa điểm thi đánh giá năng lực đánh giá năng lực với điểm thi Trung học Phổ thông Quốc gia và kết quả học tập năm lớp 12.

Phân tích phổ điểm cho thấy điểm bài thi đánh giá năng lực và điểm thi Trung học Phổ thông Quốc gia tổng hợp ba môn theo khối đều khá gần đường cong chuẩn (phân phối hình chuông theo Hình 6), nhưng phổ điểm bài thi đánh giá năng lực có độ phân tán cao, trong khi phổ điểm thi Trung học Phổ thông Quốc gia có độ chụm cao.


Phân tích tương quan giữa kết quả thi đánh giá năng lực và kết quả tổng hợp 3 môn thi theo khối của số sinh viên được khảo sát có kết quả như sau:

 

Tổng điểm bài thi đánh giá năng lực

Tổng 3 môn tốt nghiệp

Tổng điểm bài thi đánh giá năng lực

Hệ số Pearson

1

0,545**

Mức ý nghĩa

 

0,00

 

 

 

Tổng 3 môn tốt nghiệp

Hệ số Pearson

0,545**

1

Mức ý nghĩa

0,00

 

 

 

 

**. Hệ số có ý nghĩa ở mức 0.01.

Bảng 1: Tương quan giữa điểm thi đánh giá năng lực và điểm thi Trung học Phổ thông Quốc gia.

Kết quả phân tích trong Bảng 1 cho thấy có mối tương quan ở mức trung bình giữa điểm thi đánh giá năng lực và điểm thi Trung học Phổ thông Quốc gia. Mức ý nghĩa cho thấy: sinh viên có điểm thi đánh giá năng lực cao thì có điểm thi Trung học Phổ thông (tổ hợp ba môn theo khối) cũng cao.

Tuy nhiên chưa thể suy theo chiều ngược lại, do đó vẫn có  sinh viên đạt điểm thi Trung học Phổ thông (tổ hợp ba môn theo khối) cao nhưng điểm thi đánh giá năng lực chưa cao.

Kết quả này có thể do bài thi đánh giá năng lực cần một kiến thức tổng hợp hơn so với việc thi theo khối thi truyền thống của thí sinh.

Tuy nhiên, nếu so sánh tương quan giữa từng phần thi với điểm thi tương ứng: điểm thi so với điểm môn Toán của thí sinh trong kỳ thi Trung học Phổ thông Quốc gia thì thấy đói với điểm thi  đánh giá năng lực phần Toán có độ biến thiên cao hơn một chút so với điểm thi Trung học Phổ thông Quốc gia môn Toán (23% so với 18%).

Tương tự như vậy, điểm thi đánh giá năng lực phần Ngữ văn và điểm thi Trung học Phổ thông môn Văn có độ biến thiên khá tương đương (22% so với 20%) và điểm thi đánh giá năng lực phần tự chọn và điểm thi Trung học Phổ thông các môn tự chọn có độ biến thiên khá tương đương (16% so với 15%).

 

PV: Vậy còn tương quan giữa điểm thi đánh giá năng lực so với kết quả học tập lớp 12 thì sao, thưa ông?

Tiến sĩ Sái Công Hồng: Cũng theo kết quả khảo sát điểm trung bình cả năm học lớp 12 của nhóm sinh viên được chọn chúng tôi thấy: Hầu hết các sinh viên đạt điểm thi đánh giá năng lực từ 70 điểm trở lên đều có kết quả học tập năm học từ mức trung bình trở lên (6,0).

Những sinh viên ở trong nhóm khoảng điểm thi đánh giá năng lực từ 90 điểm trở lên đều có kết quả học tập trung bình ở mức giỏi (từ 8,0 trở lên).

Như vậy bài thi đánh giá năng lực phản ánh đúng năng lực của các sinh viên khi học tập ở bậc phổ thông (hình 9).


Còn đi phân tích chi tiết theo từng phần thi bài thi đánh giá năng lực và kết quả học tập lớp 12 ở các môn tương ứng, kết quả cho thấy:

(i) Đối với môn Toán: kết quả học tập trung bình môn Toán của khối tự nhiên là 8,79 lớn hơn kết quả học tập trung bình của khối xã hội (8,26). Điều này dẫn tới việc, sinh viên có kết quả học môn Toán cao thì điểm thi đánh giá năng lực phần Toán cao.

Khối tự nhiên có kết quả học tập môn Toán cao hơn khối xã hội thì điểm thi đánh giá năng lực phần toán của khối tự nhiên cũng cao hơn khối xã hội;

(ii) Đối với môn Ngữ văn: điểm thi đánh giá năng lực phần Ngữ văn cũng như kết quả học tập môn Văn của khối tự nhiên thấp hơn của khối xã hội tuy nhiên, độ chênh lệch điểm giữa hai khối này không quá lớn.

Điều đó khẳng định đúng tính chất của bài thi đánh giá năng lực là đánh giá về mặt tư duy, tính toàn diện chứ không đơn thuần chỉ là kiểm tra kiến thức;

(iii) Đối với phần thi tự chọn: kết quả kiểm định tương quan cho thấy điểm thi đánh giá năng lực phần tự chọn có mối quan hệ không chặt chẽ với kết quả học tập tổng hợp 3 môn theo khối.

Sinh viên có điểm thi đánh giá năng lực phần tự chọn cao chưa chắc đã có kết quả học tập cao, ngược lại, sinh viên có điểm thi đánh giá năng lực thấp cũng chưa phải đều có kết quả học tập kém.

Điều này, cần được nghiên cứu chi tiết để giải thích tính tương quan chưa chặt này (Bảng 2).

Khối

Điểm đánh giá năng lực

phần Toán

Kết quả học tập môn Toán

Điểm đánh giá năng lực

phần Văn

Kết quả học tập môn Văn

Điểm thi đánh giá năng lực phần Khoa học Tự nhiên

Kết quả học tập 03 môn theo Khoa học Tự nhiên

Điểm thi đánh giá năng lực phần Khoa học Nhân văn

Kết quả học tập 03 môn theo Khoa học Nhân văn

Tự nhiên

Điểm TB

36,06

8,79

34,27

7,53

 

 

 

 

Độ lệch chuẩn

5,81

0,63

3,70

0,71

 

 

 

 

Xã hội

Điểm TB

27,65

8,26

35,91

7,94

 

 

 

 

Độ lệch chuẩn

7,81

0,82

3,31

0,68

 

 

 

 

Tổng

Điểm TB

33,04

8,6

34,86

7,68

24,75

8.47

23.22

8.26

Độ lệch chuẩn

7,73

0,75

3,65

0,73

4.81

0.69

4.18

0.60

Bảng 2: So sánh kết quả thi đánh giá năng lực các phần với điểm thi trung bình các môn học lớp 12

(Nguồn: Sái Công Hồng - Đánh giá tương quan giữa điểm thi đánh giá năng lực và kết quả học tập lớp 12; Tạp chí Khoa học giáo dục 131 (2016))

PV: Tóm tắt ngắn gọn những ưu điểm của kỳ thi đánh giá năng lực để chứng tỏ nó phù hợp các kỳ thi trên diện rộng thì ông sẽ nói gì?

Tiến sĩ Sái Công Hồng: Từ kết quả phân tích chúng tôi có một số đánh giá chung như sau:

Một là, bài thi đánh giá năng lực có tính ổn định về độ tin cậy, độ giá trị và khả năng phân loại cao trong việc tổ chức tổ chức thi diện rộng. Đặc biệt, là tổ chức rất gọn nhẹ và hiệu quả về mặt kinh tế cho cả đơn vị tổ chức, gia đình thí sinh và xã hội.

Hai là, bài thi đánh giá năng lực có mối tương quan với kết quả học tập lớp 12 và điểm thi Trung học Phổ thông Quốc gia. Đặc biệt khi đi phân tích các hợp phần Toán, Ngữ văn và tự chọn đều có thể đánh giá phân loại được các thí sinh tương đối tốt.

Ba là, hình thức thi đánh giá năng lực không những thuận lợi cho thí sinh mà còn đánh giá toàn diện năng lực của thí sinh, tránh hiện tượng học lệch, học tủ, đảm bảo công bằng khách quan nhất trong các hình thức đánh giá hiện nay.

Bốn là, hình thức thi phù hợp với những kỳ thi trên diện rộng, vừa tiết kiệm, đơn giản mà vẫn đảm bảo đánh giá được đầy đủ, chính xác năng lực người thi. Đặc biệt, việc ứng dụng công nghệ thông tin trong kiểm tra đánh giá là xu hướng phát triển của khoa học đo lường và đánh giá trên thế giới.

Xin trân trọng cảm ơn Tiến sĩ Sái Công Hồng!

Thùy Linh
Từ khóa :
đánh giá năng lực , bài thi năng lực , giáo dục , kiểm tra , đánh giá
Tiến sĩ Sái Công Hồng: Thi đánh giá năng lực sẽ ổn định, tin cậy, phân loại cao
Chủ đề : Đổi mới giáo dục phổ thông
Chủ đề : Đổi mới giáo dục Đại học
Bình luận
"BÀN LUẬN 5"
21

Xin chào bạn Thắng GV và bạn Dung Toán, xin thưa với các bạn rằng - Báo điện tử GDVN cũng như các báo khác của CHÚNG TA là công cụ truyền thông nghiêm túc, mang tính xây dựng, góp ý, kể cả mục "THẢO LUẬN" dành cho các độc giả. Vì vậy, mong các bạn nên bình tĩnh và thận trọng khi đưa ra lời bình luận của mình. Nếu cần, các bạn có thể đề nghị Báo GDVN đứng ra làm trung gian, chúng ta sẽ cùng thảo luận công khai, minh bạch vấn đề này sao cho mọi độc giả thấy đó là xây dựng, góp ý CÓ TÍNH GIÁO DỤC và chấp nhận được. Trân trọng cảm ơn.

"BÀN LUẬN 4"
27

Bạn Dương Anh thân mến, chắc bạn còn trẻ, vì thấy giới thiệu đang làm NCS ở Úc, do vậy “BÀN LUẬN 4” xin mạo muội được “BÀN LUẬN” về một số ý kiến của bạn như sau: 1/Một nhà khoa học giỏi, có kinh nghiệm, ngoài nhiệm vụ phải có được những công trình NCKH có giá trị học thuật, có hiệu quả kinh tế, còn phải có khả năng chuyển tải được nội dung chính công trình NCKH của mình đến tận người dân với trình độ TN THPT, kể cả đang ở cấp học THPT cũng có thể hiểu được (thì mới ĐẠT YÊU CẦU); nhất là công trình NCKH cụ thể liên quan đến phân tích, xử lý “điểm, phổ điểm” của kỳ thi QG này, mà bạn lại “cho là khi đưa ra công chúng trả lời dân dã về Khoa học là rất khó” - thì chưa ổn đâu. Bởi vì công chúng “phổ thông” không cần biết chi tiết việc “học chuyên sâu về phân tích đề thi” của bạn là gì, nhưng mọi người cần biết kết quả NCS “chuyên sâu” của bạn có ý nghĩa gì, sẽ giải quyết được những nội dung cụ thể gì khi “phân tích đề thi” (ví dụ: phân tích kết quả thi TN THPT QG của hơn 1 triệu TS (2015) và gần 9 trăm nghìn TS (2016))? 2/Bạn đã thừa nhận: “tác giả chỉ chọn mẫu là 1.600 SV đã đỗ vào ĐHQGHN thôi …”, và “Đấy là giới hạn nghiên cứu của họ.”, nhưng 4 kết luận của thầy Hồng đưa ra ở cuối bài viết chưa chặt chẽ, dễ làm cho mọi độc giả ngộ nhận có thể đem những kết luận này ra ứng dụng trên “diện rộng” là chưa nên! 3/Về “độ biến thiên …”, tôi đã giải thích ở các bàn luận trước và nói rõ ở “BÀN LUẬN 3” rồi. Trân trọng cảm ơn.

"BÀN LUẬN 4"
27

Bạn Dương Anh thân mến, chắc bạn còn trẻ, vì thấy giới thiệu đang làm NCS ở Úc, do vậy “BÀN LUẬN 4” xin mạo muội được “BÀN LUẬN” về một số ý kiến của bạn như sau: 1/Một nhà khoa học giỏi, có kinh nghiệm, ngoài nhiệm vụ phải có được những công trình NCKH có giá trị học thuật, có hiệu quả kinh tế, còn phải có khả năng chuyển tải được nội dung chính công trình NCKH của mình đến tận người dân với trình độ TN THPT, kể cả đang ở cấp học THPT cũng có thể hiểu được (thì mới ĐẠT YÊU CẦU); nhất là công trình NCKH cụ thể liên quan đến phân tích, xử lý “điểm, phổ điểm” của kỳ thi QG này, mà bạn lại “cho là khi đưa ra công chúng trả lời dân dã về Khoa học là rất khó” - thì chưa ổn đâu. Bởi vì công chúng “phổ thông” không cần biết chi tiết việc “học chuyên sâu về phân tích đề thi” của bạn là gì, nhưng mọi người cần biết kết quả NCS “chuyên sâu” của bạn có ý nghĩa gì, sẽ giải quyết được những nội dung cụ thể gì khi “phân tích đề thi” (ví dụ: phân tích kết quả thi TN THPT QG của hơn 1 triệu TS (2015) và gần 9 trăm nghìn TS (2016))? 2/Bạn đã thừa nhận: “tác giả chỉ chọn mẫu là 1.600 SV đã đỗ vào ĐHQGHN thôi …”, và “Đấy là giới hạn nghiên cứu của họ.”, nhưng 4 kết luận của thầy Hồng đưa ra ở cuối bài viết chưa chặt chẽ, dễ làm cho mọi độc giả ngộ nhận có thể đem những kết luận này ra ứng dụng trên “diện rộng” là chưa nên! 3/Về “độ biến thiên …”, tôi đã giải thích ở các bàn luận trước và nói rõ ở “BÀN LUẬN 3” rồi. Trân trọng cảm ơn.

Thắng GV
2

Bàn luận và Hoài Thanh và tất cả các bạn đều xa đà quá. đọc phần đề dẫn là hiểu. Họ phân tích bài thi đánh giá năng lực của họ thì khảo sát phổ điểm cả nước làm gì. Họ đề xuất bài thi của họ có thể đánh giá trên diện rộng, thi mấy năm thấy xã hội giảm áp lực, không tiêu cực được thi trên máy tính mà! Còn trao đổi Khoa học mà tốt lên thì tốt quá, cứ đọc kỹ và ngẫm. Bàn với chả luận.

Dung Toán
2

Ơi Trời, Tranh luận là tốt nhưng đọc kỹ hãy tranh luận các bạn ơi. Ở đây người ta chỉ khảo sát để biết bài thi đánh giá có phân loại được không, ổn định không, còn với 1 triệu thí sinh người ta có nghiên cứu đâu. ĐÚNG LÀ ÔNG NÓI GÀ BÀ NÓI VỊT. Còn các Bạn chưa rõ thì trao đổi trực tiếp với tác giả ấy, tranh luận ở đây công chúng bọn tôi chả thấy có ích gì. Hãy đi tìm tạp chí mà tranh luận

"BÀN LUẬN 3"
26

Cảm ơn bạn Hoài Thanh đã có lời giải thích. Tuy nhiên, để thấy được đầy đủ nội dung “BÀN LUẬN” của tôi, mong bạn ĐỌC KỸ lại 2 “BÀN LUẬN” đã có trước “BÀN LUẬN 3” này; đồng thời trả lời chính xác giúp tôi 2 câu hỏi còn băn khoăn, chưa đủ độ tin cậy, và còn nghi ngờ (đã nêu ở đề dẫn “BÀN LUẬN” trước của tôi)?. Nhân đây, tôi muốn nhấn mạnh mấy ý sau, để bạn tham khảo nhé: 1/Muốn có được nhận xét, kết luận (bài học) không xa rời thực tế, cũng như đưa ra được những đề xuất khách quan áp dụng cho Kỳ thi THPT QG 2017 tới, chỉ mong thầy Hồng căn cứ vào kết quả (điểm, phổ điểm) các môn thi của 2 năm 2015 và 2016 để nghiên cứu, phân tích và xử lý. Vì các phổ điểm trên hình 1, cho dù là của 65.000 TS (2015) và 85.000 TS (2016), nhưng sẽ HOÀN TOÀN KHÁC phổ điểm của hơn 1 triệu TS (2015) và gần 9 trăm nghìn TS (2016) bạn ạ! Như vậy, trong phạm vi cả nước, phải nghiên cứu, phân tích những phổ điểm này (với số liệu đã có sẵn rồi), mới là phương pháp NCKH đúng. 2/Về “độ biến thiên …”, bạn vẫn chưa hiểu ý của tôi, như sau: nếu bạn phóng to hình 8 lên, sẽ thấy ngay các số liệu (của thầy Hồng đưa ra) về độ biến thiên của môn Toán: “23% so với 18%”, môn Văn: “22% so với 20%”, và môn tự chọn: “16% so với 15%” - là không đúng với từng biểu đồ, cho dù những biểu đồ này không đòi hỏi phải vẽ đạt đến độ chính xác cao (tôi không hỏi cách tính toán ra các giá trị (%) này). Trân trọng cảm ơn.

Duong Anh
5

Kính cảm ơn báo giáo dục Việt Nam đã cho đăng bài này. Tôi đang học chuyên sâu về phân tích đề thi tại Úc được vài năm của chương trình NCS về giáo dục, tôi cho là khi đưa ra công chúng trả lời dân dã về Khoa học là rất khó, nhưng tôi tin các nhà Toán học, thống kê và những người liên quan đến thống kê rất hiểu phân tích này. Trân trọng cảm ơn

Duong Anh
5

@ Bàn luận: Tôi cũng là người đọc báo như bạn, cũng bình luận như nhau thôi. Khoa học Đo lường và Đánh giá sẽ chứng minh điều đó. Còn bạn muốn trao đổi với Thầy Hồng thì là quyền của bạn mà. Có ai cấm đâu, nhưng cá nhân tôi nghiên cứu về vấn đề này tôi thấy đây là một nghiên cứu nghiêm túc. Khi đã đăng trên các tạp chí khoa học sẽ trải qua quy trình phản biện. Vậy toi cũng chỉ xin trao đổi thêm với bạn một điểm nhỏ ở đây thôi: Nếu bạn là người quan tâm đến lĩnh vực này thì nên hiểu bài này tác giả chỉ chọn mẫu là 1.600 SV đã đỗ vào ĐHQGHN thôi vì thế đâu có mấy ngàn điểm liệt nhe bạn nói nữa. Và hoi chỉ so sánh tương quan giữa nhóm này ở điểm thi ĐGNL và điểm thi THPT QG theo khối thi và điểm học tập lớp 12 của nhóm này. Đấy là giới hạn nghiên cứu của họ. Tôi nghĩ đã bàn luận được nhe bạn thì không thể không hiểu điều này. Còn thuật ngữ độ biến thiên tính bằng độ lệch chuẩn chia cho giá trị trung bình có lẽ những người học thống kê đơn giản cũng hiểu mà bạn. ĐỪNG NÊN CỐ TÌNH KHÔNG HIỂU vậy bạn ơn. Cá nhân tôi mong có các công bố công khai như thế này cho minh bạch. Cám ơn báo giáo dục và tôi chỉ tranh luận đến vậy và cũng coi mình là người nghiên cứu khoa học chân chính.

Xem thêm bình luận
Tin khác