Simulation comparison of standardization methods for interview scores

면접점수 표준화 방법 모의실험 비교

  • Received : 2011.01.23
  • Accepted : 2011.02.25
  • Published : 2011.03.31

Abstract

In this study, we perform a simulation study to compare frequently used standardization methods for interview scores based on trimmed mean, rank mean, and z-score mean. In this simulation study we assume that interviewer's score is influenced by a weighted average of true interviewee's true score and independent noise whose weight is determined by the professionality of the interviewer. In other words, as interviewer's professionality increases, the observed score becomes closer to the true score and if interviewer's professionality decreases, the observed score becomes closer to the noise instead of the true score. By adding interviewer's tendency bias to the weighed average, final interviewee's score is assumed to be observed. In this simulation, the interviewers's cores for each method are computed and then the method is considered best whose rank correlation between the method's scores and the true scores is highest. Simulation results show that when the true score is from normal distributions, z-score mean is best in general and when the true score is from Laplace distributions, z-score mean is better than rank mean in full interview system, where all interviewers meet all interviewees, and rank mean is better than z-score mean in half split interview system, where the interviewers meet only half of the interviewees. Trimmed mean is worst in general.

이 연구에서는 면접점수 표준화 방법으로 흔히 사용되고 있는 절사평균 방법, 순위평균 방법 및 z-점수평균 방법을 모의실험을 통해 비교하고자 한다. 모의실험 기법은 피면 접자의 참값 점수와 이것과 독립적인 잡음 변수가 심사자의 전문성에 의해 가중평균 형태로 심사자의 평가점수에 영향을 미친다고 가정한다. 다시 말해 심사자의 전문성이 커지면 개인의 참값 점수에 가까운 심사자의 점수가 관측되고, 심사자의 전문성이 작아지면 참값 점수 대신에 잡음 변수에 더 가까운 심사자의 점수가 관측된다. 여기에 심사자의 성향편의가 더해져 심사자의 최종 평가점수가 관측된다고 가정한다. 이 모의실험에서는 각 표준화 방법에 의한 심사자의 평균점수와 참값의 순위상관 값을 계산하여 이 값이 큰 방법을 좋은 방법으로 평가하였다. 그 결과 참값의 분포가 정규분포이면 z-점수평균이 가장 좋은 성능을 보였으며, 라플라스 분포이면 전체면접에서는 z-점수평균이 순위평균보다 다소 성능이 좋았으나 반분면접에서는 순위평균이 z-점수평균보다 다소 성능이 좋았다. 절사평균은 일반적으로 성능이 가장 낮게 나타났다.

Keywords

References

  1. 박성현, 김춘원, 박준오 (2000). 대학입시에서의 선택과목 점수 표준화에 관한 연구. <품질경영학회지>, 28, 124-132.
  2. 송필준, 김종태 (2010). 로지스틱함수모형과 비례이동평균모형에 의한 학생 수 추계와 분석. <한국데이터정보과학회지>, 21, 503-511.
  3. 윤용화, 김종태 (2010). 수도권 지역의 고3학생 수 예측과 대학입학정원수와 분석. <한국데이터정보과학회지>, 21, 523-534.
  4. 최승배, 강창완, 조장식 (2009). 웹 로그데이터를 이용한 대학입시 지원자 행태 분석. <한국데이터정보과학회지>, 20, 493-504.
  5. 최승배, 강창완, 조장식 (2011). 학과 홈페이지 평가지수 개발에 관한 연구. <한국데이터정보과학회지>, 22, 출간예정.
  6. 허명회 (1994). 새 대학입시의 통계적 계획과 분석 - 문항분석과 선택과목 등화(표준점수제)를 중심으로. <한국통계학회논문집>, 1, 215-225.
  7. 황형태 (2005). 대학수학능력시험에서 표준점수제의 개선방안에 대한 연구. <응용통계연구>, 18, 521-532.
  8. 황형태, 이강섭, 이장택 (2004). 대학입시에서의 면접점수 표준화에 관한 연구. <대한수학교육학회지 시리즈 A:수학교육>, 43, 309-314.
  9. Kendall, M. G. (1938). A new measure of rank correlation. Biometrika, 30, 81-93. https://doi.org/10.1093/biomet/30.1-2.81