성적과 통계학 (1)
게시글 주소: https://dev.orbi.kr/00067993601
평균이 50점이고 표준편차가 20점인 시험이 있다고 합시다.
그렇다면 이 시험에서 70점을 받은 학생은 일반적으로 3등급 후반이 된다는 사실을 아시나요?
이 시험에서 85점을 받으면 웬만하면 1등급이 됩니다. 물론 다 된다는건 아니고, 안되는 특이 케이스도 있기는 하지만 대부분은 1등급이 됩니다.
오늘은 이런 이야기를 한 번 해보려고 합니다.

수능이나 모의고사에서 표준점수는 응시자들의 성적을 적절하게 조작해서 평균과 표준편차를 일정하게 맞춘 점수입니다.
원점수가 100점 만점인 국어, 수학에서는 응시자들의 표준점수 평균이 100점, 표준편차가 20점이 되도록 맞추고,
원점수가 50점 만점인 탐구에서는 응시자들의 표준점수 평균이 50점, 표준편차가 10점이 되도록 맞춥니다.

표준점수의 평균이 100점이고 표준편차가 20점인 국어, 수학에서
표준점수가 100점이라는 것은 어떤 의미일까요? 표준점수의 평균이 100점이라고 했으니 그냥 딱 평균만큼 받았다는 의미입니다.
그렇다면 표준점수가 120점이라는 것은 어떤 의미일까요? 평균보다 1표준편차만큼 잘 봤다는 의미가 됩니다. 평균이 100점, 표준편차가 20점이니까 (평균) + 1×(표준편차)를 하면 딱 120이 되죠
마찬가지로 표준점수가 140점이면 평균보다 2표준편차만큼 잘 봤다는 의미가 되고
표준점수가 130점이면 평균보다 1.5표준편차만큼 잘 봤다는 의미가 됩니다.
이렇게 평균보다 몇 표준편차만큼 잘(못) 봤는지를 따지는게 이번 글 내용의 핵심이라고 할 수 있습니다.
그렇다면 이걸 왜 따지느냐? 이걸 따지면 나의 상대적 위치를 예측해볼 수 있기 때문입니다.
국어나 수학에서 표준점수 100점이면, 그러니까 딱 평균만큼 받았으면 몇 등급이 나올거라고 예상하시나요?

사실 이건 너무 쉽죠. 평균이라고 하면 보통 가운데 등급인 5등급이 연상되잖아요?
실제로 국어나 수학에서 표준점수 100점을 받으면 5등급이 나옵니다.
탐구에서도 마찬가지로 표준점수 50점을 받으면 일반적으로 5등급이 나옵니다.

그러면 처음에 소개했던 것처럼, 평균보다 1표준편차만큼 잘 본 경우에도 등급을 예측할 수 있을까요? 그러니까 국어나 수학에서는 표준점수가 120점, 탐구에서는 표준점수가 60점이라면 보통 몇 등급인지 예측할 수 있을까요?


복잡하게 생각할 것 없이 과거 사례들을 찾아보면 답이 나옵니다.
국어, 수학에서 표준점수 3등급컷은 보통 116 ~ 118에서 형성되는 경향이 있습니다. 작년 뿐만 아니라 그 전년도를 찾아봐도 마찬가지입니다. 3등급컷이 높게 나오면 119까지도 올라가긴 하지만 120을 넘어가는 시험은 거의 찾아보기 어렵습니다. 따라서 표준점수 120점이 나오면 매우 높은 확률로 3등급이 된다는 사실을 알 수 있습니다.
탐구 같은 경우에도 표준점수 60점이면 웬만하면 3등급이 됩니다. 그렇다고 모두 3등급이 된다는건 아니고, 다음과 같이 4등급으로 떨어지는 경우도 있습니다.

이거는 성적 분포 양상에 따라 차이가 있어서 그렇습니다. 평균보다 1표준편차만큼 잘 보면 무조건 3등급이 된다는 절대적인 법칙은 없어요. 하지만 작년 수능의 경우, 한국지리를 제외하면 표준점수 60점이면 모두 3등급이 되었습니다. 따라서 100%는 아니지만, 탐구 표준점수 60점도 높은 확률로 3등급이 된다는 사실을 알 수 있죠.
그렇다면 혹시 내신에서도, 평균과 표준편차만 가지고 나의 상대적인 위치를 파악할 수 있지 않을까요? 오늘 그걸 알아보기 위해 제가 대략 코딩을 해왔습니다.

먼저, 실제 내신 시험처럼 학생 수를 250명으로 가정하였습니다.
그리고 0부터 100까지의 정수를 학생 수만큼 랜덤으로 추출합니다. 학생 수가 250명이니까 250개를 추출하게 되겠군요. 이때 추출된 숫자가 각 학생의 시험 점수가 됩니다.
그리고 추출된 250개 점수의 평균과 표준편차를 구해서, (평균)+z×(표준편차)에 해당하는 학생이 몇 등급에 속하는지를 기록합니다. 이 과정을 10,000번 반복해서 최종적으로 이 학생이 몇 등급에 속할 확률이 가장 높은지 따져보는 것입니다.
먼저 z=0으로 했을 때의 결과입니다. 딱 평균만큼 받았을 때죠. (국어 수학 표준점수 100점, 탐구 표준점수 50점에 해당)
반복 횟수 10,000번에 대해서 10,000번 모두 5등급이 나왔습니다(등급 분포 양상의 왼쪽부터 1등급이 나온 횟수, 2등급이 나온 횟수, ...로 읽으시면 됩니다.). 평균적으로 상위 49.95%로 딱 중간 위치를 차지하고 있다는 것을 알 수 있네요
이번에는 z=1로 해보겠습니다.
예를 들어 원점수 평균이 52점이고 표준편차가 23점인 시험이 있다면, 52+23=75점을 받은 학생은 보통 몇 등급에 속하는지를 알아보려고 합니다. (국어 수학 표준점수 120점, 탐구 표준점수 60점에 해당)

반복 횟수 10,000번에 대해서 3등급이 나온 횟수는 9,183회이고, 4등급이 나온 횟수는 817회입니다.
그러니까 대부분은 3등급이 나오는데 운이 나쁘면 4등급으로 떨어질 수도 있는 것이네요
이렇게 z값을 변경시켜가며 각 z에 대해 응시자들의 등급이 어디에 해당할지 몇 가지 살펴봤습니다.
z=1.2일 때 (국어 수학 표준점수 124점, 탐구 표준점수 62점에 해당)
ex) 원점수 평균 52점, 표준편차 23점일 때, 52+1.2×23=79.6점은 보통 몇 등급에 해당되는가?

3등급일 확률이 가장 높다!
z=1.5일 때 (국어 수학 표준점수 130점, 탐구 표준점수 65점에 해당)
ex) 원점수 평균 52점, 표준편차 23점일 때, 52+1.5×23=86.5점은 보통 몇 등급에 해당되는가?

2등급일 확률이 가장 높다!
z=1.8일 때 (국어 수학 표준점수 136점, 탐구 표준점수 68점에 해당)
ex) 원점수 평균 52점, 표준편차 23점일 때, 52+1.8×23=93.4점은 보통 몇 등급에 해당되는가?

1등급일 확률이 가장 높다!
z=0.5일 때 (국어 수학 표준점수 110점, 탐구 표준점수 55점에 해당)
ex) 원점수 평균 52점, 표준편차 23점일 때, 52+0.5×23=63.5점은 보통 몇 등급에 해당되는가?
4등급일 확률이 가장 높다!
결과 자체는 꽤 일리 있어 보이게 나왔습니다.
그런데 사실 이렇게 점수를 완전 랜덤으로 추출하면 별로 마음에 들지 않는 분포가 나옵니다.
뭐가 마음에 들지 않을까요?
점수를 완전히 랜덤으로 추출했다는 것은, 0부터 100까지의 숫자가 나올 확률이 1/101씩으로 완전 동일하다는 의미입니다.
그러니까 거의
90점대 인원 = 80점대 인원 = 70점대 인원 = ... = 10점대 인원 = 한 자리수 인원
꼴로 인원 분포가 나온다는 것입니다.
그런데 이는 현실적인 성적 분포와 좀 동떨어져 있죠
보통 성적 분포라고 하면 90점대 인원보다 80점대 인원이 조금 더 많고, 80점대보다 70점대가 조금 더 많은 분포를 생각하지, 저렇게 각 점수대별 인원이 다 똑같을 거라고 생각하진 않죠.
실제로 저렇게 추출하면 표준편차가 거의 28~30으로 나오는데, 이것도 현실의 표준편차와 많이 동떨어져 있다고 할 수 있습니다.
따라서 다음 편에서는 확률 분포를 직접 커스터마이징해서 등급 분포 양상을 구해보도록 하겠습니다.
감사합니다.
0 XDK (+0)
유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.
-
마치 애니주인공처럼 달렸다 6 2
셔틀잡으러
-
아니 어째서 0 0
명예 센츄 없음?
-
야 나와봐 4 1
나랑 편의점 가자
-
ㅇㅈ 2 2
ㅇㅈ 오브 코리아
-
여러분들은좋아하는수있으신가요 16 3
저는 28을 좋아함요
-
노베로 시작해서 어제 더프 공통 3점은 다맞고 11번 13번 맞았는데 오늘 작년...
-
조리병보고 꿀이라고 하는새끼들 12 1
다 그대로 튀김기앞에 세워놓고싶다 진심으로인간혐오옴
-
무물보 받아요 4 0
공부 ㄹㅈㄷ로 안하고 놀기만 함여
-
맨날 소우타 아니면 켄쨩이야
-
물리 실모에서 많이 보이는 수 0 1
바로 23 19,20번 역에보에서 h로 많이 본 거 같음
-
나 세미 센츄임 5 3
인정해주삼
-
오르비언들 다 기만자임 20 3
나만아싸고다알고보니친구한명씩은있더라..
-
이름이뭐에요? 어느과에요? mbti뭐에요? 고향이어디에요? 시발 이런거...
-
근데 님들아 센츄 교육청 기준이 머임 10 1
궁금함
-
ㄹㅈㄷ 공하싫 1 0
수학 문제 생긴 꼬라지가 ㅈ같이 생겨서 공부 안하고 싶음
-
화학 좀 ㅈㅂ 0 1
도와주세요 내신인데 m,n 갑을 못 구하겠어여 식 조작 ㅈㄴ 해야될 거 같은데
-
어떻겍 역이름이 똥꾸릉 3 1
엥
-
고민되는데 0 0
수학 라이브를 계속 들을까요?? 강기원쌤 듣는한데 엔제 풀다가 서바때나 들어갈까요?
-
인서울 못할거같다 18 2
최근에 한 생각이다
-
망갤테스트 6 1
-
과팅 2개 잡았음 나 7 0
아니근데 두개다서울임 우리학교내에서 잡고싶었는데 ㄹㅇ 순식간에 마감됨
-
김승리t 커리 1 0
Tim나 그 다음 커리부터 들을까 생각중이었는데 작수 2등급이면 어떤거부터 들으면 될까요??
-
3덮 사문이 쉬웠던거임? 2 0
왜 다쉽다하노 턱턱 막히던데 국수영만 해서 그런가 작년 6,9,11 112고 작년에...
-
아 인증해야겠다 3 0
.
-
내글에시발왜이리댓글이안달려 8 0
아오
-
진짜 개 그지같네 3 0
2505 왤케 어렵냐....
-
인증 몇개 보니까 그냥 기만질하는 거임..
-
본인 책상 근황 0 0
개판 5분전임
-
섭웨이 잠봉 낫벧 4 0
잠봉플러스 화이트 아메치즈 피클 양파 양상추 올리브 피망 틈메이러 렌치 허니머스타드 후추 더블초코칩
-
옵붕이들 인증하면 약간 괴리감듦 10 0
얘네가 실존하는 사람이란건 알지만 계속 오댕이임티 이런거 쓰다보니 오댕이 이미지가...
-
영어를 십몇년동안 했더니 0 1
문법이 체화가 돼버려서 설명을 못하겠음
-
정법 표점 4 1
아니 정법 고려중인데 표점 언급이 왤케많음? 그렇게창남? 수능날 변수 젤 적을거같은데 고민되네
-
수학 ㄹㅈㄷ로 안풀림 1 2
N제 첫번째 문제부터 안풀려서 답지봄 ㅂㅅ 등장!
-
세트사이 휴식시간 추천받음 15 0
병약추소년이라 운동루ㅜ틴 짜기힘드네
-
허들링 난이도 4 1
26 허들링(인강) 난이도 어느정도임?
-
루트안에 이차방정식 이거 삼각치환 말구 어케추는거였죠? 2 0
뭐 있었는데 까머긂,,,, 도형이었나
-
우우래우우래 2 0
쌍윤이 우우래
-
슈타게 극장판 짱 재밌당 1 1
-
우우 8 1
우
-
오르비 똥테 이상만 받는 학원 2 0
만들면 개재밌을거같음ㅋㅋㅋㅋ
-
다음생은 말로 태어나ㆍ서 .. 3 2
저 넓은ㄴ 초원을 뛰어보고싶ㅂ구나 ..
-
조언부탁드려요 5 0
그냥 아무 조언이나 해 주세요,,
-
예아 안될거 뭐있노
-
어떻게 된 일인지 답변이 안 달리네 ㅋㅋㅋ
-
수학 모의고사 풀 거 ㅊㅊ 좀 1 1
3모 대비로 수학 풀거 ㅊㅊ좀 2503은 이미 풂
-
고생했더니 치킨마렵노 14 0
이걸먹어말어
-
끝나고 직접 프린트해서 푸는 방법밖에 없는 건가요? 아님 어떻게... 신청해서 보는...
-
배부른데 치킨시킴 13 0
ㅁㅌㅊ?
-
몬스터 신상 먹엇음 14 3
처음에는 아무맛도 안 나는 줄 알앗는데 계속 먹어보니까 맛이 나긴 함 토레타맛 나 흠…
-
이걸해야먹고살수가있는게 고2 고1은 이게 통합과학 시대라
Sexual & statistics
그 성적 아니고...
개재미따