표본카운팅을 통한 표본분석
게시글 주소: https://dev.orbi.kr/00041517116
안녕하세요. 너무나 많은 분이 쪽지로표본분석 방법에 대해 여쭤보셔서 고민을 거듭하다 이렇게 글을 씁니다. 표본분석이란 정해진 공식이 아니며, 표본카운팅을 통한 방법은 결과론적인 요소가 많이 작용하기 때문에 글을 쓰는 게 맞나 고민이 많았습니다. 개인적으로 여러 요소가 한 방향을 가리킬 때 원서 접수를 권유하는데, 표본카운팅은 이런 요소 중 하나에 불과합니다. 많은 분이 매년 질문을 하시는 방법인 만큼 표본카운팅의 오차를 줄이는 방법을 연구해 왔고 지금도 연구 중이지만 아직 정확한 답을 내리지 못했습니다. 이에 저의 글을 수많은 의견 중 하나라고 생각해주시고, 도움 되는 부분만 참고하시길 바랍니다.
표본카운팅은 말 그대로 내가 지원할 학교의표본을 직접 카운팅 하는 겁니다. 표본의 이탈을 어느 정도 감수할 수 있다면 나보다 점수가 낮은 경쟁자도 세는 것이 좋겠지만, 대부분은표본이탈을 감당하기 힘듭니다. 따라서 나보다 상위의 경쟁자를 세고, 이들이 지원하는 다른 학교의 합격 가능성과 합격할 때 다른 학교로 빠질지에 대한 판단이 필요합니다.
1. 표본이탈에 대한 오차를 어떻게 커버할 것인가 (=어떻게 모집단에 대한 신뢰도를 높일 것인가)
ex) 한 번이라도 들어온표본을 실제 지원까지 고려할 것인가?
표본조사에 참여하지 않는 실제 지원자를 어떻게 고려할 것인가?
가장 핵심이지만 동시에 가장 어려운 부분입니다. 표본의 데이터와 모수의 데이터의 오차 수준을 알고 있다면 오차 수준만큼 비슷한 수치를 통해 이를 바로잡는 것도 한 방법이 될 수 있습니다. 그래서 같은 학교 같은 과를 재도전하는 n 수생이 유리한 부분이 존재합니다.
저는 구간에서표본의 이탈성이 어느 정도인지 파악하고 그 비율을 모수를 추정할 때 사용해왔습니다만 이 역시 오차가 나는 경우가 더러 있었습니다. 한 곳을 꾸준히 지켜봐 온 사람보다 오차를 잘 줄일 수 있는 사람은 없습니다. 달리 말하면, 제가 10개의 학교를 분석하면 10개의 학교마다 다르게 오차를 잡겠다는 얘기입니다. 정해진 수치가 없으니 소신대로 진행하세요. 통계학을 공부하며 이 부분에 대한 고민을 많이 해봤지만, 특정 수치를 규정하여 제시해 드리기 굉장히 조심스러운 부분입니다. 직접표본을 세면서 설정하는 것이 좋다고 생각합니다.
2. 상위 경쟁자의 타 학교 합격 가능성과 선택 여부를 어떻게 판단할 것인가.
상대적입니다. 안정 소신 스나냐에 따라 다르고, 자칫하면 수십 개의 학교에 대한 커트라인을 추정해야 할 수도 있습니다. 보수적으로 추정한다면 ( 스나가 아닌 경우) 애매하면 경쟁자가 다른 학교에 떨어진다고 판단하면 될 것이며 스나를 노리면 애매할 경우 몇%까지 경쟁자를 다른 학교 합격으로 분류할지 판단하시면 됩니다. 이게 자칫하면 모든 경쟁자를 다른 학교에 합격시켜 버리고 본인이 추합으로 노리는 곳에 합격하는 망상에 빠질 수 있습니다. 상대성 속에 객관성을 유지하시길 바랍니다. ( 개인적으로 오차가 가장 많이 발생하는 부분이라 생각하여 애매하면 떨어진다고 분류합니다.)
또한, 상위 경쟁자가 다른 학교와 내 예비학교에 동시 합격 시 어디를 갈 것인지에 대한 판단은 상식을 따르시면 됩니다.
(모르시겠으면 투표 글 올려보세요. 가끔 말도 안 되는 선택을 한다고 가정하시는 분들이 있습니다)
3. 애초에 표본카운팅이 의미가 있는가?
모수를 추정하기 위한 최소한의표본크기가 설정되어야 합니다. 문제는표본카운팅시 허수의 유입이 많다는 건데 이 때문에 저는 고립된 구간이 아니면표본카운팅을 실시하지 않는 편입니다. (고립된 구간에 대한 설명은 작년 저의 "고립된 구간에서의표본카운팅"이라는 글을 참조하시면 도움이 되실 겁니다. 글의 마지막에 링크를 남기겠습니다 ) 고립되지 않은 구간에서의표본카운팅은 오차의 범위가 너무 넓어서 추천해 드리진 않지만, 본인이 이 오차 구간을 줄일 자신이 있다면 도전해 보시길 바랍니다.
표본카운팅에 대해 비관적 어투가 가득하지만, 표본카운팅을 통한 과정에서 얻을 수 있는 유의미한 정보가 분명 존재합니다. 대표적으로 층에 대한 거시적 그림입니다. 머리, 허리, 꼬리 등의 층의 상황을 어느 정도 예상 할 수 있는데, 추합 막바지에 사람이 확 빠져서 꼬리가 털리는 펑크 (이러면 10명이 붙는다 치면 1~8등까지 점수가 촘촘하다가 9, 10등 점수가 훅 떨어집니다) 허리가 너무 촘촘하여 꼬리까지 내려가지 않는 폭 등표본이 어느 층에 몰리고 있으며 반대로 어느 층에서 비는 구간이 생기는지 거시적으로 예상할 수 있습니다.
특히 대형과의 경우 허리층의 촘촘한 정도가 꼬리까지 영향을 주기 때문에 표본이탈에 따른 모수 추정 오류가 많다 하더라도 그 과정에서 대략적인 감을 잡으실수 있을겁니다. 또한 백분위 대비 표점 차이가 많이 벌어지는 구간에서 (일반적인 불수능.ex) 만점과 1컷의 넓은 분포) 경쟁자가 예상보다 듬성하게 분포하여 틈이 생기는 경우도 있고 그 반대의 경우 비집고 들어갈 틈이 없을때도 있습니다. 이런 변수들을 파악할때도 분명 도움이 됩니다.
요약하면…….
1. 표본카운팅은 오차를 어떻게 줄이느냐가 핵심이다.
2. 그 오차를 줄이는 방법은 상대적이고 검증된 게 없어 어렵다.
3. 그럼에도 그 과정에서 분명 의미 있는 정보를 얻을 수 있기에 도전해 보길 조심스레 추천드린다.
글이 다소 어렵거나 난해하게 느껴질수 있습니다. 공익을 목적으로 글을 작성해도 일부 개인 혹은 업체에서 카피하고 마치 자신들이 연구하여 만든것 처럼 행동 합니다 (할많하않). 다수에게 도움이 되기 위해 작성한 글이 누군가의 돈벌이 수단이 되는걸 원치 않아 나름대로 돌려서 말씀드린 부분이 있으니, 이해가 되지 않아 질문을 하고 싶거나 아직 저 또한 연구중인 부분에 대해 같이 논의하고 싶으신 분들은 언제든 댓글이나 쪽지 남겨주세요. 이 글을 읽는 모든 수험생 분들에게 좋은 결과가 함께하길 바랍니다.
작년 고립된 구간에서의표본카운팅에 대한 글....
0 XDK (+0)
유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.
-
하수: 실모에 기하가 없구나 1 2
고수: 공통 모의고사구나
-
이이이이걸들르셈 2 0
동현이 랩이된다 여기서제일잘하는애야
-
내용을 아는데 문제를 틀림(?)
-
이 앨범 진짜 좋다 0 0
-
좆 0 0
학교실ㄹ러
-
단축수업 너무 야르인데 2 0
앙 기모찌
-
근데 더프나 서프 개인응시면 1 0
걍 안사고 ㅇㅂ에서 뽑아푸는게 낫나요? 일단 3덮 사긴했는데 다음부터 어케할까요?? 현역입니다!
-
N제 작년꺼 풀어도 괜찮나용 0 0
사촌형한테 책 작년 N제 몇개 받았는데 작년꺼여도 풀어봐도 괜찮겠죠? 참고로 기출...
-
무릎도 안 모이는데 안쪽이 왜 아픈지 모르게씀
-
생명 실모 양치기할까 2 1
진짜 n제 푼다고 크게 안느는거같기도하고 시간관리가 필요한데
-
나 오르비 글보면 0 0
고위관직맡게되면. 물러가라 시위도 나오겠네
-
미국지리 존나 재미없네 0 0
확실히 민족 관련된거 아니면 급격히 재미없어지네여 거의 다 아는거긴 한데 산업 관련...
-
논란글 타파법 알아냄 0 2
Ai라고 우기면 됨
-
우주설 1 0
우주설 라이브랑 김종두 인강(실전길라잡이 부터 현강합류 예정) 둘중 뭐가 더...
-
국어모고 5이상뜬적없음ㅋㅋ
-
제미나이 활용능력 평가 전형 아닌가 그냥 문득 든 생각임
-
난 논란될글 안씀 4 2
나중에 고위공직을 맡을수도 있잖아
-
이 글의 좋아요가 6개가 넘는다면 9 19
지금 오르비끄고 공부하러가겟음
-
내일도신촌가야하네..
-
맨날 똑같은 옷 입는사람 있냐 2 1
나는 여름 가을,봄 겨울 이렇게 3시즌으로 나눠서 매일 똑같은 옷만 입음 똑같은옷...
-
snumo 후기 0 1
1-12 무난 13 g(x) g(-x) 차수 같으니 삼차 극대 4 가지고 미분하면...
-
이거말하는거임? 1 3
-
수능 확통 통계 4 1
이항분포와 정규분포의 관계 출제 되나요? 제가 공부를 잘 못해서 완전히 습득하려는...
-
뻘짓을 넘 많이함 2 0
밥먹으면서 넷플릭스보다가 3시간을봄 ㅅㅂ 내일부턴 지식밥차봐야지
-
청문회:설의적표현 의원 3 2
202X년 X월 X일에 어느 커뮤니티에서 "한 달 동안 폭딸침 ㅇㅇ"라고 발언한...
-
3덮 윤사 2 0
14분 46점 사문말고 윤사오세요 도표보다 정신건강에 이로운듯
-
잘자. 9 1
잘자연
-
유빈 초대 0 0
제발 해주실분 안계신가요....???? 기숙갔다 나오니까 튕겼어요 ㅠㅠㅠㅠㅠㅠㅠ
-
작년 수능에서 화법과 작문을 선택했고, 국어 백분위 86으로 3등급이었습니다....
-
이거임 1 0
걍 아사람는 테토임
-
올해는 연비주행 할거임 1 0
실모시즌 전까지 대성패스만 쓸거임
-
수리논술하는애들 없니 0 0
독학하려는데 책추천이나 무료강의같은거 추천좀
-
2503 화1 시작한다는거심 4 3
만표 85 ㅅㅂ 뭐냐
-
5000덕)3덮 수학 점수 예측 ㄱㄱ 10 0
지금부터 풀거긴한데 일찍 자야해서 좀 막히면 바로 거를 예정 없으면 가장 가까운...
-
그 물리였나 화학반이었는데 내가 보기엔 딱히 안 예쁜데 남고 출신 물리러들이 걔...
-
오늘의 공부 2 0
-
초미녀 퇴근 2 2
3덮 해설은 진짜 기빨리네
-
야심한 밤 2503 4 0
컷이 뭔가 이상한 2503 화1을 풀어볼까여ㅕㅕㅕ
-
종종 시대 부남들이 하는 착각 5 5
여자애들이 대부분 웃으며 대꾸해주고 받아준다 그건 착해서 그렇게 받아주는거임 오히려...
-
서프 84 더프 84 8 3
어떤게 더 잘한거임 그나마?
-
수학 노베 16212 0 0
예체능 재수생이고 음악함 잘 기억도 안나지만 고1까진 수학했었는데 고2부터는 거의...
-
이미지 김범준 1 0
확통 4점을 맞추고 싶어서 기출하면서 이미지 미친개념, 김범준 스타팅블록 둘 중...
-
서프 국수영 후기 2 1
국어 독서 불 문학 무난 언매 까다롭 수학 2611 깔에 비킬러 강화? 영어 71점이 어케평가하겟슴
-
오늘은 학교 수업에서 강간에 대해 토론함
-
아이언을 넘는 래퍼가 없네 2 0
아으
-
16cm보다 큰사람만 댓글 달아주셈 22 4
기억해둘게요
-
Mt랑 알바랑 걉쳐요 사장님 2 1
말하면 하루 빼주실라나..
-
뉴진스 글쓰던사람 ㅇㄷ감 1 0
어원쓰던사람
-
작년대비 시즌1 얼마나 됬나요???
감사합니다
감사합니다~
감사합니다 응원합니다!
표본 카운팅스떨~
밤하늘에 풔얼~
ㅋㅋㅋㅋ 아 보자마자 웃었네요 고마워요~
표본 한무언급 ㄷㄷ
ㅜㅜ 보기 불편하셨다면 죄송합니다
고립된 구간에서만 표본카운팅 -> 이부분 저도 공감합니다
감사합니다.
감사합니다