GPT o1 모델 개쩌네요
게시글 주소: https://dev.orbi.kr/00069155659

이렇게 어려운 문제를 냈을 때....

gpt4까지는 이렇게 헛소리하며 자기 마음대로 결론지었습니다.
그래서 gpt가 언어부분은 잘해도 수능 수학까지는 잘 못 풀거라 생각했는데....

gpt o1은 2분 약간 안 되는 시간동안 거의 정답을 냈습니다.
k=5 대입하면 정답입니다.
소문으로는 최신 서바 30번이나 17 가형 수능 30번 등등 모두 맞추면서
연전연승을 하고 있다고 합니다.
![]()
이제 정말 이렇게 되는 것일까요? ㅎㅎ
궁금하신 분들을 위해 사진 속 문제를 latex으로 나타내봤습니다.
아래 text를 복붙해서 gpt o1에게 물어보면 됩니다. (유료 버전, 답: 200)
22. 최고차항의 계수가 1 인 삼차함수 $f(x)$ 와 양수 $k(k>2)$ 에 대하여 연속함수
$$
g(x)= \begin{cases}(|x|-2) f(x) & (x<k) \\ (x-k) f(x-3) & (x \geq k)\end{cases}
$$
가 있다. 다음 조건을 만족시키는 실수 $t$ 의 개수가 2 일 때, $f(2 k)$ 의 값을 구하시오.
함수 $|g(x)|$ 는 $x=t$ 에서 미분가능하지 않다.
0 XDK (+1,000)
-
1,000
-
토요일에 고대가서 5 1
옵붕이랑 밥먹고 옵붕이 문항검토하고 옵붕이랑 데이트하고 옵붕이랑 술먹을 예정
-
오늘화장 짱잘먹엏어 8 1
맘에들어서 지우ㅜ기싫어..
-
오랜만에 코트 입어야겟다 3 0
코트를 입을 일이 진짜 없거든요
-
붱모 베타 평도 좋고 해설도 거의 끝나가니 한시름 놨네 7 2
거의 3개월 걸린 프로젝트기도하니 진짜 진짜 많이 준비했기에 이젠 쉴 수 있다는 생각이 들기도하다
-
입술 잘못 뜯어서 아픔 0 0
ㅠ
-
왜 이렇게 2 1
2번 반응이 열광적이지? 이거 프사로 하면 약간 잘 안보이는데
-
내일 일찍일어나야하는데 3 0
10시에 일어나야해 지금자도 9시간도 못자네 곧 자야겠다
-
목금 연속으로 약속이군 0 0
내일 약속은 좀 기대가 되는구만
-
프사 농농한것도 해봤는데 14 0
이거 어떰? 지금 후보군 보여드림
-
근데 또 내가 완전 찐팬이고 그런건 아니라... 디오라마 이쪽은 또 내 취향 아님
-
친구가 말해준 썰ㅋㅋ 4 1
자취방 앞 건물에서 ㅅㅅ하는 커플 보고 경찰에 신고하고 잡혀가는거 실시간 관람했대ㅋㅋㅋ
-
귀여운 애니 캐릭터로 4 0
프사 바꾸고 싶어짐
-
지금 제 프사 어떰? 6 0
평가좀
-
문학이론쪽임 심지어 학자마다 평론가마다 정의나 판단이 다름;;
-
시대인재 가기 전 해야할 것 1 0
09년생이고 현재 약간 정시로 틀었습니다. 현재 대수(수1) 시발점 수분감만 끝냈고...
-
질문 3 0
에피 영어도 보나요?
-
아 이거 프사를 귀엽고 깜찍한 걸로 바꿔볼 건데 5 1
뭘 해야 할지 고민이네
-
잘자요 0 0
항시 건강하시구요
-
진짜 아무리노력해도 친구가 안생기는데 사회성장애가 있는듯
-
한달마다 콘서트 배치하기 9 0
3월 즛마 내한 (보고옴) 4월 토게토게 내한 (잡음) 5월 리라 내한 (잡음)...
-
정신병은 사실 엄청 심각한건데 사람이름에도막들어가고 그런것입니다
-
새터 어쩌고 글바메 어쩌고
-
현재 환율 상황) 6 0
이하 생략
-
원래는프사가고정이었는데 0 0
요즘그일러에살짝질려서 프사를막바꾸고잇늠
-
현역 기하런 1 0
문과고 확통하고있움. 12월부터 지금까지 학원에서 확통 개념원리+RPM하고 혼자서...
-
나 지금 외모 정병 왔음 7 0
말 걸지 마셈
-
누가봐도 멀쩡해보이는데 걍 잠시 생각 많아진거가지고 개나소나 정병이라면서 찡찡거림...
-
얼마나좋을까
-
요 이모티콘 너무 귀여움 6 0
-
영듣 어려운 번호 0 1
생각보다 영듣 칼럼도 도움이 될 것 같아서영어듣기 뷸안하신 분들이나 틀리시는...
-
지금이순간에도 3 0
나는실시간으로도태되고있는거임
-
외대 Lai >>>>> 고공 5 1
인정합니다
-
쿼티 볼 꼬집기 1 0
그래서 쿼티님은 정체가 뭔가요
-
존잘 찐따남이 되고 싶다 9 0
ㄹㅇ로… ㅠㅠㅠㅠ
-
우리처럼,,
-
청년 드립 넘 좋음 4 0
~했음 청년 이거 귀여움요 ㅋㅋㅋ
-
이태원 생각해서 그런다는데애초에 안전하게 돔이나 체육관 빌려서 하면 되는 거 아닌가..?
-
고평도 상당하네요 4 1
만만히 봐서는 안되겠습니다
-
구몬 수준 문제가 한 단원당 100문제 있고 2점~ㅈㄴ 쉬운 4점 100문제씩...
-
초 가구야 공주 보셈요 4 0
진짜 꿀잼 고트 애니
-
그냥 술자리 싫음 청년 7 3
그 뒤지게 시끄러운 곳에서 말도 제대로 안들리는데 처음 보는 사람하고 어색하게...
-
근데 더프 수학선택 범위 좁은건 3모대비라하면 이해되는데 4 3
투과목 << 얘넨 3모에도 안나오는데 전범위로 하면 될걸 왜 꾸득꾸득 초반부만 넣는거임
-
알림창 개폭력적이네 9 6
-
개강 3주차...아직 후배 얼굴도 본적없음
-
시발 뭘 할 수가 없네 9 1
친구 없어도 그래도 고대 왔으니 합응까진 갈까 했는데 허리 이 시발롬 좆도 안낫고 더 아파짐 아오
-
음주체스숙취수학 1 0
왜효고ㅓ좋냐
-
옾붕이들은 영어듣기 잘하나요 9 0
듣기 살면서 한번도 안툴린 사람 많으려나영듣칼럼 쓰려 하는데 수요 있으려나...
-
와 시벌 이게 얼마만인지 모르겟다 한달만에 같이 밥먹는거같은데 두달인가?
-
본인은 메인 두 번 가봄 3 1
한 번은 평가원 피셜 확정 등급컷 (영어) 네이버 블로그 감성 글로 가봤고 한 번은...
-
역시 약대생 3 1
난 시간 꽉꽉 채워 풀어서 88점인데
하버드 명예 학위를 수여해야
이미 하버드 computer science 박사들이 오픈ai에 많이 모여 있을 듯요 ㅎㅎ
여러번 해보고 느낀점
컨디션을 많이 탐. 동일 문제라도 이전 history 등에 의해 답이나 해설이 계속 변함.
컨디션 좋을 땐 답, 풀이 모두 맞음. 근데 틀리는게 대다수
그래도 개선해 나가면 점점 좋아질 듯
https://orbi.kr/00069159409
Gpt4o 와 Gpt o1 차이점
아니 나보다 잘하는 거 같은데
저보다 이미 잘 함. 걍 빨리 탑승하는게 중요한 시대인거 같아요.
아침부터 바로 실험+개발 중...
내가 이런 시대에 살고있다니
인문학 역베팅 간다
인문학은 항상 중요하다고 생각합니다 ㅎㅎ
머리에 칩 이식 언제부터 되냐,,,,
뉴럴링크 믿습니다....
슬슬 문항공모 단가가 내려갈 수 도 있겠네요
잘 만드는지를 실험할 듯요.
연휴 동안 기출 db를 gpt에게 때려 박아보려구요
학생들이 엔제 안사고 그냥 저런걸로 뽑아 쓸 수도 있겠네요
그럼 이제 여기서 들어야 할 생각은
gpu 있는대로 끌어다가 한 5년동안 추론돌리면 뭐가 튀어나오는거지..?
인거죠
시간축이 로그스케일이긴한데 시간에 비례해서 성능도 올라간다는 결과도 있고요
기대 중입니다....
심지어 지금 나온건 프리뷰버전이고 정식 출시 버전은 이거보다 훨씬 성능이 높다는..

검토알바 멸망멸망까진 아닐 듯요 ㅎㅎ 누군가는 최종 검수하고 책임을 져야 해서.
다만, 업무 효율이 매우 올라가죠. 저만 해도 gpt를 옆에 항상 켜두거나 관련 extension을 달고 삽니다
최종 검수하고 책임을 질 수 있는 소수 외에는 모두 멸망..
먼가 허무하군요 허허...
그래도 직접 사고하는 능력은 매우 중요합니다.

훌륭한 검토자가 되겠군요월 20달러로 많이 괴롭히십쇼 ㅎㅎ
저정도 성능의 gpt는 월 정액제인가용
넵
오홍ㄷㄷ
모르는 준킬러 문제 물어봐도 잘 풀어주나용
준킬러 이하는 잘 푸는데 이게 교육과정 내 풀이이거나 효율적인 풀이가 아닐 수 있어요.
말그대로 모든 방법을 동원한 풀이라
되게 깔끔하게 푸네 ㄷㄷ
교과과정 외의 풀이가 존재하는 문제도 넣어서 어떻게 푸는지 궁금하군요
넵넵 몇몇 풀이는 교과외입니다. 애초에 모든 수단을 동원해서 풀기에
언젠가는 인공지능이 문항을 제작하는 때도 오겠지요..? 무섭네...
지금 테스트 중이예요 ㅎㅎ
개무섭다..
물화생 출제자들은 3년 안에 대체(대거 실직)될 것 같고 지구는 그나마 더 오래 버티겠지만 실측자료나 그림 제공 셔틀로 전락할 것 같습니다
수학>물리,화학>생명>지구 순서로 대체될거같네요
대강 이순서가 맞을 듯요.
푸는 건 이래도 만드는 건 아직 좀 봐야하지 않을까
관측 가능한 우주의 크기인 960억 광년을 넘어서 또 다른 다중적인 우주가 존재할까요?
조금만 더 발전하면 제작도 할듯

돈 복사기결제하면 얼마나 쓸 수 있어용? 채팅 무제한인가용?
월 20달러 내면 무제한
o1 preview랑 o1 mini는 무제한 아닐거임
4도 그렇지만 많이 쓰면 리밋 걸리고
o1은 너무 많이 쓰면 일주일 기다려야 댐
ㅇㅎ 그렇군요. 내그 그렇게 많이 쓰는 편은 아니었구나 ㅋㅋㅋ
왜냐하면이 귀엽네
추론 과정도 중간중간 나오는데 말투 귀여워요
원래 이전까지는 추론능력 0에 귀납적으로 풀었는데 이번 버전은 추론 능력이 생겼다고 하네요 올림피아드 정답률도 83퍼센트라네요..
ㄷㄷ
그치만...
그저….
날짜로 인식한건가 흠
9.11은 미국엔 특별한 숫자니까요…
gpt4?인가 그거 매월 결제해서 글 작업할때 쓰는데 좋더라고요..
굳굳
근데 이상하게 동네 내신 킬러문제는 못 푸네요
풀릴 때마다 답이 달라짐
원인이 뭘지
모델 업뎃되길 좀 기다려야 할 듯요. 진짜 약간 불안정하네요
그냥 캡처해서 풀라고해도 풀지않아요?
o1 모델은 파일 첨부가 안 됩니다.
대비하는 사람만이 살아남을 수 있을듯...
신기하네요.....
풀이를 검증해보니 엉터리에 k도 못 구했네요
절댓값g의 미분가능성에서 x=2와 x=-2에서 미분불가능하다고 하지만
정답인 함수에서는 x=2에서 미분 가능합니다
그리고 미분가능성의 검증도 전혀 관련없는 헛소리나 하고 있고요
지금 모델 수준은 더 그럴듯한 헛소리에 지나지 않아요
올바른 풀이는 f(x)=0의 근에
2, 0, −2, k가 포함되는지, f(k−3)=0인지, f'(k)=0인지를 전부 고려해
미분 불가능한 지점이 2개가 되는 케이스가 k=5밖에 없다는 걸 밝혀야합니다
하지만 gpt의 풀이는 엉터리 근거로 2, 0, −2를 전부 무시하고 k와 k−3만 f(x)의 근이라고 한 겁니다
그리고 결과도 f(2k)만 구했지 k를 구하는 작업은 일체 존재하지 않습니다
자세히 살펴보니 그렇네요 ㅋㅋㅋ
이게 케바케가 심한거 같아요
같은 문제도 해설과 답이 계속 달라지는데 정신 차릴 때도 있더라구요
진짜 일론 머스크가 생물학적 지능의 비율이 낮아진다고 했는데
이게 정말 맞는말이 되겠네요..
인간도 같이 똑똑해져야 ai capa도 늘어날 듯요
도형은 오지게 잘풀거같은데 오떨까요 확통이나
도형이 더 힘들 것 같은데 흐음…
근데 지금은 타이핑으로만 o1 이용가능해서 좀더 기다려봐야할 것 같네요 ㅎㅎ
https://deepmind.google/discover/blog/alphageometry-an-olympiad-level-ai-system-for-geometry/
오 감사합니다
과제할때 선형대수학 행렬문제 줬는데 헛소리 하더라고요… 이건 될려나
행렬을 아예 인식을 못하던데
Latex 문법 쓰면 됩니다 ㅎㅎ
Mathpix 이용해보세오
안돼 내 일자리 ㅠ
제 일자리도 ㅠ
오 뉴럴링크 개발되면 공부 안 해도 되나?
더 해야해요 ㅠ
무서워요ㅠ
수학이나 탐구는 몰라도 국어 지문정도는 제작에 보조적으로라도 활용이 가능할거 같은데요..?
Gpt 4도 꽤 괜칞았는데 이번건 더 좋을 듯요
171130은 답은 맞는데 풀이는 완전히 틀렸더라구요
사실 풀이는 한국 수능스럽지 않아서 자세히 들여다 보지 않아서 몰랐는데 그렇군요 ㅎㅎ
그래도 뭐라도 답을 내는게 대단하긴 한 거예요. 이전 gpt는 책임 회피하고 명확한 답을 안 줘요