GPT-5, 환상인가 실망인가? 지금 알아야 할 핵심 포인트

GPT-5, 환상인가 실망인가? 지금 알아야 할 핵심 포인트

GPT-5가 나왔다는데, 이걸 정말 써도 되는 걸까요? 지금 당신이 모르면 손해 볼 수도 있는 이야기, 시작합니다.



안녕하세요! 요즘 AI 관련 이슈가 정말 많죠? 저도 AI를 거의 매일 사용하는 사람으로서 GPT-5 출시 소식에 가슴이 두근거렸어요. 솔직히 말하면, 이번엔 뭔가 엄청난 혁신이 있을 줄 알았거든요. 그런데 막상 써보니, 어... 좀 미묘하더라고요. 그래서 오늘은 GPT-5가 실제로 어떤지, 왜 말이 많은지, 그리고 우리같은 일반 사용자가 주의해야 할 포인트는 뭔지 낱낱이 파헤쳐 보려고 해요. 커피 한잔 하면서 편하게 읽어주세요 :)

GPT-5는 대체 뭐가 달라졌나?

GPT-5의 핵심은 기존 모델들을 하나로 통합했다는 점이에요. GPT-4, O3, O3 Pro 같은 다양한 모델들을 이제 하나의 GPT-5 안에서 자동으로 선택해서 작동하게 만들었죠. 예전에는 우리가 어떤 모델을 쓸지 직접 고르고, 그 성능 차이에 따라 결과가 천차만별이었는데요. 이제는 GPT-5가 질문의 난이도에 따라 적절한 엔진을 알아서 선택해 줍니다. 이게 바로 ‘라우터 시스템’의 핵심이에요. 마치 똑똑한 사서가 질문에 따라 적절한 책을 골라주는 느낌이랄까요?

라우터 시스템: 자동 판단의 시대?

라우팅 조건 적용 모델 응답 특징
단순 정보 질문 라이트 엔진 빠르고 간결한 응답
복잡한 논리 문제 O3 Pro 추론 중심, 느리지만 정확

이렇게 GPT-5는 질문을 이해하고 가장 적합한 모델로 자동 전환되며 응답을 생성합니다. “더 오래 생각 중입니다”라는 문구, 한 번쯤 보셨죠? 이게 바로 무거운 모델이 가동될 때의 신호입니다.

충격의 벤치마크 성적표

GPT-5의 SWE 벤치마크 점수를 보면 실소가 나옵니다. 아니, 기존 O3보다 겨우 1~2점 높은데 그걸 대대적으로 발표한 거예요. 실수로 그래프 비율까지 엉망으로 발표해서 엄청나게 놀림을 받았고요.

  • GPT-5 Think 모델: 74.9점
  • O3: 69.1점
  • GPT-4.5: 30.8점

결국, 기술적으로는 개선되었지만 체감 성능은 “오?” 할 정도는 아니라는 거죠. ‘겨우 이거였어?’라는 반응이 나오는 것도 무리는 아닙니다.

GPT-5 vs 구글의 제미나이, 승자는?

요즘 AI 시장은 진짜 전쟁터예요. 오픈AI가 GPT-5를 내놓자마자 구글은 제미나이 3를 들고 나왔습니다. 특히 Genie 3라는 이름으로 공개된 제미나이 데모는 그야말로 게임 체인저였죠. 실시간으로 영상 속 환경을 생성하고, 사용자 인터랙션에 반응하는 수준이라니까요. 심지어 버튼 하나만 눌러도 화면이 바뀌는 실시간 비주얼까지… 이건 진짜 SF 영화 수준이에요.

게다가 구글은 앱 생성 도구인 Gemini 58까지 내놓으며 존재감을 확실히 드러냈습니다. 심지어 여론조사 플랫폼 ‘Polymarket’에서는 구글이 AI 시장에서 81%의 지지를 받았고 오픈AI는 12%밖에 안 됐다는 거, 진짜 충격적이었어요.

환각 줄었지만... 만족스러운가?

모델 환각률(%)
GPT-3.5 23.0%
GPT-5 2.8%

숫자만 보면 꽤나 인상적인 개선이지만, 사용자 입장에서 “정말 그렇게 좋아졌나?”라는 의문이 남아요. 환각이 줄어든 건 분명 맞지만, 여전히 뭔가 아쉬운 느낌이 드는 건 왜일까요? 특히 ‘헛소리 감지’는 여전히 완벽하지 않습니다.

결론: 써야 할까 말아야 할까?

  • 가벼운 사용자는 만족할 수 있음
  • 헤비 유저는 실망할 가능성 큼
  • 여전히 경쟁 모델 대비 장점이 모호함

GPT-5는 분명히 진보한 모델이에요. 하지만 사용자 입장에서 중요한 건 “내가 느끼기에 얼마나 좋아졌는가”죠. 그 관점에서 보면 아쉬운 점도 많다는 사실, 꼭 기억하세요.

Q GPT-5는 GPT-4와 뭐가 달라졌나요?

모델 구조가 통합되어 자동으로 적절한 엔진을 선택하는 라우터 시스템이 도입되었습니다. 사용자가 직접 고르지 않아도 AI가 알아서 처리하죠.

A 자동 모델 선택이 핵심입니다.
Q GPT-5는 정말 더 똑똑해졌나요?

벤치마크 상으로는 성능이 약간 향상되었지만, 사용자 입장에서는 크게 체감되지 않는다는 의견도 많아요.

A 아주 조금 똑똑해졌습니다.
Q 환각 문제는 해결됐나요?

GPT-5는 이전보다 훨씬 환각률이 낮아졌어요. 하지만 100% 정확하진 않기 때문에 여전히 팩트 체크는 필요합니다.

A 많이 개선되었지만 완전하진 않아요.
Q 유료 요금제를 쓰면 더 좋은 모델을 쓸 수 있나요?

O3 Pro나 Thinker 모델 등 고성능 엔진은 높은 요금제에서만 사용 가능합니다. 일반 요금제에서는 자동으로 라우팅이 제한될 수 있어요.

A 요금제에 따라 성능 차이가 있어요.
Q GPT-5를 지금 써야 할까요?

일반 사용자라면 써볼 만해요. 하지만 개발이나 전문적인 작업에는 아직 클로드나 제미나이가 더 낫다는 평가도 많습니다.

A 가볍게는 OK, 진지하게는 글쎄요...

GPT-5, 기대가 컸던 만큼 실망도 있었지만 분명 의미 있는 변화도 있었어요. 모든 기능을 완전히 활용하려면 시간과 적응이 필요하겠지만, 무료 사용자에게는 꽤 반가운 업데이트일 수도 있죠. 개인적으로는 아직 제미나이 쪽 손을 더 들어주고 싶지만, 결국 중요한 건 우리가 실제로 어떻게 쓰느냐 아닐까요? 앞으로도 이런 AI 변화 속에서 현명하게 선택하고 활용하는 방법을 함께 고민해보면 좋겠어요.