1. Claude Opus 4.7
역대급 최악의 Claude 업그레이드같아요
Opus 4.6이 상당히 높은 성능을 보여줘서 엄청 인상깊었는데, 정확하게 퇴보했습니다.
Claude에 많은 유저들이 몰린 대규모 이주 이후 심해졌어요. 컴퓨팅 파워때문에 모델의 능력을 퇴보시킨 상태라고 보입니다.
그 예로 코드 짜는 족족 취약점을 내고있는 상황입니다. 제가 좀더 강하게 지시를 내려도 마찬가지입니다.
'박살' 등 은어와 비슷한 평소 쓰지 않던 언어 선택도 하고있구요.
그리고 몇주전부터 Claude Code Cloud Computing(이렇게 부르는게 맞나 모르겠습니다) 시도 시 API session timeout이 뜹니다.
그래서 아무리 뭐 ultraplan같은거 클라우드 세션에서 빡세게 컴퓨팅 한다고 해도 사용 못한지 몇주됐습니다.
Claude의 컴퓨팅 파워가 모자라다는 말이 실제인가봅니다.
그래도 아직도 이만한게 없어서 승질내면서 쓰고있습니다.
2. ChatGPT 5.5 Codex
나온지 1시간만의 후기입니다.
전 원래부터 ChatGPT를 신뢰하지 않습니다.
5.4부터 그냥 말만 해도 갑자기 반말 존대 섞어가는 일관성이 전혀 없는 문제가 있기 때문이죠.
이번 ChatGPT 5.5도 나왔다고 Codex깔아서 실험해봤는데, 마찬가지로 일관성이 전혀 없네요.
Git Message 작성조차도 요청 넣을때마다 포맷이 다릅니다.
Claude Opus 4.7이 멍청해서 이제서야 좀 어깨를 나란히 할 레벨이 된 느낌입니다.
물론 나온지 1시간만이라 조금 더 써보면 평가가 뒤집힐 수 있을지도 모르겠습니다.
3. Moonshot Kimi K2.6 + OpenCode Go
$5로 Opus 4.6급 성능을 보이는 AI를 쓸수있다고 해서 혹해서 구매했습니다.
근데, 한달만 쓰고 안쓸것같습니다.
정확히는 OpenCode자체가 Claude에 비해 많이 모자란 느낌이 듭니다.
나중에 한번 proxy 만들고 Claude Code에 붙여서 테스트 해보겠지만, 지금은 많이 아쉽습니다.
Plan도 제대로 만들어지지 않는 느낌이구요.
4. 로컬모델
진짜 폐쇄망이라서 어쩔수없이 써야한다 아니면 쓰지마시길 바랍니다.
벤치마크상 점수는 다들 좋죠, Sonnet 4.5만큼도 안됩니다. 아마 Sonnet 4만큼 되는것같아요.
라이믹스 공홈인데 매번 라이믹스 이야기는 아니라서 죄송합니다.
다만 좀 어디 이야기하고픈 내용들이라 적어봅니다 ㅡㅡㅋ
댓글 7
저는 2.9만원에 구매해놓은 chatgpt pro 이용권이 아직 남아서 codex를 사용하고 있어요. gpt-5.4를 주로 사용하고 있었는데 2-3주정도 전부터 지능이 심하게 떨어지고 토큰 소모 속도는 빨라 졌어요. (레딧에서도 난리였어요) 그래서 한번 gpt-5.3-codex 모델로 변경했더니 괜찮아서 그후로 지금까지 쭉쓰고 있어서 5.5는 사용해볼 생각도 못했어요 ㅎㅎ
저도 그 이용권 덕분에 ChatGPT 프로 사용중에 있습니다 ㅋㅋ
Codex는 많이 사용 안해서 토큰 소모 속도는 몰랐고 사용량 리셋 많이한다고 약간 민심은 좋은편이던데 그런일이 있었나보네요.
새벽에 5.5를 계속 만지다가 잤는데, 일부 테스트 작성과 같은 좀 하드한 일을 맡겨도 사용량이 크게 눈에띄게 안줄더라구요. 기존 5.4에 요청 사항 이해도는 높아진 느낌이 드네요.
5.3-codex 모델에 대한 평은 대체로 코딩에 특화되어있고 빠르다. 대신 지시를 좀 더 명확하게 해줘야한다. 그래서 플래닝은 상위로 모델로 코딩은 이 모델로 하고 이런 조합을 추천 많이 하시더라구요
1, 2번 말씀하신거의 동의합니다
퇴보하다못해 인공지능을 금쪽이로 만들어놨어요
AI기반의 개발로 개발정책을 바꿨는데 골치아픕니다 ㅠㅠ
Opus가 얼른 정상화되기만을 기다리고있네요.
큰돈 주고 써도 돈값 못하는 느낌이 너무 커요
5월정도에 클로드 pro를 구매할까 싶었는데, 요새 클로드 사용하기가 좀 벅찬가봐요?
프로 플랜에서 클로드 코드를 제외한다는 말도 있고..
예전에 차선책으로 $30짜리 zlm-5을 사용해봤었는데, 클로드 pro 플랜에 15배 quota를 줘서 원없이 사용했던 것 같습니다.
성능은 sonnet 4.5정도로 코딩 성능은 조금 떨어져도, 막대한 quota를 이용해서 데이터 분류하는 용도로 사용하기도 했었네요.
다만 클로드 코드를 쓰다가 zlm을 쓰면, 거의 두 세대 이전의 AI툴을 사용하는 느낌이라 역체감이 크긴 했네요..
지금은 또 플랜 가격을 올렸던데 점점 메리트는 없어지는 것 같습니다.
클로드 사용하기 진짜 어려워졌어요. 비단 Pro플랜뿐만이 아닌 Max플랜도 동일해요.
사용자들간에 모델 너프로 원성도 크고, 알게모르게 자꾸 pro플랜 차별 혹은 너프하는것들이 많아서 지금 민심이 별로 안좋은 상태입니다.
그리고 요즘은 OpenCode Go, OpenRouter, Vercel AI Gateway같이 가입해서 여러 모델들을 사용해볼 수 있는 서비스가 많이 생겼는데, 이런곳에서 중국쪽 모델들 체험해보기가 좋아진것같아요.
특히 본문에 적은 OpenCode Go는 첫달 5달러라 부담은 거의없었네요