자유게시판

1. Claude Opus 4.7

역대급 최악의 Claude 업그레이드같아요

Opus 4.6이 상당히 높은 성능을 보여줘서 엄청 인상깊었는데, 정확하게 퇴보했습니다.

Claude에 많은 유저들이 몰린 대규모 이주 이후 심해졌어요. 컴퓨팅 파워때문에 모델의 능력을 퇴보시킨 상태라고 보입니다.

그 예로 코드 짜는 족족 취약점을 내고있는 상황입니다. 제가 좀더 강하게 지시를 내려도 마찬가지입니다.

'박살' 등 은어와 비슷한 평소 쓰지 않던 언어 선택도 하고있구요.

그리고 몇주전부터 Claude Code Cloud Computing(이렇게 부르는게 맞나 모르겠습니다) 시도 시 API session timeout이 뜹니다.

그래서 아무리 뭐 ultraplan같은거 클라우드 세션에서 빡세게 컴퓨팅 한다고 해도 사용 못한지 몇주됐습니다.

Claude의 컴퓨팅 파워가 모자라다는 말이 실제인가봅니다.

그래도 아직도 이만한게 없어서 승질내면서 쓰고있습니다.

 

2. ChatGPT 5.5 Codex

나온지 1시간만의 후기입니다.

전 원래부터 ChatGPT를 신뢰하지 않습니다.

5.4부터 그냥 말만 해도 갑자기 반말 존대 섞어가는 일관성이 전혀 없는 문제가 있기 때문이죠.

이번 ChatGPT 5.5도 나왔다고 Codex깔아서 실험해봤는데, 마찬가지로 일관성이 전혀 없네요.

Git Message 작성조차도 요청 넣을때마다 포맷이 다릅니다.

Claude Opus 4.7이 멍청해서 이제서야 좀 어깨를 나란히 할 레벨이 된 느낌입니다.

물론 나온지 1시간만이라 조금 더 써보면 평가가 뒤집힐 수 있을지도 모르겠습니다.

 

3. Moonshot Kimi K2.6 + OpenCode Go

$5로 Opus 4.6급 성능을 보이는 AI를 쓸수있다고 해서 혹해서 구매했습니다.

근데, 한달만 쓰고 안쓸것같습니다.

정확히는 OpenCode자체가 Claude에 비해 많이 모자란 느낌이 듭니다.

나중에 한번 proxy 만들고 Claude Code에 붙여서 테스트 해보겠지만, 지금은 많이 아쉽습니다.

Plan도 제대로 만들어지지 않는 느낌이구요.

 

4. 로컬모델

진짜 폐쇄망이라서 어쩔수없이 써야한다 아니면 쓰지마시길 바랍니다.

벤치마크상 점수는 다들 좋죠, Sonnet 4.5만큼도 안됩니다. 아마 Sonnet 4만큼 되는것같아요.

 

라이믹스 공홈인데 매번 라이믹스 이야기는 아니라서 죄송합니다.

다만 좀 어디 이야기하고픈 내용들이라 적어봅니다 ㅡㅡㅋ

에카 Lv. 3

댓글 0