ChatGPT가 더 멍청해진 게 아니라, 당신의 기대치가 올라갔고 프롬프트는 그대로일 뿐이다. 2024년에 당신을 감동시킨 모호한 한 줄짜리 프롬프트가 이제는 뻔한 결과물을 만들어내는 이유는 당신이 진정으로 좋은 AI 응답이 무엇인지 알게 됐기 때문이다. 즉, 당신이 요청하는 것과 실제로 원하는 것 사이의 간격이 넓어졌을 뿐이다.

모델 품질이 실제로 변하는 경우도 있다 (OpenAI가 모델 변형 간에 라우팅하거나, 레이트 제한된 사용자가 더 가벼운 모델을 받거나, 시스템 프롬프트 변경이 동작에 영향을 미친다). 하지만 Reddit에서 불평하는 사용자의 90%는 다른 모델이 아니라 더 나은 프롬프트가 필요할 뿐이다.

왜 모두가 ChatGPT가 나빠졌다고 생각할까?

Reddit에서 "ChatGPT 너프됨"을 검색하면 수천 개의 게시물을 찾을 수 있다. 좌절감은 실제다. 하지만 심리적 패턴이 작용하고 있다: 신기함 효과가 사라졌을 뿐이다.

처음 ChatGPT를 사용했을 때, 그것이 만든 모든 것이 당신을 감탄하게 했다. 평범한 시는 컴퓨터가 쓴 것이라서 신기로웠다. 기본 코드 스니펫은 마법처럼 느껴졌다. 당신의 기준은 "기계가 이것을 할 수 있을까?"였다.

이제 당신의 기준은 "기계가 이것을 내가 직접 하는 것만큼 잘할 수 있을까?"다. 그것은 훨씬 높은 기준이고, 당신의 한 줄짜리 프롬프트는 그것에 맞게 진화하지 못했다.

핵심 요점

모델이 퇴보한 게 아니라 당신의 기대치가 높아진 것이다. 2024년에 작동하던 프롬프트는 언제나 같은 품질을 낸다. 당신이 더 원할 뿐이다.

형편한 프롬프트는 실제로 어떤 모습일까?

같은 요청을 두 가지 방식으로 보자:

모호한 프롬프트: "마케팅 이메일을 써줘."

구조화된 프롬프트: "이메일 마케팅 전문가로 행동해줘. AI 대화를 정리하는 데 도움이 되는 Chrome 확장 프로그램을 위해 150단어의 홍보 이메일을 써줘. 대상 고객: ChatGPT를 매일 사용하는 지식 근로자. 톤: 캐주얼하고 직설적이며, 판매적이지 않게. 제목을 포함해줘. Chrome 웹 스토어에서 설치하도록 명확한 CTA로 마무리해줘."

첫 번째 프롬프트는 ChatGPT에 거의 아무것도 주지 않는다. 대상, 톤, 길이, 제품, 목표를 모두 추측해야 한다. 요청이 일반적이기 때문에 뻔한 것을 만들어낼 것이다. 두 번째 프롬프트는 중요한 방식으로 정확히 출력을 제약한다.

모델을 탓하기 전에, 프롬프트에 세 가지를 추가하자: AI가 되어야 할 역할 (역할), 출력이 누구를 위한 것인지 (대상), 당신이 원하는 형식 (제약). 이것만으로도 대부분의 "멍청한" 응답이 해결된다.

ChatGPT가 실제로 나빠진 경우는?

공정하게 말하면, 품질 변동의 정당한 기술적 이유들이 있다:

모델 라우팅: OpenAI는 때때로 최대 사용량 중에 요청을 더 가벼운 모델 변형으로 라우팅한다. 당신의 "GPT-4o" 응답이 실제로는 백그라운드의 더 작고 빠른 모델에서 나올 수 있다.

시스템 프롬프트 변경: OpenAI는 ChatGPT의 동작을 형성하는 숨겨진 시스템 프롬프트를 정기적으로 업데이트한다. 이러한 변경사항은 톤, 길이, 그리고 특정 작업을 돕는 의지에 영향을 미칠 수 있다.

레이트 제한: 무료 사용자는 더 공격적으로 스로틀된다. 응답이 갑자기 나빠진 것처럼 느껴진다면, 알림 없이 사용량 한도에 도달했을 수도 있다.

진정한 퇴보: 그런 경우도 있었다. GPT-4의 수학 성능은 2023년 3월과 6월 사이에 측정 가능하게 하락했다. OpenAI는 나중에 일부 문제를 인정하고 수정했다. 하지만 이러한 경우는 드물고 구체적이며, Reddit이 제시하는 "모든 것이 나빠졌다"는 일반적인 주장과는 다르다.

형편한 출력을 실제로 어떻게 고칠까?

1
역할을 추가하자
"선임 데이터 분석가로 행동해줘"는 모델에 관점을 준다. 단어 선택, 깊이, 그리고 가정을 바꾼다.
2
출력 형식을 지정하자
"글머리 목록으로 줘" 또는 "3단락 이메일로 써줘" 또는 "이 필드가 있는 JSON으로 반환해줘". 모델은 형식 지시를 안정적으로 따른다.
3
하지 말아야 할 것을 포함하자
"일반적인 조언을 포함하지 마" 또는 "기업 용어를 사용하지 마" 또는 "결론 문단을 추가하지 마". 부정적인 제약은 놀랍도록 강력하다.
4
예시를 주자
"좋은 출력물이 어떻게 보이는지의 예시: [예시 붙여넣기]". 한 개의 예시는 100단어의 지시만큼의 가치가 있다.

결론

지금 바로 시도해봐: 최근에 당신을 실망시킨 ChatGPT 프롬프트를 가져가자. 역할, 형식 제약, 그리고 당신이 원하는 것의 예시 하나를 추가하자. 다시 실행해보자. 그 차이는 명백할 것이다.

직접 해봐: 우리의 무료 프롬프트 최적화 도구에 프롬프트를 붙여넣고 구조화된 프롬프팅이 실제로 어떤 모습인지 보자.