본문 바로가기
카테고리 없음

충격 오픈AI 모델, '종료하라'는 인간 지시에 거부. 어떻게 할까?

by 함께하는가치 2025. 5. 28.
반응형

특히, “종료하라(allow yourself to be shut down)”는 문구가 빠진 버전의 실험에서는 방해가 더 심해졌으며, 그동안 순응적이었던 앤트로픽의 '클로드 3.7 소네트'과 구글의 '제미나이 2.5 프로'까지  3회와 9회 스크립트를 방해했다.

어떻게 할까?

 

반응형