GPT-4o mini: 비용 효율적인 인텔리전스
이미 다수의 온라인 매체를 통해 GPT-4o mini 의 가성비가 입증되고 알려졌습니다. 고 퀄리티의 응답을 추구하는 상황이 아니라면 GPT-4o mini 를 통해 프로토타이핑과 개념검증 등의 개발작업을 저비용으로 수행할 수 있습니다. 본 사이트에서 업로드되는 LLM 강좌들도 (API 연동이 필요하다면) GPT-4o mini 를 사용할 계획입니다.
OpenAI는 지능을 가능한 한 광범위하게 접근 가능하게 만드는 데 전념하고 있습니다. 오늘 저희는 가장 비용 효율적인 소형 모델인 GPT-4o mini를 발표합니다. 저희는 GPT-4o mini가 지능을 훨씬 더 저렴하게 만들어 AI로 구축된 애플리케이션 범위를 크게 확장할 것으로 기대합니다. GPT-4o mini는 MMLU에서 82%를 기록했으며 현재 LMSYS 리더보드 에서 채팅 선호도에서 GPT-4 1 보다 우수한 성과를 거두고 있습니다.(새 창에서 열립니다). 입력 토큰 100만 개당 15센트, 출력 토큰 100만 개당 60센트로 가격이 책정되어 이전 프론티어 모델보다 훨씬 저렴하고 GPT-3.5 Turbo보다 60% 이상 저렴합니다.
GPT-4o mini는 낮은 비용과 지연 시간으로 다양한 작업을 처리할 수 있습니다. 여기에는 여러 모델 호출을 연결하거나 병렬화하는 애플리케이션(예: 여러 API 호출), 모델에 대량의 컨텍스트를 전달하는 애플리케이션(예: 전체 코드 베이스 또는 대화 기록), 빠르고 실시간 텍스트 응답을 통한 고객과 상호 작용하는 애플리케이션(예: 고객 지원 챗봇)이 포함됩니다.
오늘날 GPT-4o mini는 API에서 텍스트와 비전을 지원하며, 텍스트, 이미지, 비디오 및 오디오 입력과 출력에 대한 지원은 향후 제공될 예정입니다. 이 모델은 128K 토큰의 컨텍스트 창을 가지고 있으며, 요청당 최대 16K 출력 토큰을 지원하며, 2023년 10월까지의 지식을 보유하고 있습니다. GPT-4o와 공유되는 개선된 토크나이저 덕분에 영어가 아닌 텍스트를 처리하는 것이 이제 더욱 비용 효율적입니다.
뛰어난 텍스트 지능과 다중 모드 추론을 갖춘 소형 모델
GPT-4o mini는 텍스트 인텔리전스와 멀티모달 추론 모두에서 학술적 벤치마크에서 GPT-3.5 Turbo 및 기타 소형 모델을 능가하며 GPT-4o와 동일한 범위의 언어를 지원합니다. 또한 함수 호출에서 강력한 성능을 보여주어 개발자가 데이터를 페치하거나 외부 시스템에서 작업을 수행하는 애플리케이션을 빌드할 수 있으며 GPT-3.5 Turbo에 비해 롱 컨텍스트 성능이 향상되었습니다.GPT-4o mini는 여러 주요 벤치마크를 통해 평가되었습니다 .
추론 작업: GPT-4o 미니는 텍스트와 시각을 모두 포함하는 추론 작업에서 다른 소형 모델보다 우수하며, 텍스트 지능 및 추론 벤치마크인 MMLU에서 82.0%의 점수를 받았습니다. 이는 Gemini Flash의 77.9%, Claude Haiku의 73.8%보다 높습니다.
수학 및 코딩 능력: GPT-4o 미니는 수학적 추론 및 코딩 작업에서 탁월하여 시중의 이전 소형 모델보다 성능이 뛰어납니다. 수학적 추론을 측정하는 MGSM에서 GPT-4o 미니는 87.0%를 기록한 반면 Gemini Flash는 75.5%, Claude Haiku는 71.7%를 기록했습니다. GPT-4o 미니는 코딩 성능을 측정하는 HumanEval에서 87.2%를 기록한 반면 Gemini Flash는 71.5%, Claude Haiku는 75.9%를 기록했습니다.
다중 모드 추론: GPT-4o mini는 다중 모드 추론 평가인 MMMU에서도 강력한 성능을 보였으며, Gemini Flash의 56.1%, Claude Haiku의 50.2%에 비해 59.4%를 기록했습니다.