Meta Llama 3.1 – 405B, 70B 및 8B 모델 출시
Llama 3.1 모델 제품군:
- 8B
- 70B
- 405B
Llama 3.1 405B는 일반 지식, 조향성, 수학, 도구 사용, 다국어 번역에 있어 최첨단 기능을 갖춘, 최고의 AI 모델들과 견줄 수 있는 첫 번째 공개 모델입니다.
8B와 70B 모델의 업그레이드 버전은 다국어를 지원하며, 128K의 크게 늘어난 컨텍스트 길이, 최첨단 도구 사용 능력, 전반적으로 강화된 추론 능력을 가지고 있습니다. 이를 통해 Meta의 최신 모델들은 장문 텍스트 요약, 다국어 대화형 에이전트, 코딩 보조 등의 고급 사용 사례를 지원할 수 있습니다.
Meta는 또한 라이선스를 변경하여 개발자들이 405B 모델을 포함한 Llama 모델의 출력을 사용하여 다른 모델들을 개선할 수 있도록 했습니다.
모델 평가
이번 출시를 위해 Meta는 광범위한 언어를 아우르는 150개 이상의 벤치마크 데이터셋에 대한 성능을 평가했습니다. 또한, Meta는 실제 시나리오에서 Llama 3.1을 경쟁 모델들과 비교하는 광범위한 인간 평가를 수행했습니다. Meta의 실험적 평가에 따르면, 그들의 주력 모델은 GPT-4, GPT-4o, Claude 3.5 Sonnet을 포함한 주요 기반 모델들과 다양한 작업에서 경쟁력이 있는 것으로 나타났습니다. 또한, Meta의 더 작은 모델들은 비슷한 수의 매개변수를 가진 폐쇄형 및 개방형 모델들과 경쟁력이 있습니다.
.
원문 : https://ollama.com/library/llama3.1