숫자
구글은 젬마 4 모델이 전 세계 수십억 대의 안드로이드 기기부터 노트북 GPU, 개발자 워크스테이션 및 가속기에 이르기까지 하드웨어에서 효율적으로 실행되고 미세 조정될 수 있도록 설계하였다. 젬마 4는 E2B와 E4B 모델을 포함하여 온-디바이스 활용성을 확장하며, 고급 추론, 에이전트 기반 워크플로우, 코드 생성 역량, 이미지 및 오디오 지원, 더 긴 컨텍스트, 140개 이상의 언어 지원을 제공한다.
엣지 모델은 128K, 대형 모델은 최대 256K 컨텍스트 윈도우를 제공하여, 다양한 사용 사례에 맞춰 최적화된 성능을 발휘한다. 특히, 26B 및 31B 모델은 개인용 컴퓨터를 위한 오프라인 기반 프런티어급 지능을 구현하며, 26B MoE 모델은 레이턴시에 초점을 맞춰 전체 파라미터 중 약 38억 개만을 활성화한다. 반면, 31B Dense 모델은 출력 품질을 중심으로 설계되어 미세 조정을 위한 기반 모델로 활용된다.
젬마 4는 전 세계적으로 다양한 기기에서 활용될 수 있는 가능성을 보여주며, 구글은 이러한 모델의 가중치를 다양한 크기로 출시하여 특정 하드웨어 및 사용 사례에 최적화하였다. 이러한 접근은 개발자와 사용자에게 더욱 유연한 선택지를 제공하며, 인공지능 기술의 발전에 기여할 것으로 기대된다.
이러한 기술적 발전은 인공지능의 활용 범위를 넓히고, 특히 개인 사용자와 기업 모두에게 효율적인 솔루션을 제공할 수 있는 기회를 마련한다. 젬마 4의 다양한 기능은 앞으로의 기술 발전에 중요한 역할을 할 것으로 보인다.