본문 바로가기
정보의힘

구글, 개방형 인공지능 새 모델 젬마 4 공개

by 컴수리존 2026. 4. 3.
반응형

구글, 개방형 인공지능 새 모델 젬마 4 공개


구글이 2026년 4월 2일(현지시간), 자사의 차세대 개방형 인공지능(AI) 모델인 '젬마 4(Gemma 4)'를 공식 공개했습니다.

이번 모델은 구글 딥마인드의 최신 기술인 제미나이 3(Gemini 3)와 동일한 연구 및 기술을 기반으로 구축되었으며, 이전 세대보다 비약적으로 향상된 지능과 다국어 능력을 갖춘 것이 특징입니다.

1. 강력한 추론 및 멀티모달 기능

* 고급 추론: 수학적 문제 해결과 복잡한 지시 이행 능력이 대폭 강화되어, 단순한 채팅을 넘어 고도의 논리적 추론이 가능합니다.
* 네이티브 멀티모달: 텍스트뿐만 아니라 이미지, 비디오, 오디오를 기본적으로 처리할 수 있습니다.
특히 모바일 및 IoT 기기에서 오프라인 상태로도 시각적 작업(OCR, 차트 해석 등)과 음성 인식을 수행할 수 있습니다.
* 확장된 문맥 창: 중형 모델 기준 최대 256K 토큰(소형 모델은 128K)의 문맥 창을 지원하여 방대한 양의 정보를 한 번에 처리할 수 있습니다.

2. 모델 라인업 및 아키텍처

다양한 하드웨어 환경에 최적화된 4가지 크기로 제공됩니다.

* E2B & E4B (Effective 2B/4B): 모바일 및 IoT 기기에 최적화된 소형 모델로, 낮은 지연 시간과 효율적인 메모리 사용이 특징입니다.
* 26B MoE (Mixture of Experts): '전문가 믹스' 아키텍처를 적용하여 128개의 전문가 중 일부(3.8B 파라미터)만 활성화함으로써 추론 속도를 극대화했습니다.
* 31B Dense: 성능에 집중한 모델로, 현재 전 세계 오픈 모델 리더보드(Arena)에서 최상위권(3위)을 기록하며 자기 크기의 20배가 넘는 대형 모델들과 경쟁합니다.

3. 에이전트 및 개발 생태계 지원

* 에이전트 워크플로우: 도구 호출(Function calling)과 구조화된 출력을 기본 지원하여 복잡한 작업을 자율적으로 수행하는 AI 에이전트 개발에 최적화되었습니다.
* 라이선스 변경: 기존보다 훨씬 유연한 아파치 2.0(Apache 2.0) 라이선스를 적용하여, 기업과 개발자들이 상업적 목적으로 더욱 자유롭게 모델을 수정하고 배포할 수 있게 되었습니다.
* 다국어 지원: 한국어를 포함한 140개 이상의 언어를 지원하여 글로벌 서비스 구축에 용이합니다.

활용 및 접근

젬마 4는 현재 구글 AI 스튜디오, Hugging Face, Kaggle 등을 통해 즉시 사용할 수 있으며, vLLM, Llama.cpp 등 주요 추론 프레임워크와 AMD, NVIDIA 등 최신 하드웨어 가속기에서 '데이 제로(Day-0)' 지원을 시작했습니다.


구글의 인공지능 라인업에서 제미나이(Gemini)와 젬마(Gemma)는 같은 기술적 뿌리를 공유하는 형제 모델이지만, 그 목적과 접근 방식에서 결정적인 차이가 있습니다.

제미나이는 '구글이 완성해서 서비스로 제공하는 완제품(식당 요리)'이고, 젬마는 '개발자가 직접 가져가서 요리할 수 있는 핵심 재료(밀키트)'라고 볼 수 있습니다.

제미나이(Gemini) vs 젬마(Gemma) 비교

| 구분 | 제미나이 (Gemini 3) | 젬마 (Gemma 4) |
| 모델 성격 | 폐쇄형 (Proprietary) | 개방형 (Open Weights) |
| 접근 방식 | 구글 앱, 웹, API를 통해서만 사용 가능 | 가중치(Weight)를 다운로드하여 로컬 설치 가능 |
| 모델 크기 | 초거대 (매우 큼, 파라미터 수 미공개) | 소형~중형 (2B, 4B, 26B, 31B 등) |
| 실행 환경 | 구글의 강력한 클라우드 서버 | 개인 PC, 스마트폰, 사내 서버 (온디바이스) |
| 커스텀 | 불가능 (제공된 기능만 사용) | 파인튜닝(미세조정) 가능, 특정 용도 최적화 가능 |
| 비용 | 사용량에 따른 API 비용 발생 | 모델은 무료 (자신의 하드웨어 비용만 발생) |
| 주요 사용자 | 일반 사용자, 서비스 통합 개발자 | AI 연구자, 하드웨어 제조사, 보안 중시 기업 |

핵심 차이점 상세 설명

1. "내 컴퓨터에서 돌아가는가?" (인프라의 차이)

* 제미나이: 너무 거대해서 개인 컴퓨터나 일반 서버에서는 돌릴 수 없습니다.
구글의 슈퍼컴퓨터 인프라를 빌려 써야 합니다.
* 젬마 4: 효율성에 극도로 최적화되어 있습니다.
특히 E2B, E4B 같은 소형 모델은 최신 스마트폰이나 노트북에서도 인터넷 연결 없이(오프라인) 직접 구동할 수 있습니다.

2. "수정하고 개조할 수 있는가?" (자유도의 차이)

* 제미나이: 구글이 정해준 규칙과 답변 스타일 내에서만 움직입니다.
* 젬마 4: 소스코드가 공개된 아파치 2.0 라이선스입니다.
개발자가 특정 전문 분야(의료, 법률, 사내 규정 등)의 데이터를 학습시켜 '우리 회사 전용 AI'로 완전히 개조할 수 있습니다.

3. "데이터 보안이 중요한가?" (프라이버시)

* 제미나이: 질문 내용이 구글 서버로 전송되어야 합니다.
* 젬마 4: 자신의 서버나 기기에 설치해서 사용하므로, 민감한 개인정보나 기업 비밀이 외부로 유출될 걱정 없이 폐쇄된 네트워크에서 AI를 쓸 수 있습니다.

무엇을 선택해야 할까?

* 최고의 성능과 방대한 지식이 필요하고, 복잡한 설정 없이 바로 쓰고 싶다면? → 제미나이 (Gemini)
* 나만의 전용 AI를 만들고 싶거나, 인터넷 연결 없는 환경 혹은 데이터 보안이 절대적으로 중요하다면? → 젬마 (Gemma)


반응형