Gemini API 요금제를 검색하면 Free, Paid, Enterprise 세 가지가 나온다. 어떤 플랜이 맞는지 가격표만 봐서는 판단하기 어렵다. 플랜별로 기능 차이가 크고, Gemini Advanced 가격 기준으로 실제 비용이 얼마나 되는지도 확인해야 한다. 결론부터 말하면, 콘텐츠 보안이 중요하거나 API 호출량이 많다면 무료 플랜은 선택지가 아니다.
플랜별 핵심 차이 한눈에 보기

세 플랜의 차이는 단순히 가격 문제가 아니다. 무료 플랜 사용자의 콘텐츠는 제품 개선에 활용된다. Paid 플랜부터는 그렇지 않다. 이 차이 하나만으로도 업무용 데이터를 다루는 경우엔 무료 플랜을 쓸 수 없다.
| 항목 | Free | Paid | Enterprise |
|---|---|---|---|
| 기본 접근 | Google AI Studio | Google AI Studio | 전용 채널 |
| 토큰 비용 | 무료 | 입력 $1.50 / 출력 $9.00 (1M 토큰 기준) | 공식 문서에서 직접 확인 필요 |
| 속도 제한(Rate limits) | 낮음 | 높음 | Provisioned throughput 제공 |
| Context caching | 미제공 | 제공 | 제공 |
| Batch API | 미제공 | 제공 (비용 50% 절감) | 제공 |
| 콘텐츠 제품 개선 사용 | 사용됨 | 사용 안 됨 | 사용 안 됨 |
| 보안·컴플라이언스 | 기본 | 기본 | 고급 제공 |
| 전용 지원 | 미제공 | 미제공 | 제공 |
가격이 0원과 유료로 나뉘니 무조건 무료가 낫다고 볼 수도 있다. 하지만 플랜마다 기능 구성이 다르다. 나열만 하면 판단이 안 된다. 항목별로 짚는다.
Gemini Advanced 가격 — Paid 플랜 비용 구조
Gemini 3.5 Flash 기준 입출력 요금
Paid 플랜에서 Gemini 3.5 Flash 모델을 사용할 경우, 1M 토큰 기준으로 입력은 $1.50, 출력은 $9.00이다. 입력 대비 출력 단가가 6배 높다. 출력이 많은 작업일수록 비용이 빠르게 올라간다는 뜻이다.
1M 토큰은 대략 영문 기준 75만 단어 수준이다. 일반적인 API 호출에서 한 번에 1M 토큰을 쓰는 경우는 드물지만, 호출 횟수가 쌓이면 비용이 누적된다. 대량 처리가 필요한 경우엔 Batch API 활용이 현실적인 선택이다.
Batch API로 비용 50% 절감 가능
Paid 플랜에는 Batch API가 포함된다. 공식 안내 기준, Batch API를 사용하면 일반 API 대비 비용이 50% 절감된다. 실시간 응답이 필요 없는 작업 — 대량 문서 처리, 배치 분류, 반복 요약 등 — 에는 Batch API가 비용 면에서 유리하다.
- 실시간 응답 필요 없는 작업에 적합
- 대량 호출 시 비용 부담을 절반으로 줄일 수 있음
- Free 플랜에는 Batch API 미제공
- Paid 플랜 이상에서만 사용 가능
Free 플랜의 결정적 한계 — 콘텐츠 보안
무료 플랜은 데이터가 제품 개선에 쓰인다
Gemini Advanced 가격 비교에서 가장 간과하기 쉬운 부분이 바로 이것이다. Free 플랜 사용자의 콘텐츠는 Google의 제품 개선 목적으로 활용된다. Paid 플랜부터는 그렇지 않다.
개인 학습 목적의 테스트라면 Free 플랜으로 충분하다. 하지만 고객 데이터, 사내 문서, 계약 내용이 포함된 텍스트를 API에 넣는다면 이야기가 달라진다. 이 경우엔 Paid 플랜 이상이 필수다.
- Free: 콘텐츠 제품 개선 사용 O
- Paid: 콘텐츠 제품 개선 사용 X
- Enterprise: 콘텐츠 제품 개선 사용 X + 고급 보안·컴플라이언스 추가
속도 제한(Rate limits) 차이도 실전에서 크다
Free 플랜은 속도 제한이 낮다. API 호출이 잦은 서비스를 운영하거나, 반복 요청이 많은 자동화 작업을 돌릴 경우엔 금방 한계에 부딪힌다. Paid 플랜은 높은 Rate limits를 제공한다. Enterprise는 여기서 한 발 더 나아가 Provisioned throughput(프로비저닝된 처리량)을 별도로 제공한다.
Gemini 3.5 Flash 모델 — 속도와 검색 기능의 조합
Gemini 3.5 Flash는 속도와 지능을 결합한 모델로, 검색 및 그라운딩(grounding) 기능을 제공한다. 그라운딩이란 모델의 응답을 실제 검색 결과와 연결해 더 신뢰도 높은 답변을 생성하는 기능이다.
Free 플랜에서도 Gemini 3.5 Flash를 무료로 사용할 수 있다. 단, 앞서 언급한 Rate limits 제한과 콘텐츠 제품 개선 사용 조건이 적용된다. 본격적인 서비스나 자동화에는 Paid 플랜 이상을 고려해야 한다.
상황별 추천 — 어떤 플랜이 맞는가
Free 플랜이 맞는 경우
- 개인 학습 또는 프로토타입 테스트 목적
- 호출 빈도가 낮고 민감한 데이터를 다루지 않는 경우
- Google AI Studio 기능만으로 충분한 경우
Paid 플랜이 맞는 경우
- 콘텐츠 보안이 중요한 업무용 데이터를 처리하는 경우
- API 호출량이 많아 Rate limits 제한에 걸리는 경우
- Batch API로 대량 처리 비용을 절감하려는 경우
- Context caching이 필요한 경우
Enterprise 플랜이 맞는 경우
- 고급 보안·컴플라이언스 요건이 있는 기업
- 안정적인 처리량 보장(Provisioned throughput)이 필요한 경우
- 전용 지원 채널이 필요한 조직
Enterprise 플랜의 구체적인 가격은 공식 문서에서 직접 확인이 필요하다. 소스에 별도 수치가 명시되어 있지 않다.
Gemini Advanced 가격 구조를 정리하면 단순히 요금 차이가 아니라 보안 정책, 처리 한도, 기능 범위 전체가 달라진다. 용도를 먼저 정하고 플랜을 선택하는 순서가 맞다. 공식 요금표와 최신 정책은 Google AI 공식 가격 페이지에서 직접 확인하는 것을 권장한다.
다음 단계로 Google AI Studio에 접속해 Free 플랜으로 Gemini 3.5 Flash를 직접 테스트해보세요. 사용량이 늘어나는 시점에서 Paid 플랜 전환 여부를 판단하면 됩니다.