Google Gemini API: Guide complet

Google Gemini API: Guide complet

API gratuite, intégration, modèles disponibles et cas d'usage

Google Gemini est la famille de modèles d'IA multimodale développée par Google DeepMind. Lancée fin 2023, elle succède à PaLM 2 et s'intègre dans l'écosystème Google Cloud (Vertex AI) et via l'API Gemini accessible gratuitement avec des limites généreuses.

Qu'est-ce que Gemini ?

Gemini est une famille de modèles multimodaux capables de traiter et générer dutexte, des images, du code, de l'audioet de la vidéo. Google propose plusieurs versions adaptées à différents usages :

  • Gemini Ultra : modèle le plus puissant (équivalent GPT-4), réservé à Gemini Advanced (abonnement payant)
  • Gemini Pro : modèle équilibré (performance/coût), disponible gratuitement via l'API avec quotas généreux
  • Gemini Flash : modèle rapide et léger, optimisé pour la latence (idéal mobile, chat, temps réel)
  • Gemini Nano : modèle on-device pour smartphones (Pixel, Galaxy S24), fonctionne hors ligne

API Gemini gratuite : ce qu'il faut savoir

Google propose un tier gratuit extrêmement généreux pour l'API Gemini :

  • Gemini Pro 1.5 : 15 requêtes/minute, 1 500 requêtes/jour, 1,5 million tokens/jour (entrée + sortie)
  • Gemini Flash 1.5 : 15 requêtes/minute, 1 500 requêtes/jour, 1,5 million tokens/jour
  • Pas de carte bancaire requise : créez une clé API sur Google AI Studio sans paiement
  • Contexte large : jusqu'à 1 million de tokens (vs 128k pour GPT-4 Turbo)
  • Multimodal natif : envoyez texte + images + vidéo dans la même requête

Pour des volumes supérieurs, Google Cloud propose des tarifs pay-as-you-go viaVertex AI (facturation au token, sans minimum).

Comment obtenir une clé API gratuite ?

L'accès à l'API Gemini se fait via Google AI Studio :

  1. Rendez-vous sur ai.google.dev
  2. Connectez-vous avec votre compte Google
  3. Cliquez sur « Get API Key » → « Create API Key »
  4. Sélectionnez un projet Google Cloud (ou créez-en un)
  5. Copiez votre clé API (format AIzaSy...)
  6. Stockez-la de manière sécurisée (variables d'environnement, secret manager)

Important : ne commitez jamais votre clé API dans un repo public. Utilisez des variables d'environnement (.env) ou des secrets GitHub/Vercel.

Intégration de l'API Gemini (JavaScript/TypeScript)

Google fournit un SDK officiel @google/generative-ai pour Node.js et navigateurs :

# Installation
npm install @google/generative-ai

# Exemple basique (Node.js)
import { GoogleGenerativeAI } from '@google/generative-ai';

const genAI = new GoogleGenerativeAI(process.env.GEMINI_API_KEY);
const model = genAI.getGenerativeModel({ model: 'gemini-pro' });

const prompt = "Explique l'IA générative en 3 phrases";
const result = await model.generateContent(prompt);
const response = await result.response;
const text = response.text();

console.log(text);

Cas d'usage avancés

Gemini excelle dans plusieurs domaines grâce à sa nature multimodale :

  • Vision + Texte : analysez des captures d'écran, diagrammes, documents scannés (« Extrais le texte de cette facture »)
  • Génération de code : « Écris une fonction React pour valider un email »
  • Traduction multilingue : support de 100+ langues
  • Résumé de longs documents : contexte de 1 million de tokens (≈750 000 mots)
  • Chat avec historique : conversations multi-tours avec mémoire contextuelle
  • Function calling : Gemini peut appeler vos fonctions/API (ex : recherche, calculs, CRM)
  • Embeddings : générez des vecteurs sémantiques pour search/RAG (text-embedding-004)

Exemple : analyse d'image avec Gemini

import { GoogleGenerativeAI } from '@google/generative-ai';
import fs from 'fs';

const genAI = new GoogleGenerativeAI(process.env.GEMINI_API_KEY);
const model = genAI.getGenerativeModel({ model: 'gemini-pro-vision' });

// Lire une image locale (ou URL)
const imageData = fs.readFileSync('screenshot.png').toString('base64');

const imageParts = [
  {
    inlineData: {
      data: imageData,
      mimeType: 'image/png',
    },
  },
];

const prompt = "Décris cette image en détail et identifie les éléments UI";
const result = await model.generateContent([prompt, ...imageParts]);
const response = await result.response;
const text = response.text();

console.log(text);

Streaming et réponses temps réel

Pour une expérience utilisateur fluide (chatbot, interface conversationnelle), utilisez lestreaming :

const model = genAI.getGenerativeModel({ model: 'gemini-flash' });
const prompt = "Écris un poème sur le Maroc";

const result = await model.generateContentStream(prompt);

// Afficher les tokens au fur et à mesure
for await (const chunk of result.stream) {
  const chunkText = chunk.text();
  process.stdout.write(chunkText);
}

Gemini vs ChatGPT : comparaison

CritèreGemini ProGPT-4 Turbo
Contexte max1M tokens128k tokens
Multimodal natif✅ Texte + image + vidéo✅ Texte + image
API gratuite✅ 1,5M tokens/jour❌ Payant uniquement
LatenceFlash : très rapideModéré
ÉcosystèmeGoogle Cloud, WorkspaceAzure, OpenAI

Pricing Vertex AI (au-delà du gratuit)

Si vous dépassez les quotas gratuits, basculez sur Vertex AI (Google Cloud) :

  • Gemini Pro 1.5 : $0,00125/1k tokens (input), $0,005/1k tokens (output)
  • Gemini Flash 1.5 : $0,000075/1k tokens (input), $0,0003/1k tokens (output) → 10x moins cher
  • Contexte étendu : surcoût pour contexte >128k tokens
  • Facturation au token réel : pas de minimum, idéal pour prototypage

Limites et considérations

  • Disponibilité géographique : l'API gratuite est disponible dans 180+ pays, mais certaines régions (Chine, Russie) peuvent avoir des restrictions
  • Contenu policy : Google applique des filtres de sécurité (violence, haine, NSFW) plus stricts qu'OpenAI
  • Données d'entraînement : Google confirme que les inputs API gratuite ne sont pas utilisés pour entraîner les modèles (opt-out par défaut)
  • Latence variable : Gemini Pro peut être plus lent que GPT-4 Turbo sur certaines requêtes (utilisez Flash pour la vitesse)

Besoin d'aide pour intégrer Gemini ?

Notre équipe VOID peut vous accompagner sur l'intégration de Gemini dans vos produits : chatbots, analyseurs de documents, assistants vocaux, génération de contenu, RAG (Retrieval-Augmented Generation). Nous intervenons sur :

  • Intégration API Gemini (Node.js, Python, Next.js)
  • Architecture RAG (embeddings + vector DB + Gemini)
  • Optimisation des prompts (few-shot, chain-of-thought)
  • Streaming et UX temps réel
  • Migration OpenAI → Gemini
Discuter de votre projet IA

Ressources complémentaires

  • Expertise Intelligence Artificielle : conseil, intégration, formations IA
  • Toutes nos publications : guides et actualités tech
  • Google AI Studio : interface graphique pour tester Gemini (ai.google.dev)
  • Documentation officielle : guides et API reference (ai.google.dev/docs)
  • Vertex AI : plateforme Google Cloud pour production (cloud.google.com/vertex-ai)

Note : Gemini est une marque déposée de Google LLC. Cet article présente les fonctionnalités en 2025. Les quotas, tarifs et modèles peuvent évoluer. Consultez ai.google.dev pour les informations officielles.