En à peine deux ans, on est passé du célèbre mème « Will Smith mange des spaghettis » (le clip text-to-video bancal qui a fait le tour du web en 2023) à des plans IA crédibles, quasi “documentaires”. Aujourd’hui, je compare OpenAI Sora et Google Generate Media / Veo avec exactement la même photo de référence et le même prompt “film noir”.
Pour situer l’écosystème côté Google, je détaille l’ensemble des outils dans Google AI Studio : la boîte à outils ultime et j’ai testé Past to Forward, une approche d’édition itérative par IA. Côté vidéo open-source, je reviens aussi sur CogVideoX et l’essor des modèles chinois. Enfin, pour un panorama du marché, mon Top 10 des IA 2025 et alternatives gratuites complète bien ce comparatif.
Le prompt d’essai (identique pour les deux)
Animate the black-and-white cinematic portrait in a strong film noir style.
The subject slightly raises his head, without looking at the camera.
He then turns slowly, and walks away into the distance, while heavy rain pours down.
Lighting should create deep shadows and sharp contrasts, with dramatic highlights on the face and rain.
The atmosphere must feel like a classic 1930s/40s film noir scene: moody, melancholic, and mysterious.
Movement should be smooth, natural, and cinematic, like a slow-motion sequence.
Contexte & évolution récente
En 2023, le test “Will Smith + spaghettis” symbolisait les limites physiques et faciales des premiers modèles vidéo (mouvements incohérents, visages qui fondent). En 2025, les dernières générations (ex. Veo 3 dans AI Studio / Gemini API ou Vertex AI) gèrent mieux la grammaire caméra, la continuité des mouvements et la fidélité d’identité. Sora (voir overview officiel) reste impressionnant sur le style et les contrastes.
Résultats (même photo, même prompt)
- Vidéo 1 — Sora :
– Temporalité non respectée (ordre des actions perturbé) ;
– Mouvements incohérents par moments (micro-déformations, glissements) ;
– Je me reconnais à peine ;
– Esthétique film noir très contrastée, highlights puissants… mais au prix d’artefacts. - Vidéo 2 — Google Generate Media / Veo :
– Fidèle à la chronologie (haussement de tête → pivot → marche) ;
– Mouvements propres et continus (sensation “caméraman”) ;
– Fidélité d’identité nettement meilleure ;
– Éclairage ciné plus lisible, pluie mieux intégrée.
Verdict express : pour un rendu ciné propre et crédible, Veo a l’avantage. Pour un noir & blanc spectaculaire et dramatique, Sora séduit, mais gare à la cohérence du mouvement et à l’identité.
Tableau comparatif
Critère | Vidéo 1 — Sora | Vidéo 2 — Google Generate Media (Veo) |
---|---|---|
Temporalité (ordre des actions) | Ne respecte pas la chronologie demandée (haussement de tête → pivot → marche) ; enchaînements parfois compressés/inversés. | Fidèle à la requête : haussement de tête → pivot → marche, rythme « slow-motion » cohérent. |
Cohérence des mouvements | Mouvements parfois incohérents (micro-déformations, légère « dérive » de posture). | Mouvements propres, continus et crédibles, sensation « caméraman ». |
Fidélité d’identité | Je me reconnais à peine ; traits altérés sur certaines frames. | Visage et traits bien conservés tout au long de la séquence. |
Éclairage & style “film noir” | Contrastes très dramatiques, beaux highlights ; parfois au détriment de la cohérence globale. | Éclairage ciné maîtrisé, un peu moins extrême mais plus lisible plan par plan. |
Pluie & particules | Effet pluie crédible mais parfois « superposé » à la scène. | Pluie mieux intégrée ; meilleure interaction avec sujet et arrière-plan. |
Stabilité / grammaire caméra | Légers warps en transition ; stabilité inégale. | Cadres stables, progression fluide ; impression de tournage réel. |
Rendu global | Esthétique forte, mais fragilisée par des incohérences spatio-temporelles. | Cinématique claire, crédible et convaincante. |
Usage recommandé | Clips très stylisés, mood extrême, noir & blanc percutant. | Plans « réalistes » ou narratifs (pub, corporate, fiction courte). |
Vidéo 1 — Sora
Vidéo 2 — Google Generate Media (Veo)
Méthode de test
Même photo N&B (portrait, pas de regard caméra), même prompt, sorties natives (sans post-prod), même ratio et durée comparable.
Image d’illustration

Liens utiles (déjà cités inline)
Pour revoir l’écosystème Google : AI Studio (guide), Past to Forward.
Côté open-source vidéo : CogVideoX.
Panorama marché : Top 10 IA 2025.
Docs officielles : Sora (OpenAI), Veo (DeepMind), Veo via Vertex AI, Veo 3 via Gemini API.
Pour l’histoire : Will Smith + spaghettis (contexte).