🎨 Midjourney v7
Continua sendo a referência estética em 2026. Dialeto simbólico (--flag) e biblioteca de sref/cref poderosa.
📋 Parâmetros essenciais
- •
--ar 21:9proporção (1:1, 4:5, 16:9, 21:9, 9:16) - •
--s 250estilização (0-1000, default 100) — quanto maior, mais "MJ" - •
--chaos 25variação entre 4 imagens (0-100) - •
--weird 250esquisitice controlada (0-3000) - •
--sref [URL] [URL] --sw 100estilo de referência (peso 0-1000) - •
--cref [URL] --cw 100personagem de referência (peso 0-100) - •
--no text, watermarknegativos - •
--seed 12345reprodutibilidade
📋 Exemplo completo
Retrato editorial cinematográfico com estilo de referência e proporção 4:5.
editorial portrait of a Brazilian fisherman, weathered face, Kodak Portra 400, soft window light, 85mm shallow depth --ar 4:5 --s 250 --sref https://yourimage.com/style.jpg --sw 80 --no text, watermark, extra fingers
🎬 Sora 2 (OpenAI)
Vídeo 10-20s com áudio diegético sincronizado. Em 2026 é a única ferramenta que entrega clipe com som ambiente integrado de fábrica.
📋 Padrão de prompt Sora
- • Prompt em linguagem natural cinematográfica (não bullet list)
- • Câmera descrita em prosa: "the camera slowly tracks beside her as she walks"
- • Áudio: "with diegetic sound of [...]" no final
- • Reference image opcional como first frame
- • Duração escolhida na interface (5/10/20s)
📋 Exemplo
A young woman walks through a rainy Tokyo alley at night, neon signs reflecting on the wet pavement. The camera follows her from behind in a smooth tracking shot, slightly low angle. Shot on anamorphic lens, cinematic 2.39:1. Cinestill 800T film stock with characteristic orange halation. With diegetic sound of footsteps on wet concrete, distant traffic, and faint rain on a tin roof.
📹 Veo 3 (Google)
A ferramenta mais "cinematográfica" em 2026, especialmente em aéreos, beauty product, paisagens.
📋 O que controlar em Veo
- • Câmera: "shot on Arri Alexa with anamorphic lens, slow drone push forward"
- • First-frame e last-frame por upload (controle interpolação)
- • Físico-real: chuva, fumaça e fluidos respondem realisticamente
- • Áudio: gerar separado e sincronizar em edição
- • Resolução: 1080p ou 4K (4K em conta enterprise)
A pristine red sports car drives along a coastal highway at sunset. The camera flies alongside in a low aerial tracking shot, golden hour backlight, anamorphic lens flares across the windshield. Shot on Arri Alexa, cinematic color grade with warm highlights and teal shadows. 2.39:1, slow motion 60fps look.
🎞️ Runway Gen-4 + ACT
A ferramenta mais usada em produção comercial real. Forte em references e em ACT (captura de performance facial).
📋 Especialidades
- • References (até 3): personagem, locação, estilo. Peso ajustável.
- • ACT One: grava sua face com webcam e transfere expressão pro personagem gerado.
- • Motion Brush: pintar onde tem movimento e onde não tem.
- • Timeline: editor interno pra concatenar clipes.
- • API estável: usado em pipelines automatizados.
Workflow típico: 3 fotos do personagem → reference 1 (peso 100). 1 foto do cenário → reference 2 (peso 80). Style ref → reference 3 (peso 60). Prompt curto descritivo.
[Refs: character(100), location(80), film_still(60)]
Prompt: "she sits down at the table, takes a sip of coffee, looks out the window. Static camera, medium shot."
⚡ Flux 1.1 Pro + Kontext + Ideogram 3
A "família texto-fiel": quando o prompt tem palavras que precisam sair legíveis (placa, cardápio, embalagem), essas são as ferramentas que entregam.
Flux 1.1 Pro (geração)
- • Prompt longo, descritivo, prosa
- • Texto entre aspas duplas:
"OPEN" - • Realismo fotográfico forte
- • Mãos e anatomia muito boas
Flux Kontext (edição)
- • Imagem + instrução de edit
- • "Change X while keeping everything else identical"
- • Mantém identidade do sujeito entre edits
- • Ideal para variações de produto
Ideogram 3
- • Especialista em tipografia em imagem
- • Pôster, capa de livro, cardápio
- • "Magic Prompt" expande automaticamente
- • Aspect ratio amplo
Quando usar cada
- • Texto 1-3 palavras → Flux ou Ideogram
- • Texto editorial (4+ palavras) → Ideogram
- • Editar produto/cena existente → Kontext
- • Foto realista limpa → Flux 1.1 Pro
🍌 Nano Banana + Kling 2.5 + Seedance 2 + Luma Ray 2
Os "especialistas". Cada uma tem um nicho onde supera as gigantes.
🍌 Nano Banana (Gemini Image)
Edição conversacional com identidade preservada.
"Show her wearing a green coat in the same pose, same lighting."
🎭 Kling 2.5
Vídeo focado em movimento humano realista — dança, expressões, gesto.
Image-to-video com motion guidance.
♾️ Seedance 2
Loops perfeitos. Background de site, displays, projeções de evento.
Use sua skill /seedance-loop-prompt.
🌊 Luma Ray 2
Câmera 3D coerente. Quando precisa de movimento de câmera complexo respeitando geometria.
Trajetória de câmera explícita em prompt.
💡Regra de ouro de 2026
Nenhuma ferramenta é "a melhor". Cada uma tem 1-2 nichos onde domina. O profissional de prompt sabe quando usar qual — não fica fiel a uma plataforma.
✅Resumo do módulo
Próximo Módulo:
2.2 — Controle de composição (i2i, ControlNet, character consistency)