Mapa da trilha
🧬 Anatomia de um prompt
Sujeito, estilo, composição, luz, cor, ordem
📷 Linguagem fotográfica
Lentes, DOF, ISO, luz, ângulo, distância
🎞️ Linguagem cinematográfica
Aspect, grading, diretores, filme, negativos
🏋️ Exercícios práticos
6 desafios pra fixar tudo
🗺️ Passo-a-passo
Seu primeiro still cinematográfico
Conteúdo detalhado
Clique nos tópicos pra abrir o resumo. Pra ver tudo, abra a página completa do módulo.
🧬 Anatomia de um prompt visual
As 6 peças que todo prompt visual precisa ter — e por que a ordem importa quase tanto quanto as palavras.
A tríade fundamental — quem (sujeito), fazendo o que (ação), onde (ambiente). Sem esses três, o modelo improvisa e você vira refém do estilo padrão dele.
90% dos prompts ruins falham aqui: descrevem só o sujeito ("uma mulher bonita") e deixam ação/ambiente em branco. O resultado é genérico porque o briefing foi genérico.
Sujeito específico · verbo de ação concreto (não "estando", e sim "correndo/segurando/olhando") · ambiente com 1-2 detalhes diferenciais.
A declaração do meio visual: fotografia, pintura a óleo, render 3D, anime cel-shading, aquarela, gravura. Define todo o "como" antes de o "o quê".
É o parâmetro que mais muda o resultado. "Foto" e "ilustração" do mesmo sujeito viram universos diferentes. Sem declarar, o modelo escolhe o que viu mais nos dados de treino.
Comece o prompt com o meio · evite misturar meios na mesma frase · combine meio + sub-estilo (ex: "foto editorial", "ilustração editorial").
Onde os elementos ficam no quadro: centralizado, regra dos terços, simetria perfeita, off-center, leading lines, frame-within-frame.
O modelo tem viés de centralizar tudo. Sem instrução de composição, você sempre recebe a versão "selfie centralizada". Composição é o que tira o prompt do amador.
Use termos canônicos ("rule of thirds", "symmetric composition", "leading lines") · indique onde o sujeito está no quadro (left third, center, foreground/background).
Um descritor de luz curto e canônico que define direção, qualidade e cor da iluminação — antes de qualquer ajuste técnico.
Luz é o que separa "imagem renderizada" de "imagem fotografada". Modelos foram treinados em milhões de imagens com descritores de luz — usá-los ativa o conhecimento certo.
Termos prontos: golden hour, blue hour, hard noon sun, overcast soft light, soft box, rim light, neon spill, candlelight, moonlight.
A escolha consciente de 2-3 cores dominantes e um adjetivo de mood (melancólico, vibrante, sereno, ameaçador) que guia a emoção da cena.
Sem paleta declarada, o modelo joga todas as cores. Declarar paleta dá coesão e identidade — é o que faz uma série de imagens parecer da mesma campanha.
Combos prontos: teal & orange, monochromatic blue, warm earth tones, pastel candy, high-contrast black & red · sempre + 1 adjetivo de mood.
A regra prática: palavras no início do prompt pesam mais. O modelo presta mais atenção nos primeiros tokens — então a ordem é hierárquica, não estética.
Dois prompts com as mesmas palavras em ordens diferentes geram imagens diferentes. Saber ordenar é como saber priorizar num briefing.
Ordem padrão: meio → sujeito → ação → ambiente → luz → composição → estilo/paleta → técnicos · negativos ao final ou em parâmetro próprio.
📷 Linguagem fotográfica
O vocabulário do fotógrafo virado parâmetros de prompt. Lente, abertura, ISO, luz, ângulo, distância.
A distância focal da lente. Define o quanto de cena cabe no quadro e como o espaço é distorcido — grande angular exagera profundidade, teleobjetiva comprime tudo.
Dizer "shot on 35mm" muda mais a imagem do que mudar a pessoa fotografada. Cada lente carrega uma psicologia: 24mm é imersivo, 85mm é íntimo, 200mm é voyeurístico.
24mm wide · 35mm humano natural · 50mm clássico · 85mm retrato · 135mm cinema · anamórfica 2.39:1 · macro · fisheye.
Quanto da imagem fica em foco. f/1.4 isola o sujeito com fundo desfocado (bokeh); f/8 entrega tudo nítido do primeiro plano ao fundo.
É o segundo parâmetro mais "fotográfico". Resolve por si só a leitura visual: profundidade rasa diz "olhe aqui", profundidade ampla diz "absorva tudo".
Shallow depth of field · creamy bokeh · subject isolation · deep focus · everything in focus · split focus · tilt-shift.
A textura granular que diferencia filme de digital. ISO baixo = limpo; ISO alto + filme = grão visível, ruído orgânico, sensação de presença.
"Limpo demais" é a marca registrada de imagem de IA mal escrita. Grão e textura quebram esse efeito de plástico e empurram o resultado pra "fotografia real".
Film grain · Kodak Portra 400 · Cinestill 800T · ISO 1600 · push-processed · halation · soft analog texture.
Três eixos pra descrever qualquer luz: direção (frontal, lateral, contraluz, top), qualidade (dura/macia) e temperatura (quente/fria).
Profissionais não dizem "luz boa", eles especificam. Com 3 palavras certas você comunica mais sobre clima do que com 30 adjetivos genéricos.
Hard light · soft box · rim light · backlight · top light Caravaggio · split light · Rembrandt light · neon spill · practical lights.
A posição da câmera em relação ao sujeito. Cada ângulo carrega significado: low angle = poder, high angle = vulnerabilidade, dutch angle = instabilidade.
Ângulo é narrativa. Sem declarar, o modelo escolhe eye-level genérico — você abandona uma das ferramentas mais expressivas do quadro.
Low angle hero shot · high angle · top-down/bird's eye · dutch tilt · eye-level · over-the-shoulder · POV first person.
O quanto do sujeito aparece no quadro: extreme close-up (só olhos), close-up (rosto), medium (cintura), wide (corpo + ambiente), extreme wide (paisagem).
É como você dirige a leitura emocional. Close-up = intimidade. Wide = isolamento ou grandiosidade. Sem isso o modelo entrega medium genérico.
Extreme close-up · close-up · medium shot · cowboy shot · full body · wide shot · extreme wide · establishing shot.
🎞️ Linguagem cinematográfica
Do still pro cinema. Aspect ratio, color grading, diretores de referência, estoques de filme, halation e negative prompts.
A proporção do quadro. 2.39:1 é cinema anamórfico, 16:9 é TV/YouTube, 4:3 é nostálgico/vintage, 9:16 é Reels/Shorts/Stories.
Aspect ratio sozinho já comunica "tipo de coisa". 2.39:1 ativa o cérebro pra modo cinema antes mesmo da imagem ser interpretada.
Cinematic 2.39:1 widescreen · academy 1.85:1 · standard 16:9 · vintage 4:3 · vertical 9:16 social.
A "color science" que define a paleta final do filme. Não é só cor — é a relação entre sombras, meios-tons e altas luzes em cada canal.
Cada nome de grading carrega décadas de cinema: "teal & orange" é blockbuster americano; "bleach bypass" é Saving Private Ryan; "Kodachrome warm" é nostalgia.
Teal & orange · bleach bypass · cross-processed · ENR · sepia warm · cold desaturated · Wes Anderson pastel · Fincher green-yellow.
Nomes-âncora que codificam um pacote inteiro de decisões visuais. "Roger Deakins" = luz natural exagerada, silhuetas, paleta restrita.
É o atalho mais poderoso do prompt. Uma referência boa substitui 5 linhas de descrição técnica — desde que o modelo conheça o estilo.
Roger Deakins · Emmanuel Lubezki · Christopher Doyle · Wes Anderson · Denis Villeneuve · David Fincher · Wong Kar-wai · Greig Fraser.
Marcas e códigos de filme analógico que carregam ciência de cor própria: tons de pele, contraste, grão e resposta à luz característicos.
Citar um estoque entrega 80% do "look" de uma vez. "Kodak Portra 400" sozinho já faz tons de pele cremosos e cor levemente desaturada.
Kodak Portra 400 · Cinestill 800T · Kodak Vision3 500T · Fujifilm Velvia · Ilford HP5 (P&B) · Ektachrome · Polaroid SX-70.
Três defeitos felizes: halation é o halo laranja em luzes brilhantes (filme), bloom é o brilho difuso geral, lens flare é o reflexo da lente.
São as "imperfeições" que o cérebro lê como autêntico. Sem eles, a imagem fica clinicamente perfeita — o que é a marca de IA mal direcionada.
Subtle halation · anamorphic lens flare · soft bloom · highlight glow · chromatic aberration · light leaks.
A lista do que o modelo deve EVITAR. Disponível como campo separado em SD/Flux, ou via "--no" em Midjourney. Pra modelos sem campo, usar prompt limpo.
Resolve 80% dos problemas crônicos: dedos extras, watermark, baixa qualidade, texto borrado, cores saturadas demais.
--no text, watermark, blurry, low quality, extra fingers, deformed, oversaturated, plastic, cartoon (em foto realista).
🏋️ Exercícios práticos
Seis desafios pra fixar o que aprendeu. Cada um traz briefing, critério de "feito" e prompt-resposta esperado (oculto pra não dar de bandeja).
Você recebe "a beautiful woman" e tem 5 minutos pra transformar em prompt completo aplicando os 6 elementos do módulo 1.1.
É o exercício de campo mais real: 90% dos prompts que você vai receber de cliente vão começar assim. Treinar a reescrita vira reflexo.
Critério de feito: o prompt final tem meio + sujeito específico + ação + ambiente + luz + composição + paleta + estilo.
Escolha uma cena (ex: barista atrás do balcão), escreva 3 prompts idênticos mudando só a lente, gere e compare.
Treina o olho a perceber o efeito real da focal — não é teoria, é diferença visual sentada na mesa.
Critério de feito: você consegue explicar em uma frase por que cada lente conta uma história diferente da mesma cena.
Personagem solo em um quarto. Gere 4 versões: golden hour pela janela, top light Caravaggio, neon roxo e blue hour com luz prática.
Mostra na pele que luz não é decoração — é narrativa. A mesma pessoa vira 4 personagens com 4 tipos de luz.
Critério de feito: cada uma das 4 imagens evoca um gênero diferente (romance, thriller, sci-fi, drama).
Café da manhã num diner. Gere em Wes Anderson, depois Fincher, depois Wong Kar-wai. Sem mudar a cena, só o pacote estilístico.
Você prova pra si mesmo que referências de diretor são atalhos densos. Aprende quais funcionam bem em qual modelo.
Critério de feito: as 3 imagens são reconhecíveis como cada estilo sem você precisar legendar qual é qual.
Gere uma imagem propositalmente "limpa demais" (sem grão, sem halation). Depois adicione descritores até parecer filme real.
Entender o "pior" pra entender o "melhor". Você ganha radar pra perceber a marca de IA mal direcionada em qualquer imagem.
Critério de feito: na 3ª versão, alguém olha sem contexto e não diz "isso é IA" de cara.
Crie UMA cena que vai ser sua "régua" — aquela que você roda sempre que quiser comparar ferramenta, modelo ou ajuste.
Profissional sério tem um prompt-padrão. Sem isso você fica comparando coisas diferentes e nunca consegue julgar evolução.
Critério de feito: você roda o mesmo prompt em 3 ferramentas e consegue defender qual ficou melhor com argumentos visuais.
🗺️ Passo-a-passo: seu primeiro still cinematográfico
Caminhada guiada do zero ao resultado. Pegamos um briefing real e construímos o prompt camada por camada, aplicando tudo da trilha.
Briefing inicial: "Foto cinematográfica de um motorista de táxi em São Paulo, noite chuvosa." Quebramos em sujeito/ambiente/mood explícitos.
A maior parte do trabalho não é "escrever o prompt", é entender o que o briefing está pedindo de verdade. Aqui você treina esse músculo.
Identificar: sujeito (motorista), idade/contexto (40s, cansado), ambiente (táxi parado, semáforo, chuva), mood (solitário, cinematográfico).
Pra solidão, escolhemos 85mm (compressão íntima) e medium close-up através do para-brisa, com profundidade rasa pra borrar a chuva.
Decisão visual narrativa, não técnica. A lente foi escolhida pelo que conta sobre o personagem, não pelo "qual é mais bonita".
Lente: 85mm · enquadramento: medium close-up · profundidade: shallow (f/1.8) · ponto de vista: através do para-brisa.
Luz prática: semáforo vermelho como key light no rosto, neons azuis da rua atrás, faróis de outro carro vindo de frente como rim light.
Cena de noite urbana não é "escura" — é cheia de fontes pontuais. Mapear cada fonte é como o DP pensa, não como o amador pensa.
Practical lights · key (semáforo vermelho) · fill (neon azul) · rim (faróis) · ambient (chuva refletindo asfalto).
Paleta: vermelho saturado + azul cyan + sombras pretas (alta saturação, alto contraste). Referência: estética de Wong Kar-wai meets Taxi Driver.
Sem ancoragem em referência, o modelo escolhe sozinho. Com ancoragem, você dirige o estilo com 2 palavras-âncora densas.
Paleta: red + cyan + black · estoque: Cinestill 800T (clássico para neon noturno) · ref: Wong Kar-wai, Taxi Driver mood.
Juntamos tudo na ordem hierárquica: meio → sujeito → ação → ambiente → luz → composição → paleta/estoque → técnicos. Aplicação direta do 1.1.6.
Você vê na prática como cada bloco entra. Mesmo que esqueça nomes técnicos, lembra da estrutura.
Prompt final fica visível no módulo completo — em PT e EN, com variações pra cada ferramenta principal.
Geramos, olhamos o que falhou, ajustamos UMA variável por vez. Se o motorista saiu jovem demais, só esse campo muda. Não reescreve tudo.
Iniciante reescreve tudo a cada erro. Profissional muda 1 variável e isola a causa. Esse hábito triplica a velocidade.
Iteração isolada · seed fixo pra comparar mudanças · log do que mudou em cada versão · critério visual de "feito".