Trilha 3 — Avançado | Prompt Director

Mapa da trilha

3.1~60 min

🎨 Direção de arte com IA

Bíblia visual, anchors, série coerente

3.2~55 min

📖 Storytelling em sequência

Storyboard, beats, match cut

3.3~60 min

🔧 Pipeline híbrido

IA + foto real, AE, lipsync, finalização

3.4~50 min

🏋️ Exercícios práticos

6 desafios de produção real

3.5~55 min

🗺️ Passo-a-passo: 3 cenas coerentes

Mini-curta com personagem e arco

Conteúdo detalhado

Clique nos tópicos para abrir o resumo.

3.1~60 min

🎨 Direção de arte com IA

Construir uma bíblia visual e manter coerência entre 20 imagens.

O que é:

Documento curto (1 página) que define os "não-negociáveis" visuais: paleta-mestre, lente padrão, estoque de filme, mood, referências.

Por que aprender:

Sem bíblia, cada nova imagem reinventa o estilo. Com bíblia, você cola um bloco padrão em todo prompt — coerência garantida.

Conceitos-chave:

Bloco de identidade fixo · 3-5 imagens de referência base · checklist de invariantes.

O que é:

Usar 3 referências (diretor + estoque + estética) que se reforçam mutuamente. "Roger Deakins + Cinestill 800T + Blade Runner mood".

Por que aprender:

Uma referência sozinha o modelo interpreta livre. Três que apontam pro mesmo lugar fecham o cerco.

Conceitos-chave:

DP + estoque + mood/filme · cruzar sempre que possível · evitar referências conflitantes.

O que é:

Workflow completo: foto-base nítida + 3-5 ângulos + descrição invariante + roupa explícita por cena + iteração por seed.

Por que aprender:

--cref sozinho dura 3-5 imagens. Pra 20 cenas você precisa de processo, não só feature.

Conceitos-chave:

Foto-base de 1024px+ · ângulos diversos · "casting card" textual · vestuário variante separado.

O que é:

Manter o mesmo apartamento, café ou rua entre múltiplas cenas em horários diferentes. Mesma estratégia de char ref, aplicada a location.

Por que aprender:

Espectador percebe troca de cenário antes de trocar de personagem. Locação coerente é fundamental para narrativa.

Conceitos-chave:

Master shot da locação · ângulos diferentes da mesma · luz como variável · objetos fixos como âncoras.

O que é:

Paleta principal fixa + 1-2 acentos que mudam por cena/emoção. Ex: base teal/orange, acento rosa em cena romântica, vermelho em conflito.

Por que aprender:

Coesão visual ≠ monotonia. Paleta-mestre dá identidade; acentos modulam emoção sem quebrar o todo.

Conceitos-chave:

3 cores-base fixas · 1-2 acentos modulares · adjetivo de mood vinculado ao acento.

O que é:

Template em Notion/Markdown que captura o briefing do cliente em campos estruturados: público, objetivo, mood, palavras-proibidas, formato final.

Por que aprender:

Briefing verbal não escala. Documento estruturado vira insumo direto para gerar a bíblia visual.

Conceitos-chave:

Campos fixos · referências obrigatórias · proibidos explícitos · formato de entrega.

Ver Completo

3.2~55 min

📖 Storytelling em sequência

Como contar história com 5-10 imagens ou clipes em ordem.

O que é:

Antes de gerar vídeo, gerar 5-10 stills que são o storyboard. Cada um = 1 shot.

Por que aprender:

Errar barato em still > errar caro em vídeo. Aprovar o storyboard antes de animar.

Conceitos-chave:

1 still = 1 shot · usar i2i entre eles para coerência · validar tudo antes de animar.

O que é:

Estrutura clássica: estabelecer → introduzir conflito → escalar → resolver. Cada beat = 1 imagem ou clipe.

Por que aprender:

Sequência de imagens lindas mas sem beat narrativo = montagem de stock. Beats dão sentido.

Conceitos-chave:

Estabelecimento · introdução · ação · clímax · resolução · cada beat com função clara.

O que é:

Match cut: forma/composição idêntica entre fim de A e início de B (Kubrick: osso → satélite). Cut motivado: luz, som ou movimento "justifica" o corte.

Por que aprender:

Em IA-vídeo, cortes mal motivados gritam "isso é montagem de IA". Match cut elegante esconde a costura.

Conceitos-chave:

Planejar o cut no storyboard · gerar último frame de A pensando no primeiro de B · luz como ponte.

O que é:

Cross-fade, whip pan, J-cut (áudio antes), L-cut (áudio depois), morph cut, dissolve. Cada uma serve uma situação.

Por que aprender:

Transição genérica (corte seco em movimento) entrega tudo plano. Transições motivadas dão ritmo e camada de leitura.

Conceitos-chave:

Cross-fade para tempo passando · whip pan para urgência · morph cut para evolução interna do personagem.

O que é:

A emoção da sequência sobe e desce em curva planejada. Não fica nivelada. Mood arc é o gráfico dessa modulação.

Por que aprender:

Sequência sem arco vira tédio. Arco emocional simples (calmo → tenso → liberado) já dá leitura.

Conceitos-chave:

Mapear emoção por shot · usar luz/paleta como variável de mood · subir antes do clímax.

O que é:

IA gera matéria-prima. Edição faz o produto. DaVinci Resolve (free) é o padrão profissional; CapCut para rapidez.

Por que aprender:

Sem edição, você entrega "clipes". Com edição, você entrega "cena".

Conceitos-chave:

Color match entre clipes · trimming preciso · áudio em camadas · graphics overlay.

Ver Completo

3.3~60 min

🔧 Pipeline híbrido

IA + foto real, After Effects, lipsync, foley, finalização e entrega.

O que é:

Foto real do produto/pessoa + cenário gerado por IA, compostos em Photoshop ou Krea. Melhor dos dois mundos: identidade exata + cenário inviável.

Por que aprender:

Marca, produto e pessoa real raramente saem perfeitos só de IA. Combinar é mais profissional que insistir.

Conceitos-chave:

Mask do sujeito real · cenário IA · color match · light match · grain unificador.

O que é:

Clipe IA importado em AE para rotoscopia (isolar sujeito), tracking (adicionar elementos que seguem movimento) ou title cards.

Por que aprender:

Clipe IA "puro" tem look de IA. Adicionar overlay, lower-third, grade adicional em AE transforma em produto comercial.

Conceitos-chave:

RotoBrush 3 do AE 2026 · Mocha planar tracker · Magic Mask do DaVinci · Lumetri Color Grade.

O que é:

Gerar voz IA (ElevenLabs), aplicar lipsync na pessoa do clipe IA (HeyGen, Sync.so), ou clonar voz para narração própria.

Por que aprender:

Em 2026, vídeo sem voz fala parece amadora. Lipsync ruim parece fraudulento. Ferramenta certa resolve.

Conceitos-chave:

ElevenLabs v3 (em PT-BR) · HeyGen pro lipsync confiável · ética e consentimento sempre.

O que é:

Som ambiente (cidade, floresta) + foley (passos, objetos) + música. Sora 2 entrega bom diegético; outras precisam de edição.

Por que aprender:

90% da percepção de "produção" vem do áudio. Imagem boa + som ruim = parece amador. Imagem fraca + som rico = aceita.

Conceitos-chave:

Camadas: ambiente sutil · foley pontual · música baixa · diálogo dominante · ducking automático.

O que é:

Topaz Video AI para 1080p ou 4K. Color grading final em DaVinci. Adicionar grão unificador. Audio mastering.

Por que aprender:

Cliente broadcast/agência exige especificações. Sem entender delivery specs, vídeo é rejeitado.

Conceitos-chave:

Topaz Proteus model · DaVinci Color Page · LUF -23 para broadcast · LUF -14 para web.

O que é:

H.264 para web/social, ProRes 422 para edição, DNxHD para broadcast. Rec.709 para web, Rec.2020 para HDR. Naming versionado.

Por que aprender:

Trabalho de IA é o conteúdo; entrega é o profissionalismo. Cliente lembra do "como" tanto quanto do "que".

Conceitos-chave:

Codec por canal · color space por destino · bitrate adequado · naming consistente · multiformat package.

Ver Completo

3.4~50 min

🏋️ Exercícios práticos

6 desafios que reproduzem o dia-a-dia de produção real.

O que é:

Crie uma marca fictícia (ex: café "Norte 22"). Documente paleta, fonte, mood, 5 imagens de referência, lente padrão, estoque.

Critério de feito:

Outra pessoa lê e consegue gerar 3 imagens coerentes com a marca sem você ajudar.

Conceitos-chave:

Coesão > criatividade · invariantes claros · bloco-prompt reutilizável.

O que é:

Crie um personagem e gere 10 cenas dele em situações diferentes do dia. Manhã (3), tarde (4), noite (3).

Critério de feito:

Pessoa desconhecida olha e diz "é o mesmo personagem" em todas as 10.

Conceitos-chave:

--cref alto · descrição invariante repetida · vestuário variante coerente · luz como variável.

O que é:

Conte uma micro-história em 6 stills: estabelecer → introduzir → escalar → clímax → resolver → ecoar.

Critério de feito:

Espectador entende o arco emocional sem texto explicativo.

Conceitos-chave:

1 beat por frame · luz/paleta como modulação emocional · personagem ou objeto-âncora.

O que é:

Crie 2 clipes de 3s onde o último frame de A tem composição/forma idêntica ao primeiro de B. Ex: xícara de café → poça refletindo.

Critério de feito:

Quando você corta entre eles, a costura é elegante, não confusa.

Conceitos-chave:

Planejar forma compartilhada · último frame de A pensado como primeiro de B · circulares e radiais funcionam bem.

O que é:

Pegue uma foto real sua (ou de produto). Gere um cenário fantástico em IA. Componha em Photoshop com matching de luz/cor.

Critério de feito:

Cabe na thumbnail do Instagram sem alguém perceber a composição.

Conceitos-chave:

Recortar com IA (Photoshop Generative Fill) · color match · sombra própria · grão unificador.

O que é:

Gere um clipe IA de uma pessoa falando 1 frase. Gere áudio em ElevenLabs em PT-BR. Aplique lipsync.

Critério de feito:

Lipsync convincente em 100% da frase. Som natural, sem robótico.

Conceitos-chave:

Voz com nuance · texto curto inicialmente · HeyGen ou Sync.so · ambient room tone por baixo.

Ver Completo

3.5~55 min

🗺️ Passo-a-passo: 3 cenas coerentes

Mini-curta de 30s. Personagem único, locação única, 3 horas do dia. Aplica tudo da T3.

O que é:

Briefing: "Um dia na vida de uma ceramista paulistana, 30s, 3 momentos do mesmo ateliê." Bíblia visual: ela + ateliê + paleta terra + Cinestill 800T + Wong Kar-wai mood.

Por que aprender:

Tudo começa documentado. Quem não escreve a bíblia, vai gerar 30 versões diferentes do mesmo ateliê.

O que é:

Cena 1 (manhã): master shot + close das mãos no torno. Cena 2 (tarde): wide do ateliê + medium dela pintando. Cena 3 (noite): close da peça pronta + ela admirando.

Por que aprender:

Storyboard valida o arco antes de animar. Iterar nele é 10x mais barato.

O que é:

Gerar a ceramista em 4 ângulos como casting card. Usar como --cref em todos os shots. Adicionar bloco invariante de descrição em cada prompt.

Por que aprender:

É o passo que separa "série coerente" de "primas parecidas".

O que é:

Runway Gen-4 com still como first frame + character ref + movimento sutil descritivo. Cada clipe 5s = 30s totais.

Por que aprender:

É o "ato de filmar" do projeto. Aqui o storyboard ganha vida.

O que é:

DaVinci Resolve. Cuts motivados por luz (sol entrando → sombra crescendo → lâmpada acesa). Color match unificado. Música ElevenLabs Music ambient.

Por que aprender:

É onde 6 clipes viram 1 filme.

O que é:

Master 16:9 → reframe pra 9:16 (Reels) → reframe pra 1:1 (feed). Topaz upscale 1080p. Naming versionado. Package pra cliente.

Por que aprender:

É o que diferencia "entreguei o vídeo" de "entreguei a campanha".

Ver Completo

← Trilha 2 Trilha 4: Receitas →