Mapa da trilha
🎨 Direção de arte com IA
Bíblia visual, anchors, série coerente
📖 Storytelling em sequência
Storyboard, beats, match cut
🔧 Pipeline híbrido
IA + foto real, AE, lipsync, finalização
🏋️ Exercícios práticos
6 desafios de produção real
🗺️ Passo-a-passo: 3 cenas coerentes
Mini-curta com personagem e arco
Conteúdo detalhado
Clique nos tópicos para abrir o resumo.
🎨 Direção de arte com IA
Construir uma bíblia visual e manter coerência entre 20 imagens.
Documento curto (1 página) que define os "não-negociáveis" visuais: paleta-mestre, lente padrão, estoque de filme, mood, referências.
Sem bíblia, cada nova imagem reinventa o estilo. Com bíblia, você cola um bloco padrão em todo prompt — coerência garantida.
Bloco de identidade fixo · 3-5 imagens de referência base · checklist de invariantes.
Usar 3 referências (diretor + estoque + estética) que se reforçam mutuamente. "Roger Deakins + Cinestill 800T + Blade Runner mood".
Uma referência sozinha o modelo interpreta livre. Três que apontam pro mesmo lugar fecham o cerco.
DP + estoque + mood/filme · cruzar sempre que possível · evitar referências conflitantes.
Workflow completo: foto-base nítida + 3-5 ângulos + descrição invariante + roupa explícita por cena + iteração por seed.
--cref sozinho dura 3-5 imagens. Pra 20 cenas você precisa de processo, não só feature.
Foto-base de 1024px+ · ângulos diversos · "casting card" textual · vestuário variante separado.
Manter o mesmo apartamento, café ou rua entre múltiplas cenas em horários diferentes. Mesma estratégia de char ref, aplicada a location.
Espectador percebe troca de cenário antes de trocar de personagem. Locação coerente é fundamental para narrativa.
Master shot da locação · ângulos diferentes da mesma · luz como variável · objetos fixos como âncoras.
Paleta principal fixa + 1-2 acentos que mudam por cena/emoção. Ex: base teal/orange, acento rosa em cena romântica, vermelho em conflito.
Coesão visual ≠ monotonia. Paleta-mestre dá identidade; acentos modulam emoção sem quebrar o todo.
3 cores-base fixas · 1-2 acentos modulares · adjetivo de mood vinculado ao acento.
Template em Notion/Markdown que captura o briefing do cliente em campos estruturados: público, objetivo, mood, palavras-proibidas, formato final.
Briefing verbal não escala. Documento estruturado vira insumo direto para gerar a bíblia visual.
Campos fixos · referências obrigatórias · proibidos explícitos · formato de entrega.
📖 Storytelling em sequência
Como contar história com 5-10 imagens ou clipes em ordem.
Antes de gerar vídeo, gerar 5-10 stills que são o storyboard. Cada um = 1 shot.
Errar barato em still > errar caro em vídeo. Aprovar o storyboard antes de animar.
1 still = 1 shot · usar i2i entre eles para coerência · validar tudo antes de animar.
Estrutura clássica: estabelecer → introduzir conflito → escalar → resolver. Cada beat = 1 imagem ou clipe.
Sequência de imagens lindas mas sem beat narrativo = montagem de stock. Beats dão sentido.
Estabelecimento · introdução · ação · clímax · resolução · cada beat com função clara.
Match cut: forma/composição idêntica entre fim de A e início de B (Kubrick: osso → satélite). Cut motivado: luz, som ou movimento "justifica" o corte.
Em IA-vídeo, cortes mal motivados gritam "isso é montagem de IA". Match cut elegante esconde a costura.
Planejar o cut no storyboard · gerar último frame de A pensando no primeiro de B · luz como ponte.
Cross-fade, whip pan, J-cut (áudio antes), L-cut (áudio depois), morph cut, dissolve. Cada uma serve uma situação.
Transição genérica (corte seco em movimento) entrega tudo plano. Transições motivadas dão ritmo e camada de leitura.
Cross-fade para tempo passando · whip pan para urgência · morph cut para evolução interna do personagem.
A emoção da sequência sobe e desce em curva planejada. Não fica nivelada. Mood arc é o gráfico dessa modulação.
Sequência sem arco vira tédio. Arco emocional simples (calmo → tenso → liberado) já dá leitura.
Mapear emoção por shot · usar luz/paleta como variável de mood · subir antes do clímax.
IA gera matéria-prima. Edição faz o produto. DaVinci Resolve (free) é o padrão profissional; CapCut para rapidez.
Sem edição, você entrega "clipes". Com edição, você entrega "cena".
Color match entre clipes · trimming preciso · áudio em camadas · graphics overlay.
🔧 Pipeline híbrido
IA + foto real, After Effects, lipsync, foley, finalização e entrega.
Foto real do produto/pessoa + cenário gerado por IA, compostos em Photoshop ou Krea. Melhor dos dois mundos: identidade exata + cenário inviável.
Marca, produto e pessoa real raramente saem perfeitos só de IA. Combinar é mais profissional que insistir.
Mask do sujeito real · cenário IA · color match · light match · grain unificador.
Clipe IA importado em AE para rotoscopia (isolar sujeito), tracking (adicionar elementos que seguem movimento) ou title cards.
Clipe IA "puro" tem look de IA. Adicionar overlay, lower-third, grade adicional em AE transforma em produto comercial.
RotoBrush 3 do AE 2026 · Mocha planar tracker · Magic Mask do DaVinci · Lumetri Color Grade.
Gerar voz IA (ElevenLabs), aplicar lipsync na pessoa do clipe IA (HeyGen, Sync.so), ou clonar voz para narração própria.
Em 2026, vídeo sem voz fala parece amadora. Lipsync ruim parece fraudulento. Ferramenta certa resolve.
ElevenLabs v3 (em PT-BR) · HeyGen pro lipsync confiável · ética e consentimento sempre.
Som ambiente (cidade, floresta) + foley (passos, objetos) + música. Sora 2 entrega bom diegético; outras precisam de edição.
90% da percepção de "produção" vem do áudio. Imagem boa + som ruim = parece amador. Imagem fraca + som rico = aceita.
Camadas: ambiente sutil · foley pontual · música baixa · diálogo dominante · ducking automático.
Topaz Video AI para 1080p ou 4K. Color grading final em DaVinci. Adicionar grão unificador. Audio mastering.
Cliente broadcast/agência exige especificações. Sem entender delivery specs, vídeo é rejeitado.
Topaz Proteus model · DaVinci Color Page · LUF -23 para broadcast · LUF -14 para web.
H.264 para web/social, ProRes 422 para edição, DNxHD para broadcast. Rec.709 para web, Rec.2020 para HDR. Naming versionado.
Trabalho de IA é o conteúdo; entrega é o profissionalismo. Cliente lembra do "como" tanto quanto do "que".
Codec por canal · color space por destino · bitrate adequado · naming consistente · multiformat package.
🏋️ Exercícios práticos
6 desafios que reproduzem o dia-a-dia de produção real.
Crie uma marca fictícia (ex: café "Norte 22"). Documente paleta, fonte, mood, 5 imagens de referência, lente padrão, estoque.
Outra pessoa lê e consegue gerar 3 imagens coerentes com a marca sem você ajudar.
Coesão > criatividade · invariantes claros · bloco-prompt reutilizável.
Crie um personagem e gere 10 cenas dele em situações diferentes do dia. Manhã (3), tarde (4), noite (3).
Pessoa desconhecida olha e diz "é o mesmo personagem" em todas as 10.
--cref alto · descrição invariante repetida · vestuário variante coerente · luz como variável.
Conte uma micro-história em 6 stills: estabelecer → introduzir → escalar → clímax → resolver → ecoar.
Espectador entende o arco emocional sem texto explicativo.
1 beat por frame · luz/paleta como modulação emocional · personagem ou objeto-âncora.
Crie 2 clipes de 3s onde o último frame de A tem composição/forma idêntica ao primeiro de B. Ex: xícara de café → poça refletindo.
Quando você corta entre eles, a costura é elegante, não confusa.
Planejar forma compartilhada · último frame de A pensado como primeiro de B · circulares e radiais funcionam bem.
Pegue uma foto real sua (ou de produto). Gere um cenário fantástico em IA. Componha em Photoshop com matching de luz/cor.
Cabe na thumbnail do Instagram sem alguém perceber a composição.
Recortar com IA (Photoshop Generative Fill) · color match · sombra própria · grão unificador.
Gere um clipe IA de uma pessoa falando 1 frase. Gere áudio em ElevenLabs em PT-BR. Aplique lipsync.
Lipsync convincente em 100% da frase. Som natural, sem robótico.
Voz com nuance · texto curto inicialmente · HeyGen ou Sync.so · ambient room tone por baixo.
🗺️ Passo-a-passo: 3 cenas coerentes
Mini-curta de 30s. Personagem único, locação única, 3 horas do dia. Aplica tudo da T3.
Briefing: "Um dia na vida de uma ceramista paulistana, 30s, 3 momentos do mesmo ateliê." Bíblia visual: ela + ateliê + paleta terra + Cinestill 800T + Wong Kar-wai mood.
Tudo começa documentado. Quem não escreve a bíblia, vai gerar 30 versões diferentes do mesmo ateliê.
Cena 1 (manhã): master shot + close das mãos no torno. Cena 2 (tarde): wide do ateliê + medium dela pintando. Cena 3 (noite): close da peça pronta + ela admirando.
Storyboard valida o arco antes de animar. Iterar nele é 10x mais barato.
Gerar a ceramista em 4 ângulos como casting card. Usar como --cref em todos os shots. Adicionar bloco invariante de descrição em cada prompt.
É o passo que separa "série coerente" de "primas parecidas".
Runway Gen-4 com still como first frame + character ref + movimento sutil descritivo. Cada clipe 5s = 30s totais.
É o "ato de filmar" do projeto. Aqui o storyboard ganha vida.
DaVinci Resolve. Cuts motivados por luz (sol entrando → sombra crescendo → lâmpada acesa). Color match unificado. Música ElevenLabs Music ambient.
É onde 6 clipes viram 1 filme.
Master 16:9 → reframe pra 9:16 (Reels) → reframe pra 1:1 (feed). Topaz upscale 1080p. Naming versionado. Package pra cliente.
É o que diferencia "entreguei o vídeo" de "entreguei a campanha".