Carrossel de imagens para marketplace com IA: o guia completo (2026)
Guia definitivo do carrossel de 5 imagens para Shopee, Mercado Livre, Magalu e TikTok Shop. Regras visuais por marketplace, IA vs estúdio e como gerar tudo em 2 minutos.
Quem vende em marketplace brasileiro em 2026 já entendeu uma coisa que demorou para virar consenso: o carrossel de imagens é o ativo de conversão mais importante da listing, mais até do que o título. Esta é a referência completa de como montar — e gerar com IA — um carrossel de cinco imagens que respeita a regra de cada marketplace (Shopee, Mercado Livre, Magalu, TikTok Shop) e que efetivamente vende.
Por que o carrossel pesa mais que a foto única no algoritmo e na conversão
O comportamento padrão do comprador no Shopee, no Mercado Livre e no Magalu é o mesmo: ele bate o olho na foto de capa, decide se aquilo merece um clique e, dentro da página de produto, ele desliza o carrossel antes de ler qualquer linha de texto. A primeira imagem ganha o clique; as quatro seguintes ganham o pedido. Listings com carrossel completo e padronizado têm taxa de clique (CTR) significativamente mais alta na busca interna e taxa de conversão consistentemente acima da média da categoria — esse efeito é observado em todos os marketplaces brasileiros e está documentado nos relatórios de boas práticas que os próprios marketplaces publicam para seus sellers.
Tem outro detalhe que pouca gente conecta: o algoritmo de ranking de cada marketplace prioriza listings com múltiplas imagens de qualidade. No Mercado Livre, por exemplo, completar o conjunto de imagens é um dos sinais que entra no cálculo de qualidade do anúncio. No Shopee, a presença de carrossel completo afeta a pontuação que define se o produto entra ou não nos blocos de destaque. Ou seja, a foto única não é só pior na conversão — ela é pior na descoberta também.
A conta fica clara: trocar uma foto única por um carrossel padronizado de cinco imagens pode dobrar a taxa de clique e somar entre 30% e 60% na conversão dentro da página. Esses números não são promessa, são consequência direta de quanto contexto adicional o comprador recebe antes de tomar a decisão.
A anatomia do carrossel que converte: os cinco slots fundamentais
Depois de analisar milhares de listings de top sellers brasileiros, um padrão se consolidou. Os cinco slots ideais não são uma escolha estética — eles respondem a perguntas específicas que o comprador faz mentalmente antes de comprar. Cada slot existe para eliminar uma objeção.
Slot 1 — Fundo branco puro (a foto de capa)
É a imagem que aparece no resultado de busca, então ela tem uma única responsabilidade: ganhar o clique. Regras que funcionam: fundo branco puro (#FFFFFF, sem cinza, sem gradiente), produto ocupando entre 75% e 85% do frame, ângulo de três quartos (nem perfil puro nem frontal chapado), sombra de contato suave embaixo do produto e foco rígido. Nada de texto, nada de selo, nada de moldura. Essa imagem é a vitrine, e ela precisa parecer uma vitrine real.
Erro mais comum: gente que coloca o logo da marca ou um selo de promoção no slot 1. O Shopee penaliza isso, porque interpreta como poluição visual; o Mercado Livre exige fundo branco puro e pode reprovar a imagem; o Magalu simplesmente não destaca o produto. A foto de capa é a única imagem que segue regra de marketplace ao pé da letra — as demais permitem mais liberdade criativa.
Slot 2 — Infográfico de diferenciais
Aqui entra a primeira camada de venda: três a cinco bullets visuais que respondem por que esse produto e não outro. O padrão que funciona no Brasil é fundo escuro (preto, grafite ou azul-marinho), produto destacado em primeiro plano, ícones coloridos ao lado de cada benefício e texto em português claro, sem floreio. Bullets bons têm verbo no início ("dura 3x mais", "cabe em qualquer porta-copo", "não esquenta no microondas"). Bullets ruins são genéricos ("qualidade premium", "melhor custo-benefício").
Slot 3 — Especificações visuais
Aqui o comprador resolve a dúvida prática: cabe no espaço dele? É do tamanho que ele precisa? Para esse slot funcionam dois formatos: cotas dimensionais com setas e medidas em centímetros sobre fundo branco, ou comparação de tamanho com objeto referência (mão, mesa, carro). Para produtos com variação, este é o slot onde as variações aparecem lado a lado com a respectiva legenda.
Slot 4 — Lifestyle com público real
O slot mais difícil de acertar — e o que mais separa listing amador de listing profissional. Aqui aparece uma pessoa do público-alvo usando o produto em contexto de uso real. Não é foto genérica de banco de imagem; é uma cena que faz o comprador pensar "essa pessoa sou eu". Se o produto é para dona de casa de 35 a 50 anos, a modelo precisa ter essa cara, esse contexto, essa cozinha. Se o produto é para tech entusiasta de 25 a 35 anos, muda tudo: outra pessoa, outro ambiente, outra luz.
Slot 5 — Lifestyle emocional aspiracional
O fechamento. Aqui o produto vira detalhe dentro de uma cena que vende sensação, não função. Luz dourada de fim de tarde, profundidade de campo curta com bokeh, composição limpa, foco em uma textura ou em um detalhe de qualidade. Esse slot não convence racionalmente — ele empurra o comprador que já estava 80% decidido a apertar o botão de comprar. Pense em capa de revista, não em fotografia de e-commerce.
Regras visuais por marketplace: tabela definitiva
Cada marketplace brasileiro tem regras técnicas próprias, e ignorar isso significa ter imagem reprovada, listing despriorizada ou pior — produto invisível na busca. A tabela abaixo consolida as regras vigentes em 2026 para os quatro marketplaces que importam no Brasil.
| Marketplace | Dimensão mínima | Proporção | Fundo da capa | Texto na imagem | Quantidade ideal |
|---|---|---|---|---|---|
| Shopee | 1080×1080 px | 1:1 quadrada | Branco puro #FFFFFF na capa | Permitido nos slots 2–5, proibido no slot 1 | 5 a 9 imagens |
| Mercado Livre | 1200×1200 px | 1:1 quadrada | Branco puro em todas as imagens da listing clássica | Desencorajado — afeta pontuação de qualidade | 6 a 10 imagens |
| Magazine Luiza | 1500×1500 px | 1:1 quadrada | Branco na capa, livre nos demais slots | Permitido, inclusive cotas dimensionais | 5 a 8 imagens |
| TikTok Shop | 1080×1920 (vertical) + 1080×1080 | 9:16 principal + 1:1 secundária | Livre — estética "social" permitida | Permitido e até recomendado | 4 a 6 imagens |
Regra Shopee de fundo branco puro:a foto de capa da Shopee precisa estar em fundo #FFFFFF absoluto. Qualquer cinza claro, gradiente, textura ou sombra de fundo derruba a imagem nos blocos de destaque da home e na seção "Mais vendidos". O algoritmo da Shopee detecta o fundo automaticamente; se ele não estiver 100% branco, sua listing perde elegibilidade para os filtros visuais e pra exibição em alguns blocos premium. Essa é a única regra técnica que vale a pena obsessão.
IA generativa versus estúdio físico: o tradeoff real em 2026
Antes de 2024, montar um carrossel profissional significava uma ida ao estúdio: produto enviado, set montado, modelo contratado, fotógrafo, pós-produção. Custo médio por SKU no Brasil entre R$ 400 e R$ 1.200, com prazo de 7 a 15 dias. Para quem vende 50 SKUs, isso é entre R$ 20 mil e R$ 60 mil, e dois meses de produção. Inviável para quem está começando, e doloroso até para quem já fatura.
A IA generativa de imagem mudou essa equação radicalmente. Hoje, modelos como GPT Image 2 e Nano Banana Pro geram imagens de qualidade comparável a estúdio em segundos, custando centavos por imagem. Isso muda a matemática de quem vende em marketplace de uma forma que ainda está sendo absorvida pelo mercado.
O tradeoff honesto: estúdio físico ainda ganha em duas situações específicas. Produtos muito caros (acima de R$ 500) onde a margem suporta o custo de produção e onde a perfeição absoluta da foto justifica o investimento; e produtos onde a textura precisa ser reproduzida com fidelidade total (tecido fino, jóia, comida fresca). Em tudo o que está abaixo disso — que é a esmagadora maioria do que se vende em marketplace brasileiro — a IA ganha por tempo, custo e escala. Você produz um carrossel completo em menos de dois minutos, paga menos do que um almoço, e pode iterar até acertar.
Por que IA genérica (ChatGPT, Photoroom) não é suficiente
Quem testou pedir "gera uma foto de produto pro meu anúncio do Shopee" no ChatGPT já viu o problema. O modelo genérico não conhece a regra do marketplace: ele gera uma imagem bonita, mas com fundo cinza claro em vez de branco puro, com texto em inglês quando deveria estar em português, com proporção 16:9 quando o Shopee exige 1:1, com sombra dramática quando o slot 1 pede sombra de contato suave.
Photoroom, Pebblely e ferramentas similares resolvem parte do problema (remoção de fundo, gerar cenários lifestyle), mas tratam o produto como peça isolada — não como parte de um carrossel coeso de cinco imagens com regras visuais coordenadas. Você acaba gerando cinco imagens que tecnicamente funcionam, mas que parecem ter saído de fontes diferentes: estilo de iluminação inconsistente, paleta de cor desconectada, sem unidade visual. O comprador percebe isso, mesmo que ele não saiba dizer o que está errado.
O que falta nessas ferramentas é o que a literatura de e-commerce chama de "regra de marketplace específica": o conhecimento embutido de que a Shopee aceita texto no slot 2 mas pune texto no slot 1, de que o Mercado Livre prefere fundo branco em todos os slots da listing clássica, de que o Magalu permite cotas dimensionais e o TikTok Shop favorece formato vertical. Esse conhecimento precisa estar codificado no prompt, slot por slot, marketplace por marketplace.
Como fazer briefing para a IA gerar imagem que vende
Existe uma diferença grande entre "pedir uma foto de produto pra IA" e "fazer briefing pra IA gerar uma imagem que converte". A diferença mora em três informações que precisam estar explícitas: para que serve o produto, quem compra esse produto, e qual o maior diferencial dele.
Uso: o que esse produto resolve no dia a dia
Não é a categoria ("copo térmico"), é o uso real ("mantém café quente da manhã até a hora do almoço para quem trabalha em obra"). Esse nível de detalhe muda a cena que a IA gera. Sem isso, ela cai no genérico — copo sobre mesa de madeira clara, bokeh atrás, luz suave. Com isso, ela coloca o copo na cena certa: canteiro de obra ou escritório agitado ou cozinha de casa.
Público: quem é a pessoa que compra
Faixa etária, profissão presumida, contexto socioeconômico, lugar onde mora. "Mulher de 30 a 45 anos, mãe de criança pequena, classe média, mora em apartamento de cidade grande" é briefing útil. "Pessoa que gosta de coisa boa" não é briefing — é poesia. A IA precisa do briefing pra escolher o rosto, a roupa, o ambiente, a luz do slot lifestyle.
Diferencial: o que esse produto tem que os outros não têm
Essa informação vira o infográfico (slot 2) e a chamada do slot 5. Se o diferencial é durabilidade, o infográfico mostra resistência; se é praticidade, mostra montagem rápida; se é estética, o slot 5 vira capa de revista. Sem essa informação, a IA escolhe um diferencial genérico que pode não ser o seu.
Os erros que matam a conversão do carrossel
Auditando listings que não convertem, alguns erros aparecem com frequência teimosa. Vale listar pra você não cair em nenhum deles.
Texto em excesso na imagem
Slot 2 e 3 aceitam texto, mas em doses pequenas. Bullet de no máximo cinco palavras, três bullets no total, fonte legível em telefone celular. Quando a imagem vira parede de texto, o comprador ignora — ele veio comprar, não ler. O Mercado Livre é especialmente agressivo aqui: imagens com mais de 20% de área coberta por texto perdem pontuação de qualidade.
Sombra errada no slot de fundo branco
Sombra dramática (longa, dura, projetada) no slot 1 derruba a percepção de qualidade. O que funciona é sombra de contato — aquela mancha suave logo embaixo do produto, como se ele estivesse pousado em uma superfície branca infinita. Sombra dura faz a imagem parecer recortada artificialmente, e o comprador desconfia.
Inconsistência entre os cinco slots
Cinco imagens geradas em momentos diferentes, com IAs diferentes ou com referências diferentes, criam um carrossel que parece costurado. Iluminação muda de slot pra slot, paleta dança, ângulo do produto não bate. Resolve isso gerando todas as cinco no mesmo ciclo, com a mesma imagem de referência, no mesmo modelo, com o mesmo guidance de estilo.
Modelo errado no slot lifestyle
Produto popular de classe C com modelo loira de olhos azuis em ambiente caribenho não converte no Brasil. Esse é o erro mais comum em IA genérica — ela tende a um padrão estético internacional que não bate com o público- alvo da maioria dos sellers brasileiros. Briefing específico de público corrige isso, mas precisa estar explícito.
Variação que não aparece
Produto com cinco cores e um único slot mostrando uma única cor — comprador fecha a página. Quando há variação, ela precisa aparecer no slot 3 (preferencialmente lado a lado) ou em um slot dedicado. Esquecer disso é abandonar quem está exatamente interessado em saber qual cor escolher.
Resolução baixa demais
Imagem de 800×800 px num marketplace que pede mínimo de 1080 ou 1200 — o algoritmo penaliza, o comprador percebe pixelização no zoom, e a listing perde força. IA generativa moderna entrega 1024 ou 2048 px sem problema; não tem desculpa pra subir imagem em baixa resolução em 2026.
Como o ZARK aplica esses padrões automaticamente
Tudo o que está descrito até aqui — os cinco slots, as regras por marketplace, o briefing estruturado, o controle de iluminação consistente — está codificado no pipeline de geração do ZARK. O fluxo é direto: o seller sobe uma foto do produto, escolhe o marketplace, responde cinco perguntas curtas sobre o produto (uso, público, diferencial, dimensões, variação), e o sistema entrega o carrossel completo em menos de dois minutos.
Por dentro, o ZARK aplica prompts dedicados slot a slot, marketplace a marketplace. O slot 1 da Shopee usa prompt diferente do slot 1 do Mercado Livre, porque as regras são diferentes. O slot 4 considera o público respondido no briefing pra escolher o tipo de modelo, o ambiente e a luz. O slot 5 traz a estética aspiracional em cima do mesmo produto. As cinco imagens saem coesas porque são geradas no mesmo ciclo, com a mesma referência, no mesmo modelo de IA (GPT Image 2 ou Nano Banana Pro, conforme o plano).
Além das imagens, o sistema entrega título otimizado para SEO da Shopee e descrição com as cinco seções obrigatórias (headline, por que escolher, especificações, compra segura, itens inclusos). Ou seja, o pacote completo da listing — não só a parte visual.
Checklist final antes de publicar a listing
Antes de apertar o botão de publicar, vale rodar esse checklist mental. Ele economiza dor de cabeça e listing reprovada.
Capa: fundo branco puro confirmado, sem texto, produto ocupando entre 75% e 85% do frame, ângulo de três quartos, sombra de contato suave. Slot 2: três a cinco bullets em português, fonte legível em celular, ícones consistentes entre si, fundo escuro mas não preto absoluto se o produto for de cor escura. Slot 3: especificação visual clara, cotas em centímetros se aplicável, variações lado a lado se houver. Slot 4: modelo compatível com o público-alvo real, ambiente brasileiro, luz natural. Slot 5: estética aspiracional, foco em textura ou detalhe, sem texto, sem distração.
Padronização: as cinco imagens parecem ter saído do mesmo carrossel quando vistas em sequência. Resolução: pelo menos 1080×1080 px na Shopee, 1200×1200 no Mercado Livre, 1500×1500 no Magalu. Formato: JPG ou PNG, abaixo de 5 MB cada. Idioma: tudo o que tem texto está em português brasileiro, sem erro de acentuação ou de concordância.
Se tudo isso bate, a listing está pronta. Não precisa de revisão de fotógrafo, não precisa de aprovação de designer — precisa só ir pro ar e começar a coletar dado real de conversão.
O que muda nos próximos doze meses
Algumas tendências já estão se desenhando pra 2026 e merecem atenção. A primeira é a entrada do vídeo curto como peça obrigatória da listing — Shopee Video e TikTok Shop já estão empurrando vídeo como diferencial de rankeamento, e a expectativa é que isso vire requisito mínimo até o fim do ano. A segunda é a personalização dinâmica da capa por segmento de comprador (a Shopee já testa isso em laboratório). A terceira é a integração de imagem 3D e visualização AR pra categorias específicas como móvel, decoração e moda.
Para o seller que está começando agora, a mensagem é simples: domine o básico do carrossel de cinco imagens primeiro, com regras de marketplace respeitadas, com qualidade de estúdio entregue por IA, e só depois invista em vídeo e em formatos avançados. O carrossel é o piso da operação; tudo o que vem depois é teto.
Carrossel pronto em 2 minutos, sem estúdio
O ZARK gera as 5 imagens seguindo a regra de cada marketplace + título SEO + descrição. Plano grátis com 150 créditos.
Criar primeiro carrossel grátis →Crie seu primeiro listing com IA em 2 minutos.
150 créditos grátis no signup — sem cartão de crédito.
Começar grátis
