GAN (Rede Adversarial Generativa)

Voltar para Glossário de IA

Última atualização: 10 de Junho de 2025

GAN, ou Rede Adversarial Generativa (do inglês, Generative Adversarial Network), é uma classe de algoritmos de Machine Learning, introduzida por Ian Goodfellow e seus colegas em 2014, que se destaca pela capacidade de gerar novos dados sintéticos que se assemelham a um conjunto de dados de treinamento real. As GANs são um exemplo poderoso de IA Generativa.

A arquitetura de uma GAN consiste em duas redes neurais que "competem" entre si em um jogo de soma zero (um processo adversarial):

Componentes de uma GAN:

  • Gerador (Generator): Esta rede tenta criar amostras de dados falsas (sintéticas) que pareçam autênticas. Ela começa com um ruído aleatório como entrada e aprende a transformar esse ruído em dados que se assemelham aos dados reais de treinamento (por exemplo, imagens de rostos, manuscritos, etc.).
  • Discriminador (Discriminator): Esta rede atua como um "crítico" ou "detetive". Ela é treinada para distinguir entre amostras de dados reais (do conjunto de treinamento) e amostras de dados falsas (criadas pelo gerador). O discriminador produz uma probabilidade de a amostra de entrada ser real.

Processo de Treinamento Adversarial:

O treinamento de uma GAN ocorre de forma iterativa:

  1. O Gerador cria um lote de amostras falsas.
  2. O Discriminador recebe um lote misto de amostras reais e falsas e tenta classificá-las corretamente.
  3. O erro do Discriminador é usado para atualizar seus pesos, tornando-o melhor em distinguir o real do falso.
  4. O erro do Gerador (baseado em quão bem ele conseguiu "enganar" o Discriminador) é usado para atualizar seus pesos, tornando-o melhor em criar amostras mais realistas.

Esse processo continua, com o Gerador e o Discriminador melhorando suas capacidades em um ciclo de feedback. Idealmente, o Gerador se torna tão bom em criar dados sintéticos que o Discriminador não consegue mais distinguir de forma confiável entre o real e o falso (atingindo uma probabilidade de 50% para ambos).

Aplicações das GANs:

  • Geração de Imagens: Criar imagens fotorrealistas de rostos, objetos, paisagens que não existem.
  • Tradução de Imagem para Imagem (Image-to-Image Translation): Transformar imagens de um estilo para outro (ex: transformar um esboço em uma foto colorida, mudar a estação do ano em uma paisagem).
  • Aumento de Dados (Data Augmentation): Gerar mais dados de treinamento sintéticos para melhorar o desempenho de outros modelos de IA.
  • Geração de Texto para Imagem: Criar imagens a partir de descrições textuais.
  • Super-Resolução: Aumentar a resolução de imagens de baixa qualidade.
  • Geração de Música e Vídeo: Embora mais desafiador, GANs também são exploradas nessas áreas.

As GANs foram um avanço significativo na IA generativa, abrindo novas possibilidades para a criação de conteúdo sintético e a manipulação de dados. No entanto, elas também levantam preocupações éticas, especialmente em relação à criação de deepfakes e à disseminação de desinformação.