GAN (Rede Adversarial Generativa)
Última atualização: 10 de Junho de 2025
A arquitetura de uma GAN consiste em duas redes neurais que "competem" entre si em um jogo de soma zero (um processo adversarial):
Componentes de uma GAN:
- Gerador (Generator): Esta rede tenta criar amostras de dados falsas (sintéticas) que pareçam autênticas. Ela começa com um ruído aleatório como entrada e aprende a transformar esse ruído em dados que se assemelham aos dados reais de treinamento (por exemplo, imagens de rostos, manuscritos, etc.).
- Discriminador (Discriminator): Esta rede atua como um "crítico" ou "detetive". Ela é treinada para distinguir entre amostras de dados reais (do conjunto de treinamento) e amostras de dados falsas (criadas pelo gerador). O discriminador produz uma probabilidade de a amostra de entrada ser real.
Processo de Treinamento Adversarial:
O treinamento de uma GAN ocorre de forma iterativa:
- O Gerador cria um lote de amostras falsas.
- O Discriminador recebe um lote misto de amostras reais e falsas e tenta classificá-las corretamente.
- O erro do Discriminador é usado para atualizar seus pesos, tornando-o melhor em distinguir o real do falso.
- O erro do Gerador (baseado em quão bem ele conseguiu "enganar" o Discriminador) é usado para atualizar seus pesos, tornando-o melhor em criar amostras mais realistas.
Esse processo continua, com o Gerador e o Discriminador melhorando suas capacidades em um ciclo de feedback. Idealmente, o Gerador se torna tão bom em criar dados sintéticos que o Discriminador não consegue mais distinguir de forma confiável entre o real e o falso (atingindo uma probabilidade de 50% para ambos).
Aplicações das GANs:
- Geração de Imagens: Criar imagens fotorrealistas de rostos, objetos, paisagens que não existem.
- Tradução de Imagem para Imagem (Image-to-Image Translation): Transformar imagens de um estilo para outro (ex: transformar um esboço em uma foto colorida, mudar a estação do ano em uma paisagem).
- Aumento de Dados (Data Augmentation): Gerar mais dados de treinamento sintéticos para melhorar o desempenho de outros modelos de IA.
- Geração de Texto para Imagem: Criar imagens a partir de descrições textuais.
- Super-Resolução: Aumentar a resolução de imagens de baixa qualidade.
- Geração de Música e Vídeo: Embora mais desafiador, GANs também são exploradas nessas áreas.
As GANs foram um avanço significativo na IA generativa, abrindo novas possibilidades para a criação de conteúdo sintético e a manipulação de dados. No entanto, elas também levantam preocupações éticas, especialmente em relação à criação de deepfakes e à disseminação de desinformação.