A Nova Internet Neural está chegando

E parece muito assustador a partir daqui

Como tudo começou / A paisagem

Progresso Generativo Adversarial Networks

Pense nas redes neurais típicas e bem estudadas (como o classificador de imagens) como um hemisfério esquerdo da tecnologia da rede neural. Com isso em mente, é fácil entender o que é Generative Adversarial Network. É um tipo de hemisfério direito – aquele que é reivindicado como responsável pela criatividade.

As Redes Adversárias Generativas (GANs) são o primeiro passo da tecnologia de redes neurais criando criatividade. GAN típico é uma rede neural treinada para gerar imagens no determinado tópico usando um conjunto de dados de imagem e algum ruído aleatório como semente. Até agora, as imagens criadas pelos GAN eram de baixa qualidade e de resolução limitada. Os avanços recentes da NVIDIA mostraram que ele está ao alcance de gerar imagens fotorrealistas em alta resolução e eles publicaram a própria tecnologia em acesso aberto.

Exemplos de imagens GAN. Alguns são bons, alguns são ruins.

GANs condicionais e codificadores automáticos variacionais

Há uma infinidade de tipos GAN de várias complexidades, arquiteturas e siglas estranhas. Estamos principalmente interessados ??aqui em GANs condicionais e autoencoders variacionais. GANs condicionais são capazes de não apenas imitar o amplo tipo de imagens como "quarto", "rosto", "cachorro", mas também mergulhar em categorias mais específicas. Por exemplo, a rede Text2Image é capaz de traduzir a imagem textual da imagem na própria imagem.

Ao variar a semente aleatória que está concatenada com o vetor "significados", podemos produzir uma imagem infinita de pássaros, a descrição correspondente.

A oportunidade

Vamos fechar os olhos e ver o mundo em 2 anos. Empresas como a NVIDIA empurrarão a tecnologia GAN para o nível da indústria, do mesmo modo que fizeram com as celebridades que enfrentam a geração. Isto significa que um GAN poderá gerar qualquer imagem, on-demand, on-the-fly com base na descrição textual (por exemplo). Isso tornará obsoleta uma série de indústrias relacionadas à fotografia e design. Veja como isso vai funcionar.

Novamente, a rede é capaz de gerar um número infinito de imagens, variando semente aleatória.

Personalização

E aqui está a parte assustadora. Essa rede pode receber não apenas a descrição do objeto alvo que ele precisa gerar, mas também um vetor descrevendo você – o consumidor do anúncio. Este anúncio pode ter uma descrição muito profunda de sua personalidade, histórico de navegação na web, transações recentes e geolocalização, de modo que o GAN irá gerar uma única vez, único e, que se encaixa perfeitamente. A CTR está indo no alto do céu.

Ao medir suas reações, a rede se adaptará e tornará anúncios segmentados cada vez mais precisamente, atingindo seus pontos suaves.

A tendência da Bolha

Então, no final do dia, vamos ver um conteúdo totalmente personalizado em todos os lugares da Internet.

Todo mundo verá versões totalmente personalizadas de todo o conteúdo, adaptado ao consumidor com base em seu estilo de vida, opiniões e histórico. Todos testemunhamos a excitação deste padrão Bubble após as últimas eleições dos EUA e isso vai piorar. Os GANs poderão segmentar o conteúdo com precisão para você sem limitações do meio – a partir de anúncios gráficos e até pareceres complexos, rotas e publicações geradas por máquinas. Isso criará um loop de feedback constante, melhorando com base em suas interações. E haverá uma competição de diferentes GANs entre si. Tipo de guerra totalmente automatizada de manipulações psicológicas, tendo a humanidade como campo de batalha. A força motriz por trás dessa tendência é extremamente simples – lucros.

E este não é um cenário assustador do dia do juízo final, isso realmente está acontecendo hoje.

Isso é bom ou ruim ?

Eu não faço ideia. Mas certamente precisamos de algumas coisas: discussões públicas amplas sobre essa chegada inevitável de tecnologia e um plano de backup para detê-la. Então, é melhor começar a pensar agora – como podemos lutar contra esse processo e beneficiá-lo ao mesmo tempo.

Lado técnico das coisas

Ainda não há devido a alguma limitação técnica. Até as imagens recentes geradas pelos GAN eram apenas de má qualidade e facilmente detectadas como falsas. A NVIDIA mostrou que é realmente possível gerar 1024×1024 rostos extremamente reais. Para avançar, precisamos de GPUs mais rápidas e maiores, mais estudos teóricos sobre o GAN, hacks mais inteligentes em torno do treinamento GAN, conjuntos de dados mais rotulados, etc.

Por favor, observe – não precisamos de novas fontes de energia, processadores quânticos (mas eles podem ajudar), AI geral para alcançar esse ponto ou algumas outras novas coisas puramente teóricas novas. Tudo o que precisamos está dentro de um alcance de poucos anos e provavelmente grande corp já tem esse tipo de recursos disponíveis.

Além disso, precisaremos de redes neuronais mais inteligentes. Definitivamente estou buscando o progresso na abordagem de cápsulas por Hinton et al. E, claro, seremos os primeiros a implementar isso em tecnologia de super-resolução , que deve se beneficiar muito do progresso do GAN.

Diz-me o que pensas.