Através do Espelho: Uma Visão Geral do Reconhecimento Visual

Niño Ross Rodriguez Blocked Desbloquear Seguir Seguindo 15 de março de 2018

[originalmente publicado em imaginações infinitas ]

"Face Finding" de Missão: Impossível – Protocolo Fantasma

É como algo saído de um filme de ficção científica – máquinas, robôs e androides sendo capazes de identificar objetos e rostos com facilidade. Mas hoje em dia, adaptações precoces de reconhecimento visual ou tecnologia de reconhecimento de imagem foram disponibilizadas hoje por meio de serviços fornecidos por empresas como Google e IBM.

Vamos fazer uma jornada de como os computadores e dispositivos deram os primeiros passos olhando para o nosso mundo.

Imagens do google

Pesquisando usando imagens

Você se lembra dos dias em que o Google era apenas um mecanismo de busca e tudo que você poderia pesquisar era um texto simples? Os desenvolvedores do Google expandiram o produto de pesquisa e forneceram resultados aos usuários com imagens. O mecanismo de pesquisa indexou milhões de imagens e a pesquisa de imagens nasceu.

Alguns anos depois, o Google introduziu o recurso de pesquisa por imagem, que permitia aos usuários reverter a pesquisa de imagens diretamente na Pesquisa do Google sem complementos de terceiros.

Trending AI Articles:

1. Aprendendo com os erros com o Hindsight Experience Replay

2. Prevendo o comportamento de compra usando o Machine Learning

3. Como evitar o viés na aprendizagem de máquina

4. Flubber é sensitivo?

"Há um aplicativo para isso"

As tecnologias ainda eram jovens e limitadas naquela época. O IBM Watson ainda estava no Deep Blue jogando xadrez. A nuvem ainda era um lugar desonesto para guardar seus arquivos. Você praticamente confiava no Google para pesquisar qualquer coisa. Os aplicativos ou programas de reconhecimento de imagem eram escritos por empresas com seu próprio algoritmo, mas eram muito caros para serem produzidos ou colocados em uma pesquisa de imagens do Google, que era a solução mais fácil e barata.

Provavelmente desenvolvido ao mesmo tempo que o Google Images, o Google lançou uma versão de seu aplicativo de busca de imagens. Chamava-se Google Goggles e permitia que os usuários pesquisassem tirando uma foto. O aplicativo também apresentava a capacidade de reconhecer rótulos ou pontos de referência sem usar uma pesquisa baseada em texto.

Isso significa que as pessoas podem procurar virtualmente qualquer coisa, imediatamente, usando seus smartphones e não têm a chance de voltar a um desktop.

Google Goggles – Ajudando você a saber o que você está procurando

Reconhecimento visual e aplicativos da Web

Vamos acelerar a data de hoje, onde a tecnologia teve um surto repentino de crescimento e nos deu, usuários e desenvolvedores, infinitas possibilidades para brincar.

Agora temos a capacidade de mexer com inteligência artificial, aprendizado de máquina, aprendizado profundo, processamento de linguagem natural e reconhecimento visual, para citar apenas alguns. É claro que sempre podemos contratar desenvolvedores com especialidades em inteligência artificial e aprendizado de máquina, mas isso nos custaria um braço e uma perna. Existem serviços do IBM Watson e do Google Cloud Platform que fornecem aos desenvolvedores facilidade de uso, todos com um preço acessível.

Mais do que se vê

Com as possibilidades sendo infinitas, aqui estão alguns exemplos de como podemos usar essas tecnologias à nossa disposição:

Aplicativo "Eye See It"

Pode haver um tempo em que nossos amigos com deficiência visual possam precisar de ajuda para identificar um objeto ou ler um texto pequeno. Com um aplicativo instalado em seus smartphones, seria tão fácil quanto tirar uma foto e o aplicativo, respondendo ao usuário com voz, dizendo aos usuários o que ele viu. Um usuário poderia tirar uma foto de um objeto desconhecido e responder: “Estou definitivamente olhando para um carro esportivo”.

Amostra de imagem do Lamborghini Centenario para o aplicativo “Eye See It”

Aplicativo "Plant-Eye-ção"

Uma idéia possível para os amantes de plantas por aí que podem não ser tão versados como nossos amigos jardineiros. Os jardineiros seriam uma enciclopédia ambulante de conhecimento de plantas, carregando informações sobre as plantas que eles cuidam. E se tivéssemos um aplicativo que, tirando uma foto da flor ou planta, lhe daria o nome da foto tirada? Não só isso, ele lhe daria todos os detalhes da flor / planta, poderia ajudá-lo a manter a coisa viva compartilhando quantas vezes por dia ele precisa ser águas e clima que prefere sol ou sombra … pode transformar o amador em um especialista compartilhando as informações relevantes para o seu entorno.

“Guardião dos olhos”

Outra possibilidade é curar conteúdo relevante e seguro para sua parede de mídia social em tempo real. Pense nisso, você está em um evento e há uma grande parede digital que agrega as fotos tiradas pelas pessoas e suas carregadas nas mídias sociais ou nos servidores. Atualmente, você tem duas opções, você tem membros dedicados da equipe monitorando e organizando o conteúdo ou você desiste do controle total e permite que cada postagem com a marcação relevante seja postada na parede. Custa muito tempo e dinheiro, o outro é um risco enorme.

O serviço de reconhecimento visual pode atuar como um gatekeeper, analisando as imagens antes que elas realmente atinjam a tela ao vivo, evitando automaticamente que imagens inapropriadas sejam exibidas na tela grande.

Eu posso lhe mostrar o mundo…

A inteligência artificial deu os primeiros passos para ver mais em nosso mundo. Em um futuro próximo, talvez não precisemos mais de aprendizado de máquina e aprendizado profundo para “ver” e “aprender”. O Google Lens já deu o primeiro passo para maximizar o potencial da combinação de reconhecimento visual, aprendizado profundo e realidade aumentada.

Eu também dei um passo na tentativa de ver o que esta tecnologia pode fazer. Divirta-se em nossa pequena demonstração abaixo. Eu sugiro que você use seu celular para digitalizar imagens. Tenha em mente, porém, que isso é apenas uma prova de conceito. Você ainda pode receber respostas estranhas do aplicativo da web. Clique feliz!

https://goo.gl/oaVLDu

Não se esqueça de nos dar o seu ?!