VisualData – Um mecanismo de pesquisa para conjuntos de dados de visão de computador

Jie Feng Blocked Unblock Seguir Seguindo 04 de setembro de 2017

Visite o site

A visão computacional, sem dúvida, vai mudar quase todos os aspectos de como uma máquina interage com o nosso ambiente e conosco no futuro próximo. Ainda é um campo jovem (originado da década de 1960), mas a tecnologia começa a funcionar na primeira vez na história com os recentes avanços no aprendizado de máquina. Aplicações como carros autônomos, robótica, VR / AR motivaram as pessoas a entrar em campo e aplicar a tecnologia em áreas muito mais amplas. Tornou-se um dos subcampos mais ativos da Inteligência Artificial.

Idéias malucas em torno da visão computacional acontecem todos os dias para novas pesquisas, projetos paralelos ou casos de uso de negócios. Para trabalhar com visão computacional, você precisa de três coisas: dados, algoritmo e computação. Empresas de tecnologia gigantes como o Google e a Amazon tornaram possível a computação pesada para todos com suas ofertas de plataforma em nuvem. A comunidade de pesquisa (por exemplo, arXiv) e a comunidade de código aberto (por exemplo, Github) nos trazem melhores algoritmos no papel e códigos fáceis de usar na prática. Nunca foi uma época melhor para estudar esse assunto complexo que costumava exigir experiência em nível de Ph.D. Mas ainda resta um problema – dados. Mais especificamente, dados visuais que vêm com anotações de alta qualidade. Construir um bom conjunto de dados requer muito raciocínio em termos de tamanho, equilíbrio de conteúdo, variações visuais para ajudar o modelo treinado a ser bem generalizado para casos não vistos. Rotular um conjunto de dados em larga escala pode ser muito caro e lento, tornando-se ainda uma barreira para indivíduos ou pequenas empresas com orçamento limitado para experimentar novas idéias.

A resposta para o problema são conjuntos de dados públicos. Em vez de criar seu próprio conjunto de dados, já existe uma rica coleção de conjuntos de dados de visão computacional, contribuídos por pesquisadores acadêmicos, amadores e empresas. Esses conjuntos de dados incluem diversos tópicos, desde reconhecer objetos até a reconstrução de uma sala 3D, desde encontrar uma pessoa em um vídeo até identificar uma camiseta em uma foto. Eles geralmente vêm com etiquetas de boa qualidade anotadas manualmente. Nos últimos anos, novos conjuntos de dados incluem até mesmo modelos de aprendizagem profunda pré-treinados que você pode testar diretamente sem treinar um por conta própria. No entanto, descobrir esses conjuntos de dados não é tão fácil. Eles geralmente são hospedados separadamente no site do criador e é difícil comparar os diferentes para escolher o melhor para uma tarefa específica. Para os recém-chegados, também é difícil encontrar as palavras-chave certas para colocar no Google.

É por isso que criamos o VisualData , um mecanismo de pesquisa para conjuntos de dados de visão computacional. Cada conjunto de dados é curado ou enviado pela comunidade, marcado com tópicos relevantes para filtragem e você pode digitar palavras-chave na barra de pesquisa que corresponderão ao título e à descrição do conjunto de dados para encontrar facilmente os melhores para usar. Eles são classificados de acordo com a data publicada, portanto, a adição mais recente é exibida. Você também pode classificar por popularidade para ver quais são os conjuntos de dados de tendências com base na frequência de visitas. A visualização detalhada mostra a descrição completa de um conjunto de dados e links para códigos / modelos de código-fonte aberto. Outras informações úteis serão adicionadas de forma incremental no futuro, por exemplo, artigos / tutoriais sobre o conjunto de dados, dificuldade para trabalhar com etc. Algumas capturas de tela de exemplo do site são ilustradas abaixo.

Da esquerda para a direita: filtrando com vários tópicos, pesquise com palavras-chave. Da esquerda para a direita: classifique por data ou popularidade, detalhe do conjunto de dados.

Este é um site que eu gostaria que existisse durante o meu Ph.D. Agora, espero que isso ajude as pessoas interessadas em visão computacional a explorar facilmente os dados existentes para realizar seus experimentos mais rapidamente. Ainda está em uma forma inicial, e há algumas ideias interessantes a serem adicionadas para versões futuras. Esperamos ouvir como isso pode ser mais útil para você.

Siga-nos no Twitter para obter atualizações sobre novos conjuntos de dados e lançamento de código. Se você criou ou conhece um conjunto de dados interessante, não hesite em enviar para o VisualData clicando no botão "Adicionar meu conjunto de dados". Este post também foi apresentado no site do KDnugget.