Tutorial da TensorFlow Object Detection API – Treinando e avaliando o detector de objetos personalizado

Vatsal Sodha Blocked Unblock Seguir Seguindo 26 de março Exemplo de saída do detector de objetos.

Nós todos estamos dirigindo carros, é fácil né? Mas e se alguém lhe pedir para pilotar um avião, o que você fará? Sim, você adivinhou certo você vai olhar para o manual de instruções. Da mesma forma, considere este tutorial como um manual para configurar a API complexa e espero que este tutorial ajude você a fazer um voo seguro.

Primeiro, primeiro, clone o repositório de detecção de objetos TensorFlow, e espero que você tenha instalado o TensorFlow .

 clone git https://github.com/tensorflow/models.git 

No aprendizado de máquina clássico, o que fazemos com o uso do arquivo .csv é que treinamos e testamos o modelo. Mas aqui, o que temos que fazer em nível rudimentar é mostrado abaixo:

Diagrama de fluxo básico.

Antes de prosseguir, quero discutir a estrutura de diretórios que utilizarei ao longo do tutorial.

  • data / – Terá registros e arquivos csv.
  • images / – Este diretório conterá nosso conjunto de dados.
  • training / – Neste diretório vamos salvar nosso modelo treinado.
  • eval / – Irá salvar os resultados da avaliação no modelo treinado.

Trending AI Articles:

1. Como eu usei aprendizado de máquina como inspiração para pinturas físicas

2. MS ou Job Startup – Qual o caminho a percorrer para construir uma carreira em Deep Learning?

3. TOP 100 artigos médios relacionados com Inteligência Artificial

Etapa 1: Gerando arquivos CSV a partir de imagens

Este passo é bastante simples, não vou mergulhar muito mais fundo, mas vou mencionar aqui algumas das boas fontes. O objetivo é rotular a imagem e gerar arquivos train.csv e test.csv.

  1. Etiquete a imagem usando lablelImg . A explicação detalhada pode ser encontrada aqui .
  2. Precisamos converter XML em arquivos csv, o que é demonstrado aqui

A razão de ser eu não estou mencionando em detalhe é que existem várias maneiras de gerar os arquivos csv a partir de imagens dependendo do tipo de conjuntos de dados que estamos lidando.

No meu projeto, eu quero detectar nódulos de pulmão usando o conjunto de dados LUNA , nós já tivemos coordenadas de nódulos a serem detectados, então para nós é bem simples fazer arquivos csv. Para detectar nódulos estamos usando 6 coordenadas como mostrado abaixo:

Snippet do arquivo train / test.csv

Em vez de nódulos de classe, seu arquivo terá um nome de classe diferente, senão permanecerá o mesmo. Uma vez, nossos dados de imagem rotulados são transformados em números que são bons para gerar TFRecords