Aplicando Aprendizado Profundo à Pesquisa do Airbnb

Confira nosso artigo sobre o tema, publicado em arXiv

Malay Haldar Blocked Unblock Seguir Seguindo 6 de novembro de 2018

A busca por casas é o principal mecanismo que os hóspedes usam para encontrar o local que desejam reservar. Como o núcleo de como funciona o mercado Airbnb, o objetivo do ranking de busca é encontrar os melhores opções possíveis, recompensando os anfitriões mais merecedores. A classificação no Airbnb é uma busca para entender as necessidades dos hóspedes e a qualidade dos anfitriões para conseguir a melhor combinação possível.

Vários fatores tornam o ranking de busca na Airbnb um desafio diferente de qualquer outro. Para começar, existem os desafios padrão associados à escala. Espalhada por mais de 191 países e 81.000 cidades, as listagens da Airbnb estão em todos os cantos do planeta e a definição do melhor negócio tem muitas cores locais. Adaptar o ranking para um bom desempenho em uma gama tão diversificada de mercados amplia os limites da otimização.

Para tornar as coisas mais complexas, cada uma dessas listagens é uma oferta única. As categorias de casas incluem o familiar, assim como o romance, variando de apartamentos a iglus. Mesmo dentro de uma categoria padrão, como apartamentos, quando diferentes variações ao longo do preço, localização, conforto, decoração etc são fatoradas, como ordenar as casas objetivamente é um problema difícil, mesmo para os seres humanos, e muito menos resolvê-lo usando máquinas.

Diversidade de casas no Airbnb

Presumivelmente, todos esses desafios podem ser superados acumulando quantidades suficientes de dados. Mas o inventário da Airbnb tem um toque adicional. Cada lista pode ser reservada apenas uma vez por noite. Assim que a listagem é registrada, ela fica indisponível para qualquer pesquisa subseqüente dessa noite, portanto, não há mais dados acumulados para ela. Isso torna os dados por listagem muito escassos. O gráfico abaixo mostra a distribuição normalizada de impressões por listagem e a natureza de cauda longa dos dados disponíveis.

Consequentemente, a solução para o problema de classificação exige ampla generalização a partir de alguns exemplos, memorizar os principais resultados neste caso é de pouca utilidade.

A tarefa de decifrar a preferência dos hóspedes tem um lado igualmente fascinante. Nós conseguimos ver os convidados quando eles estão planejando suas viagens, o que não é todos os dias para a maioria. Mas assim que chegam, os convidados se envolvem intensamente na pesquisa e geralmente têm preferências e orçamentos muito específicos. Um convidado pode acabar reservando uma sala privada de barganha, enquanto outro uma cobertura luxuosa, mas ambos podem começar por procurar um lugar para 2 em Roma. Para personalizar efetivamente a experiência de pesquisa, precisamos processar um enorme volume de dados em tempo real.

O grande número de dimensões e a dispersão relativa de dados no lado do convidado e do host criam a tempestade perfeita onde muitas das técnicas de otimização conhecidas são quebradas.

Então, como lidamos com todos esses desafios? A versão da resposta é: redes neurais. Mas como chegamos lá e como continuamos a evoluir é um conto com reviravoltas. Celebrando a cultura do compartilhamento, em um primeiro olhar profundo sobre o ranking de busca do Airbnb, publicamos um artigo que descreve nossa jornada para redes neurais profundas.

Acesse o papel

Aplicando o Deep Learning na Pesquisa do Airbnb , pdf 8 páginas, publicado em arXiv, out 2018.

Esperamos que a história de nossos contratempos e triunfos forneça insights úteis para outras equipes que enfrentam desafios semelhantes. Nós sempre acolhemos as ideias dos nossos leitores. Para os interessados em ação prática, confira as posições abertas para engenheiros e cientistas de dados da equipe de pesquisa.