Te Papa Tongarewa (Museu da Nova Zelândia) Sentimental Footing

Herman Wandabwa Seg. 22 de jul · 5 min ler https://www.tepapa.govt.nz/visit/plan-your-visit/getting-here

Fiz uma visita a este museu há cerca de quatro meses em um tour por Wellington , a capital mais ventosa do mundo . O nome Maori, ' Te Papa Tongarewa ', se traduz literalmente em 'recipiente de tesouros' e começou em 1865 como um minúsculo Museu Colonial.

O edifício é magnífico, bem como as exposições lá. Dois lugares que eu amava estavam a Marae , e na seção que documenta as viagens migrantes para a Nova Zelândia. Como aspirante a cientista de dados, eu tinha um objetivo depois de deixar o local. Eu queria descobrir se o sentimento positivo que tive foi uma réplica do que os outros sentiram ou perderam. Minha primeira parada foi uma rápida olhada nos comentários online. Eu escolhi comentários do TripAdvisor com base na sua concisão e alto nível de expressividade. Recebi as revisões do Trip Advisor de Te Papa de 2016–04–01 a 2019–07–15. Um pouco de estatísticas e uma amostra do conjunto de dados é como abaixo.

Um trecho de 11940 comentários. Nome do hotel é apenas um lugar no meu processo de coleta de comentários, então sim Te Papa não é um hotel. O conjunto de dados é composto por 11940 avaliações. O resto do que vamos cobrir está no bit de texto da revisão, portanto, não estatisticamente significativo aqui.

Algumas análises sobre o conjunto de dados:

Os comprimentos de texto de revisão de distribuição e contagem de palavras

120-139 caracteres comentários comprimentos foram escritos por 1068 visitantes. Esse é o cluster mais representativo.4630 avaliações foram compostas de 20–39 palavras, o que as torna bastante expressivas. Os visitantes realmente queriam passar a mensagem.

Análises de texto

Nós limpamos ou dados, seguindo os processos abaixo: –

  1. Largue o nome do hotel , reveja o título , vote útil , nomes de utilizador .
  2. Dê as classificações de 5 e não 50. Simplesmente divida por 10.
  3. Remova as linhas em que "review_body" está faltando.
  4. Crie um novo recurso para o tamanho da revisão.
  5. Crie um novo recurso para a contagem de palavras da revisão.
  6. Use o TextBlob para calcular a polaridade do sentimento. Os valores variam de -1 a 1, sendo 1 o mais positivo e -1, o mais negativo.

A saída do processo acima é como abaixo:

Resultados após: Eliminação do nome do hotel, título da revisão, voto útil, nome do usuário, pré-processamento (remoção de caracteres indesejados. Pode ser definido pelo usuário), cálculo da polaridade e adição de colunas de comprimento de revisão e contagem de palavras.

Operações TextBlob

TextBlob uma biblioteca Python (2 e 3) fornece uma API simples para mergulhar em tarefas comuns de processamento de linguagem natural (NLP) como tagging de parte da fala, extração de frase nominal, análise de sentimento, classificação, tradução, etc. O snippet de código abaixo gera 5 tweets aleatórios com a polaridade mais positiva no dataframe. O mesmo pode ser feito para o mais negativo, isto é, polaridade = = -0,875 e polaridade == 0 para tweets neutros no nosso caso.

Cinco tweets aleatórios com o sentimento mais positivo, ou seja, polaridade igual a 1.

Eu não estava satisfeito com o desempenho da biblioteca TextBlob, especialmente na identificação de sentimentos negativos em um conjunto de dados que é fortemente inclinado para a polaridade positiva, conforme mostrado abaixo.

Inclinado para a esquerda. Cerca de 38% dos comentários mostram satisfação com o que Te Papa oferece.

Sentimentos com o VADER

O VADER ( Valence Aware Dictionary e sEntiment Reasoner ) é uma ferramenta de análise de sentimentos baseada em léxico e regras. Ele usa uma combinação de um léxico de sentimento, que é uma lista de características lexicais (por exemplo, palavras) que são geralmente rotuladas de acordo com sua orientação semântica como positivas ou negativas.

Eu usei o VADER para analisar os sentimentos tanto quanto os mais acostumados com os dados sociais, em comparação com as revisões convencionais.

A maioria das revisões negativas é com uma pontuação composta de -0,9794.

A revisão mais negativa de acordo com o VADER está abaixo.

Fomos ao Te Papa para ver o Gallipolli, a escala da exposição de guerra. Esta exibição foi ótima, mas terrivelmente triste ao mesmo tempo, pois recontou a história sobre a futilidade da guerra e a terrível perda da vida humana. Os modelos superdimensionados criados pela oficina Weta eram terrivelmente precisos.

Palavras como “terrivelmente” e “triste” devem ter desempenhado um papel fundamental no processo de negação. Tanto quanto o resto dos sentimentos mais os aspectos positivos são excessivamente bons, exige um olhar mais aguçado para capturar tais inconsistências. Tudo somado, esperando 100% de precisão nas declarações extraídas é uma impossibilidade. A única saída é treinar nosso próprio modelo tanto quanto não seja exageradamente exato. Nós vamos fazer isso mais tarde.

Sentimentos ao longo do tempo

Eventos influenciam os sentimentos das pessoas. O lançamento de certas exposições deve provocar reações mistas dos visitantes. Traçar sentimentos como uma série de tempo nos dará uma idéia melhor dos padrões nos sentimentos dos visitantes. Antes de plotar, algumas alterações são feitas no quadro de dados. Classificamos todos os valores pelo tempo de revisão copiando o tempo de revisão para o índice e com um intervalo de 24 horas entre as revisões para facilitar a representação gráfica e calculando uma média de expansão e rotação para as pontuações de sentimento composto.

Alguns pontos interessantes da trama acima:

  1. Muitos pontos de sentimento estão concentrados em torno de 0,75 pontos. Este é um forte indicador de que a maioria das análises foi excessivamente positiva.
  2. Existem muitos pontos de dados. Difícil de interpretar padrões.

Uma representação de amostra de todo o conjunto de dados pode fornecer um gráfico mais interpretável. A saída abaixo corrobora com a afirmação anterior de forte positividade na experiência dos visitantes do Te Papa.

Pontuações de sentimento são mais altas, isto é, perto de 1.0. Mostra um equilíbrio e equilíbrio em termos do que Te Papa oferece aos seus clientes.

Conclusão

Te Papa tem uma forte base quando se trata de experiências de visitantes das análises acima. Nós fizemos uso de dois analisadores de sentimento que se mostraram versáteis tanto quanto a detecção de negatividade nos sentimentos foi difícil para ambos. Este é o primeiro passo de uma série de posts sobre as perspectivas estatísticas e de dados de Te Papa. Estou ansioso para fazer uso dos conjuntos de dados disponíveis publicamente do Te Papa para elaborar o seguinte:

  1. Treinamento de um classificador de sentimentos com base em uma representação de vetor baixa reforçada com mais dados de suas avaliações do Google. Espero que eu também escore seus dados sociais.
  2. Análise de sentimentos baseada em aspectos. Quais aspectos são os visitantes do Te Papa entusiasmados e quais são as insatisfações deles?
  3. Uma análise comparativa de cabeça a cabeça com alguns dos outros 25 principais museus do mundo classificados pelos viajantes. Quais aspectos os fazem melhor em comparação ao Te Papa?
  4. Análise de se certos eventos em Wellington ou no próprio Te Papa afetam as experiências dos visitantes.

Fique ligado!