Determine a “legibilidade” de um texto com Python

Carmine DiMascio Blocked Desbloquear Seguir Seguindo 7 de janeiro

George Klare (1963) define a legibilidade como “a facilidade de compreensão ou compreensão devido ao estilo de escrita”.

A legibilidade, embora um tanto subjetiva, tem sido um tópico bem pesquisado desde a década de 1920. Desde então, os pesquisadores criaram várias fórmulas de legibilidade que tentam identificar com precisão a legibilidade de um texto.

As métricas de legibilidade têm vários usos. Um escritor pode usar as métricas para avaliar objetivamente a complexidade de seu trabalho para determinar se ele está escrito em um nível apropriado para seu público-alvo. Uma empresa de software educacional pode usar métricas de legibilidade para recomendar conteúdo apropriado para seus alunos.

Atualmente, trabalho no segundo. Como resultado, escrevi um pacote Python, py-readability-metrics, que avalia a legibilidade de um determinado texto, usando uma variedade das métricas de legibilidade mais populares da atualidade. Esses incluem:

  • Nível de classe Kincaid Flesch
  • Facilidade de leitura de Flesch
  • Dale Chall Readability
  • Índice de legibilidade automatizado (ARI)
  • Coleman Liau Index
  • Nevoeiro
  • SMOG
  • Escrita Linear

Dado um texto, cada uma das métricas acima calcula uma pontuação indicando a dificuldade do texto. Muitas vezes, a pontuação é mapeada para um nível de ensino, por exemplo. jardim de infância, primeiro grau, …, através de pós-graduação.

py-readability-metrics implementa as fórmulas acima e calcula suas pontuações. Além disso, permite interpretar facilmente cada pontuação, reportando o seu mapeamento de níveis de notas. Por exemplo, uma pontuação de “Flesch Reading Ease” de 80 indica que o texto está escrito em um nível de leitura de 6ª série. Uma pontuação de grau 6 no nível de Flesch-Kincaid também indica um nível de leitura de 6ª série.

Vamos ver alguns exemplos

Para instalar o pacote, use pip :

  • pip install py-readability-metrics instala o módulo
  • python -m nltk.downloader instala um módulo de pontuação

Agora que instalamos o módulo, vamos ver como avaliar um texto usando a métrica Flesch Kincaid Grade Level

E agora, com avaliar o mesmo texto, usando o índice SMOG

O py-readability-metrics fornece uma API simples que permite aos desenvolvedores avaliar facilmente a legibilidade de um determinado texto usando uma variedade de métricas populares.

Se você cavar o projeto, coloque-o no GitHub !