Compter les mots et afficher le résultat en nuage. La suite.

Il y a quelques temps je vous parlais de mes essais en script bash. Le bout de script a légèrement été amélioré en faisant en sorte de ne plus supprimer les mots courts, mais ceux prédéfinis dans une liste.

Histoire de le tester sur quelque chose, le script a été lancé sur des pdf de la bible et du coran. Comme pour les sites de partis politiques le résultat est sans surprise, mais j'ai constaté qu'il intéressait quand même pas mal de gens. Du coup c'est cadeau :

-Bible

-Coran

Il reste plusieurs points à améliorer, mais vous pouvez récupérer le script ici.


Commentaires :

Igor :

Tes billets sur les nuages de mots me font penser que j'avais fait un petit test avec R et RStudio, à partir d'un fichier .txt. Mais je testerais bien le fait d'aller chercher du contenu sur un site Web, pour voir. https://id-libre.org/blogigor/article100/un-wordcloud-avec-r

Aegirs :

Je ne conaissais pas R, mais ça a l'air bien sympatique. Pour le contenu des pages webs, tu te rendras sans doute compte qu'il faut parfois tricher un peu, certains sites essayant de bloquer les "aspirateurs de sites"

Laisser un commentaire

social