Les nuages font-ils une percée en recherche?
Je ne parle pas ici du cumulonimbus, mais bien du nuage de mots-clés (tag cloud). À l’origine conçus pour le Web, les nuages de mots-clés sont une représentation visuelle des mots-clés (ou tags) les plus utilisés sur un site ou un blogue. La taille des mots varie généralement selon leur occurrence (source : Wikipédia). Vous n’avez d’ailleurs qu’à regarder à la gauche de votre écran pour en voir un exemple : les sujets du blogue de SOM sont présentés ainsi.
Depuis quelque temps toutefois, on voit apparaître de nouveaux usages du nuage de mots-clés. C’est le cas notamment en recherche qualitative : on utilise des applications comme Wordle ou TagCrowd pour créer des nuages de mots à partir de données textuelles (ex. : transcription d’entrevues ou de groupes de discussion). On a qu’à «coller» le texte visé dans l’espace prévu à cet effet. Voilà à quoi ça peut ressembler :
L’exemple du haut a été créé avec l’application Wordle. Il a l’avantage d’être plus esthétique et d’offrir des options de visualisation (couleur de l’arrière-plan et des caractères, allure générale du nuage, etc.). L’exemple du bas a été fait avec TagCrowd. Cette dernière application propose moins de choix pour modifier l’aspect visuel, mais il est possible de créer une liste personnalisée de mots à exclure du nuage (ex. : les articles communs). De plus, on peut voir, entre parenthèses, la fréquence des mots du texte.
Quelle valeur ajoutée?
En somme, ce n’est qu’une représentation graphique des mots les plus fréquents d’un texte. En matière de recherche qualitative, il existe des logiciels qui vont beaucoup plus loin dans l’analyse de contenu. Mais il faut dire que c’est joli. Et il peut s’agir d’une façon intéressante de capter l’attention du lecteur…
3 réponses à “Les nuages font-ils une percée en recherche?”
C’est vrai que les nuages de mots font une représentation attrayante. Toutefois, j’ai des doutes sur leur utilité pratique en analyse de texte, particulièrement si on a un échantillon de textes (par exemple les commentaires d’un « focus group »). Je vois à prime abord deux problèmes.
Il y a tout d’abord l’impossibilité de créer des équivalence entre différents mots qui peuvent être utilisés pour exprimer la même idée. Ceci peut donc diluer un peu l’importance d’une idée qui peut être exprimée avec plusieurs mots différents et un idée qui n’a qu’un mot pour l’exprimer.
L’autre problème que je vois a trait aux difficultés à pondérer les différents textes. En effet, on peut penser à un exemple où un échantillon est composé d’un texte relativement long ne traitant que d’une seule idée en utilisant un seul mot à répétition (donnant une très grande fréquence à ce mot) et d’un autre texte, plus court mais développant plusieurs idées avec un vocabulaire très varié.
Peut-être que les nuages de mots peuvent, au même titre que les nuages de points, servir d’outil descriptif, mais je crois qu’il y a toujours un travail d’analyse important à faire pour sortir une conclusion d’une analyse qualitative. Merci encore pour un billet très intéressant qui suscite la réflexion.
@Pierre-Hugues : Je suis entièrement d’accord avec toi. C’est loin d’être un outil d’analyse. Bien sûr, les nuages peuvent donner des indices sur les principaux sujets discutés, mais ce n’est pas suffisant pour faire une analyse de contenu rigoureuse. Merci pour ton commentaire!