
Il n’est pas un jour sans qu’un nouvel acteur apparaisse principalement aux Etats-Unis sur le secteur du
social media monitoring. Le secteur connaît donc une
explosion des acteurs en présence sans que cela ne se traduise par une augmentation des possibilités et fonctionnalités offertes par ces outils. On observe en effet depuis quelques mois une forme de
stabilisation ou de
convergence des
features présentes dans tout outil de
social media monitoring.
Une analyse lointaine pourrait laisser penser qu’une telle homogénéisation des services est la résultante d’une adéquation entre l’offre et la demande, les clients de ce type de solutions y trouvant actuellement précisément les fonctionnalités attendues pour gérer l’image en ligne de leur marque ou de leurs clients. Il n’en est pourtant rien et
nombre d’experts soulignent les insuffisances de ces solutions (voir par exemple
l’excellent billet d’Asi Sharabi qui a suscité une importante polémique dans le secteur).
Parmi ces fonctionnalités que tout outil se doit de mettre en avant on trouve
l’analyse de tonalité, plus couramment appelé
sentiment analysis. Chaque outil se targue de pouvoir taguer à la volée les contributions au sujet d’un produit ou d’une marque comme étant négatifs, positifs ou neutres et de produire des indicateurs agrégés permettant de repérer en un coup d’œil les humeurs de ses consommateurs.
Une fois dépassé le discours commercial et l’orchestration permanente d’un buzz enthousiaste sur le sujet (par les revendeurs eux même forcément), la réalité est bien moins glorieuse et l’écart entre la pertinence réelle de ces outils et ce qui en est dit abyssal.
Le langage n’est pas constant. Il varie en fonction des zones géographiques, des niveaux d’éducation, des âges, des centres d’intérêt. Il est en perpétuelle évolution et se réinvente continuellement, produisant de nouveaux mots, en exhumant des disparus, donnant des sens nouveaux à d’autres. Le TAL (traitement automatisé du langage) travaille activement sur cette complexité depuis plusieurs dizaines d’années et tous les experts s’accordent à dire que, bien que les progrès dans le domaine sont conséquents,
il n’est pas possible de proposer des services tout terrain capables d’analyser automatiquement tout type d’expression issue de la variété des modes d’expression du web.
Comme nous l’avons indiqué précédemment, le
sentiment analysis présent sur la plupart des outils de
social media monitoring limite la problématique du TAL en se proposant d’annoter les contenus analysés sur une échelle de tonalité allant du négatif au positif en passant par le neutre. Bien que l’ambition soit ici plus limitée,
les résultats obtenus ne peuvent être jugés satisfaisants. Seule une partie extrêmement limitée du lexique des termes et expressions laudatifs et péjoratifs est partagée, sa grande majorité est dépendante du locuteur (origine sociale, âge, centres d’intérêt), du contexte élargi (contenus de la page mais aussi contenus des pages et sites en proximité).
Ces difficultés ne sont pas insurmontables mais elles demandent une expertise et une intervention humaine continue n’autorisant pas la mise à disposition de tels services sur étagère ou sous forme de SaaS.
Au final, la plupart des solutions existantes classe une grande majorité des prises de position comme étant neutres pour ne pas créer un bruit trop visible et décrédibilisant. Malgré cette sécurité, dans nombre de cas, les technologies sont incapables de repérer le sarcasme, l’ironie, l’implicite, le suggéré et tous ces éléments qui font qu’au final
toute prise de parole est porteuse de jugement. Par conséquent, la qualification d’une prise de position comme étant « neutre » est la plupart du temps inappropriée et les résultats agrégés sur les proportions de messages positifs, neutres et négatifs de peu de confiance.
Il est évidemment inquiétant de constater que nombre de marques, agences, instituts d’études s’appuient sur ce type de résultats pour orienter leurs actions ou préconisations. Tous profitent d’une
cécité partielle ou complète des marques quant aux médias sociaux due à un manque de compréhension de ces nouveaux territoires ainsi qu’à l’absence de
standards partagés et d’une mesure in fine du
ROI (voir à ce sujet
la présentation très pragmatique d’Olivier Blanchard sur la mesure du ROI dans les médias sociaux). Maintenir ce flou, c’est à terme,
discréditer ce secteur d’activité et le mener à une mort certaine. Nous manquons aujourd’hui d’acteurs réellement indépendants, n’ayant pas d’intérêt à promouvoir ce type d’outils, pour poser des benchmarks s’appuyant sur leur utilisation en situation et non sur la comparaison de leurs fonctionnalités déclarées ou des entretiens avec leurs propres concepteurs et promoteurs …
ps : je découvre à l’instant
ce billet publié il y a quelques heures par le blog de ComMetrics qui va clairement dans le bon sens !

J’ai un exemple marquant de locution a priori creuse, mais subtile, difficile à analyser, et que nos camarades non français (pour d’autres zones francophones, je ne sais pas si cela s’emploie couramment).
Il s’agit du « ouais mais non ». Là c’est une terrible colle pour un automate : nous avons successivement l’affirmative (mitigée, le « ouais » valant moins de positif que le « oui » net), la nuance du « mais » qui apporte un bémol ou des circonstances, et le « non » qui est négatif.
Mis bout à bout, cela signifie quelque chose comme : je comprends ta proposition de départ et les arguments qui s’y rapportent pourtant je ne peux pas y souscrire (pour tout un tas de raisons).
… et que nos camarades non français ont du mal à appréhender (une phrase finie, c’est toujours mieux
J’ajoute que si l’analyse des sentiments sur Twitter, par exemple, se limite à l’unité, on perd le fil de la « conversation ». Un twitt seul peut donner le ton, le second nuancer, le troisième expliciter clairement le propos..
@Enikao ne parlons effectivement pas de twitter pour lequel déclarer faire du sentiment analysis sur 140 caractères relève de la pure escroquerie intellectuelle …
Bon billet et j’ajouterais, pour l’avoir vu en conférence, que les taux de pertinences réels ne dépassent pas 50%, ce qui revient à classer les billets au hasard…
« l’analyse de sentiments » (terme assez imprécis et exagéré évidemment) est pourtant complémentaire de votre approche « formalisation des dynamiques relationnelles » sur le web (que vous baptisez « dynamique d’opinions » sur des « territoires d’opinions », termes largement imprécis ou exagéré aussi), non ?
Il me semble que vous devriez travailler à un rapprochement avec ce type d’approche, plutôt que de les critiquer si vertement : car je me souviens de votre petite étude sur la « crise Antillaise » avec Linkfluence en 2009 > à la lectire de ces 7 pages on avait l’impression de pouvoir faire la même chose avec Google Blog seach, en une demi-heure et gratuitement !
(trouver les 50 blogs locaux qui relataient cette crise puis résumer leur propos). Pas besoin d’un outil onéreux comme Linkfluence pour ça …
http://fr.linkfluence.net/blog/2009/03/03/crise-antillaise-guadeloupe-martinique-reunion-memes-schemas-de-conflits/
non ?
et je ne travaille pas pour ces boites ou agences « d’analyse de sentiments » : je suis plutôt en sociologie et ces outils m’intéressent au plus haut point !
C’est l’utilisation de ces techno qui pose plus de problème qu’autre chose. Le HufPo l’utilise pour faire un premier tri des commentaire afin de ne remonter en modération (humaine) que les susceptible de poser problème, ça marche très bien.
Au passage, un dislaimer pour dire que ce type de techno marchait sur les platebandes de vos offres de services aurait été le bienvenu, non ? D’autant qu’elle sont (encore ?) très loin d’être une véritable menace.
@Thierry : Par territoires d’opinions nous entendons des ensemble de sites fortement connectés (agrégats) partageant des intérêts et affinités communes. Pour une plongée plus en profondeur sur les concepts qui président à notre approche, vous pouvez vous référer au site de WebAtlas (http://www.webatlas.fr) et aux publications qui y sont présentes, WebAtlas étant le pendant recherche de RTGI (nous sommes tous issus du même collectif de recherche). Comme je le dis plus bas à Fabrice, approche topologique et sémantique ne sont pas concurrentes et bien complémentaires et nous travaillons activement à l’intégration de données issues de l’analyse sémantique de nos corpus. Enfin concernant l’analyse de la crise antillaise, elle correspond assez précisément aux attentes des partis-prenants (gouvernement et acteurs de la société civile) qui ont suivi nos publications avec attention et qui pour certain ont été clients de notes plus poussées mais … payantes.
Enfin concernant nos prix, nos offres couvrent une large gamme de prix commençant aux alentours de 500€ ce qui se situe dans la fourchette basse des prix du marché.
@Fabrice Epelboin : totalement d’accord là dessus ! Dès qu’on commence à penser des dispositifs hybrides palliant les déficiences de la technique par une intervention humaine, on obtient des dispositifs de bien meilleure qualité. Pour l’autre point abordé, nos technos ne marchent pas sur les platebandes de ces offres étant donné qu’elles y sont tout à fait intégrables et que nous les veillons depuis plusieurs années maintenant pour repérer le moment où justement cela deviendra pertinent… Approches topologiques (études du graphe social) et sémantiques (étude des contenus) n’étant pas concurrentes mais bien complémentaires… Billet sur le sujet d’ailleurs à venir très bientôt.
Ben oui, d’où le terme marcher sur les platebandes plutot que ‘faire concurrence’…
Bonjour,
Billet très intéressant qui effectivement souligne un constat que n’importe quel veilleur utilisant des plateformes de veille d’opinion se fait… LA « machine » ne peut encore remplacer l’humain pour analyser l’humain !
Néanmoins il me semble que, pour la plupart des prestataires (français en tout cas) l’analyse des tonalités est en grande partie réalisée par des chargés d’études et non pas par une automatisation quelconque ?!
De plus, ce type d’analyse n’est-il pas seulement en adéquation avec la demande des clients (pas des agences ou cabinet de veille, des annonverus) ? Peu importe le détail tant que les « parts de voix » sont là et que l’on parle de la marque…
Enfin, que penser d’un simple découpage « neutre », « positif », « négatif » ?! N’y a t’il pas plus de subtilités dans le langage humain ?!
Comme vous le soulignez, étant donné le nombre important de prestataires et de nouvelles agences dédiées à la veille d’opinion, ce genre de pratique facilement commercialisables ne vont pas s’arrêter de ci-tôt…
Article intéressant qui soulève plusieurs aspects du nouveau marché du Social Media Monitoring (SMM), dont la prolifération des nouveaux acteurs et le « Sentiment Analysis ».
On assiste à une sorte de « Ruée vers l’Or » dans le domaine de la surveillance des médias sociaux
. Ce qui s’explique: les coûts d’investissements ne sont pas énormes, les développements Web se font de plus en plus vites et ces mêmes réseaux sociaux qu’on surveille sont un bon moyen pour promouvoir son produit. Le Marché du SMM est en train de prendre forme, majoritairement, dans les pays occidentaux. A mon avis, pour y survivre, les éditeurs devront proposer des solutions de SMM locales pour d’une part répondre aux exigences spécifiques des entreprises locales et d’autre part prendre en compte les subtilités du langage (Sentiment Analysis).
Concernant le « Sentiment Analysis », c’est une technologie qui n’est pas encore au point. le langage humain est très complexe et très difficile à cerner par les automates actuels. La Recherche en Analyse Sémantique n’est pas à ses débuts mais à ce jour, il n’y pas de résultats probants.
Par ce commentaire, j’aimerai partager avec vous l’outil Personas http://personas.media.mit.edu/ qui réalise une analyse syntaxique des textes trouvés sur le Web. Plus de détail, je me permets d’ajouter un lien vers mon blog à ce sujet : http://digitalreputationblog.wordpress.com/2009/08/28/personas-outil-de-profilage-en-ligne/.
Merci pour cet article très intéressant et bien rédigé. Constat similaire fait de notre côté.
Technique à surveiller pour l’avenir, mais discernement humain irremplaçable.