Présidentielle 2017 : le big data donne Fillon au second tour, pas les sondages. Qui aura raison ?

Sale temps pour les sondages. Paniqués à l’idée de ” rater ” le premier tour de l’élection présidentielle, les voici challengés par de nouveaux venus : les spécialistes du big data, qui utilisent l’analyse des données à grande échelle pour établir une autre cartographie de l’opinion.

Première mauvaise nouvelle pour les sondeurs, dont la méthodologie est ouvertement contestée : contrairement à eux, ces concurrents du big data ont su prédire la qualification de François Fillon au premier tour de la primaire à droite. Et aussi l’élection de Donald Trump et, pour Vigiglobe, la victoire du Brexit. Trois échecs cuisants pour les instituts de sondages.

Deuxième mauvaise nouvelle : les prédictions de Filteris, de Vigiglobe et de l’algorithme Predict My President ne valident pas celles des sondages. Ceux-ci ne cessent d’annoncer un duel entre Emmanuel Macron et Marine Le Pen. Au contraire, les trois initiatives misent sur la qualification de François Fillon. Ils diffèrent par contre sur le ou la candidate qui l’accompagnera au second tour. Une question de méthodologie qui révèle aussi les limites de l’exercice.

Retour sur ces trois trublions de la campagne, leur méthodologie, leur crédibilité, leurs prédictions. Puis celles, très différentes, des tout derniers sondages.

Filteris : un second tour Fillon / Le Pen

Qu’est-ce que c’est ? Filteris est une société canadienne créée en 2002 par Jérôme Coutard et Isabelle Dornic, tous deux docteurs en sciences sociales. L’entreprise est spécialisée dans l’analyse d’image, la gestion et la sécurisation de l’identité numérique des entreprises, institutions et personnalités. Depuis 2007, Filteris a développé une expertise dans l’analyse du buzz généré sur le web et les réseaux sociaux dans des contextes électoraux, baptisée BuzzPol.

Quelle méthodologie ? BuzzPol réalise, comme les sondages, des mesures régulières de l’opinion. Mais contrairement aux sondeurs, BuzzPol ne se base pas sur le recueil d’intentions de vote auprès d’un public représentatif, mais sur l’analyse à grande échelle des perceptions, avis et opinions exprimés sur le web et les réseaux sociaux. Son algorithme permet d’analyser ces points de vue de manière quantitative et qualitative, puis de générer un score sur 100, réparti entre les candidats.

Quel est son pronostic ? Dans sa dernière mesure du vendredi 21 avril, François Fillon arrive en tête avec 22,09%. Il est suivi par Marine Le Pen, avec 21,75%, puis Jean-Luc Mélenchon (21,11%) et enfin Emmanuel Macron (19,92%). Les quatre candidats se tiennent à un peu plus de deux points. Autrement dit, dans un mouchoir de poche.

C’est la 16è mesure d’opinion de Filteris depuis le 3 avril. Les 14 premières indiquaient que François Fillon et Marine Le Pen figureraient au second tour. Seule la 15è, du jeudi 20 avril, anticipait un second tour Fillon-Mélenchon.

Quelle crédibilité ? Filteris a correctement prédit la victoire de Donald Trump à l’élection présidentielle américaine. L’entreprise n’a pas travaillé sur le Brexit. Contrairement aux sondages, Filteris a su prédire la première place de François Fillon à la primaire de la droite. Mais l’entreprise attendait Nicolas Sarkozy en deuxième position, alors que c’est Alain Juppé qui s’est qualifié. Elle s’est en outre trompée sur le premier tour de la primaire de la gauche : Benoît Hamon, qui est arrivé en première position, était donné troisième, derrière Manuel Valls et Arnaud Montebourg.

Vigiblobe : Fillon probablement qualifié, Macron et Mélenchon en embuscade, Le Pen hors de l’équation

Qu’est-ce que c’est ? Vigiglobe est une startup française dirigée par Leendert de Voogd, un ancien directeur mondial de l’institut de sondage TNS. Son credo : l’analyse des réseaux sociaux Twitter et Facebook pour repérer les tendances émergentes afin d’orienter la communication de ses clients, les marques. La startup a aussi développé des outils d’analyse spécialement conçus pour les élections, afin de repérer les signaux faibles qui traduisent des dynamiques qui échappent aux sondeurs – ou que ces derniers perçoivent trop tard.

Quelle méthodologie ? Vigiglobe utilise des algorithmes, développés en interne, de machine learning (apprentissage par la machine à base d’intelligence artificielle), capables d’analyser à la fois quantitativement (qui suscite le plus de réactions ?) et qualitativement (quelle tonalité ?) les messages postés sur les réseaux sociaux. Grâce à des partenariats exclusifs avec Facebook et Twitter, la startup a accès à l’ensemble des contenus publiés. La moitié des Français est sur Facebook, et Twitter revendique 15 millions de comptes en France.

Quel est son pronostic ? Contrairement à ses concurrents, Vigiglobe ne se risque pas au jeu des prédictions. En revanche, la startup estimait, jeudi 20 avril, que François Fillon a ” de grandes chances de se qualifier pour le second tour “. Ses algorithmes d’analyse du sentiment voient se dégager un trio de tête dans un mouchoir de poche : François Fillon (qui dispose en plus du plus grand nombre de messages positifs), Emmanuel Macron et Jean-Luc Mélenchon.

Contrairement aux sondages et aux autres spécialistes du big data, Vigiglobe estime que Marine Le Pen est en sérieuse perte de vitesse, et qu’elle pourrait, par conséquent, ne pas se qualifier pour le second tour. Leendert de Voogd, le Pdg, précise toutefois que l’attaque des Champs-Elysées profitait vendredi 21 avril à François Fillon et à Marine Le Pen, en nette hausse par rapport aux jours précédents.

Quelle crédibilité ? Vigiglobe a correctement identifié les dynamiques portant à l’élection de Donald Trump aux Etats-Unis, à la victoire du Brexit au Royaume-Uni, de François Fillon à la primaire de la droite, et de Benoît Hamon à celle de la gauche.

| Pour aller plus loin, lire l’interview exclusive de Leendert de Voogd. Présidentielle : “Pourquoi Fillon pourrait se qualifier au second tour et pas Le Pen”

Predict My President : Le Pen et Fillon au second tour

Qu’est-ce que c’est ? Predict My President est un programme mené depuis plusieurs mois par cinq étudiants de l’école Télécom Paris tech pour l’hebdomadaire Le Point. L’objectif est de pallier les ” failles ” des sondages en remplaçant les enquêtes d’opinion par une analyse socio-économique des électeurs, couplée à une analyse de la popularité des candidats sur la Toile.

Quelle méthodologie ? Les élèves ont bâti un logiciel nourri à partir des données numériques issues du réseau social Twitter et des recherches des internautes sur Google, pour déceler la popularité des candidats et analyser le contenu des messages les concernant. Ces data sont croisées par des données socio-économiques remontant jusqu’à 1981 (taux de chômage par département, résultats des élections locales, etc.), issues des plateformes gouvernementales d’ open data et de l’Insee. Un algorithme pondère les différentes analyses et aboutit à des prédictions de vote. Ou quand le big data et l’analyse socio-économique remplacent les sondages.

Quel est le pronostic ? Le 19 avril, Predict My President voyait se profiler un duel entre Marine Le Pen (24,13%) et François Fillon (21,77%). Emmanuel Macron arriverait troisième avec 20,32%, suivi par Jean-Luc Mélenchon avec 18,66%.

Quelle crédibilité ? Verdict dimanche.

| Pour en savoir plus. Présidentielle : Le Pen et Fillon qualifiés pour le second tour ?

Et les sondages ?

Dans la dernière ligne droite, tous notent une progression de François Fillon, confirmant ainsi la dynamique relevée par les spécialistes du big data, mais pas suffisamment pour atteindre le second tour. Tous les instituts le donnent troisième derrière Emmanuel Macron et Marine Le Pen.

Voici les résultats des derniers sondages publiés le vendredi 21 avril:

Emmanuel Macron (24,5%) vs Marine Le Pen (23%). François Fillon et Jean-Luc Mélenchon sont tous les deux à 19%.

    BVA pour La Dépêche du Midi

Emmanuel Macron (24%) vs Marine Le Pen (23%). François Fillon et Jean-Luc Mélenchon sont tous les deux à 19%.

    OpinionWay-ORPI pour Les Echos et Radio Classique

Emmanuel Macron (23%) vs Marine Le Pen (22%). François Fillon est troisième avec 21%, Jean-Luc Mélenchon est quatrième avec 18%.

    Ifop-Fiducial pour Paris Match, CNews et Sud Radio

Emmanuel Macron (24,5%) vs Marine Le Pen (22,5%). François Fillon est troisième avec 19,5%, Jean-Luc Mélenchon est quatrième avec 18,5%.

    Elabe pour BFMTV et L’Express

Emmanuel Macron (24%) vs Marine Le Pen (21,5%). François Fillon est troisième avec 20%, Jean-Luc Mélenchon est quatrième avec 19,5%.

Browse

Article by channel:

Read more articles tagged: Big Data