« L’analyse des tweets peut faire progresser la médecine »

analyse_tweets_medecine
Les milliards de données partagées sur les réseaux sociaux peuvent permettre de suivre le développement d’une épidémie ou de mieux comprendre le ressenti des patients. Marcel Salathé, professeur à l’Ecole polytechnique fédérale de Lausanne (EPFL), revient sur les enjeux de cette épidémiologie numérique.

Les milliards de données partagées sur les réseaux sociaux peuvent permettre de suivre le développement d’une épidémie ou de mieux comprendre le ressenti des patients. Marcel Salathé, professeur à l’Ecole polytechnique fédérale de Lausanne (EPFL), revient sur les enjeux de cette épidémiologie numérique.

Sur quels réseaux sociaux récoltez-vous des données de santé?

Principalement sur Twitter, car les données y sont publiques. Ce réseau a connu une croissance importante ces dernières années et totalise désormais plus de 300 millions d’utilisateurs. Cela donne des milliards de tweets à analyser… A côté de cela nous développons aussi des applications pour que les citoyens puissent volontairement y déposer leurs données de santé. Elles sont uniquement destinées à la recherche.

Comment triez-vous les données?

Cela dépend de la question de départ. Généralement, on travaille avec des mots-clés. Nous avons développé des algorithmes qui effectuent un premier tri. Le reste est ensuite fait manuellement. Nous avons par exemple mené une recherche sur les effets secondaires des traitements du VIH. On a commencé par avoir 30 millions de tweets. A la fin, seuls quelques milliers étaient pertinents pour nos recherches. Il s’agissait de personnes qui partageaient leur vécu et leurs sentiments en lien avec leur traitement.

Ces données publiées par des particuliers ont-elles une réelle valeur scientifique?

Avec une recherche classique, les données proviennent d’examens médicaux ou d’analyses biologiques. La démarche est certes scientifique, mais le fait de se trouver dans un cadre médical oriente les réponses des participants et peut induire des biais. Sur Twitter, les gens s’expriment librement. Ils ne savent pas que leurs propos seront analysés à des fins de recherche. Bien entendu, il y a beaucoup de «bruit» et de données inutilisables, comme des spams. Nous développons donc des méthodes pour extraire les données pertinentes de cette masse. Une fois ce travail effectué, ces données possèdent une vraie valeur scientifique: elles sont datées, géolocalisées et surtout, contiennent des informations qu’il n’est parfois pas possible –ou très difficile– d’obtenir avec un protocole de recherche classique.

Pouvez-vous donner des exemples de recherches effectuées sur la base de Twitter?

Certaines recherches visent à comprendre l’évolution d’épidémies comme la grippe. Twitter permet en effet de comprendre de manière fiable comment et où un virus se propage. Le cas échéant, cela peut aider à la mise en place de mesures préventives.

L’analyse des réseaux sociaux facilite la compréhension de ce que les gens pensent et font.

Des études ont par exemple été menées pour mieux comprendre l’expérience des patients à l’hôpital. De mon côté, je mène des recherches sur les croyances vis-à-vis des vaccins. En passant en revue des tweets, nous analysons quelles connaissances pseudo-scientifiques se diffusent, qui elles touchent et par quels moyens.

Quelles pourront être les retombées de cette utilisation des réseaux sociaux pour la médecine?

Je pense que l’analyse des réseaux sociaux peut faire progresser de nombreux domaines de la médecine. Nous avons développé des prototypes et des méthodes de tri de données efficaces durant les dix dernières années. Il reste maintenant à convaincre les gouvernements et les organisations internationales que cela peut concrètement leur apporter quelque chose. Pour l’instant, la plupart se montrent très intéressés, mais peu d’actions sont engagées. La science progresse souvent plus rapidement que la politique…

Le potentiel de cette technologie est particulièrement intéressant pour les pays en voie de développement, car l’utilisation des réseaux sociaux y connaît des progrès fulgurants. Et comme ces pays manquent d’infrastructures médicales et que seule une minorité de la population se rend chez le médecin, Twitter pourrait représenter une formidable source d’informations en cas d’épidémie.

Quelles sont les dérives possibles liées à l’analyse des données de santé issues des réseaux sociaux?

Le problème ne viendra pas des chercheurs à mon avis… Mais tout comme on peut analyser les réseaux sociaux dans le but d’améliorer la médecine, on peut aussi le faire pour divulguer de fausses rumeurs de santé, dont certaines peuvent faire beaucoup de tort, à l’image de celles qui concernent les vaccins. Ensuite, on peut être confronté à l’utilisation des données de santé par des compagnies privées, comme des assureurs, dans le but de classifier les individus. Une récente étude a montré que les photos publiées sur Instagram permettaient de diagnostiquer une dépression avec une précision de 70%, contre 40% pour les médecins. Selon les couleurs des photos que je poste, pourrais-je être identifié comme personne à risque pour la dépression et me voir refuser une police d’assurance? C’est problématique. Une régulation intelligente des données doit clairement être mise en place, d’autant plus lorsque celles-ci proviennent de prestataires dont le fonctionnement des algorithmes n’est pas transparent.

Newsletter

Inscrivez-vous pour recevoir les actualités de la plateforme SantéPerSo et être invité aux événements consacrés à la santé personnalisée.

Top