Comment l’IA et la science des données peuvent-elles aider à lutter contre le coronavirus ?

Disponible en English Français

Plus de 400 collaborateurs d’Ericsson se sont portés volontaires pour travailler sur le COVID-19 Open Research Dataset (CORD-19). L’objectif de ce challenge est de collecter et ordonner un ensemble de données pour aider à résoudre le problème que le monde entier se pose : le coronavirus. Découvrez-en plus sur notre travail.

Discussions vidéos avec des professionnels de la santé

Ce challenge repose sur un ensemble de données appelé CORD-19. Il contient des dizaines de milliers de documents de recherche sur le COVID-19. Il se développe rapidement, si vite que même le chercheur le plus expérimenté ne pourrait le lire et l’assimiler. L’objectif est de créer les outils pour aider les chercheurs en médecine à extraire les informations dont ils ont besoin, alors même que les informations, publications et recherches continuent d’affluer.

Le lundi 16 mars, aux Etats-Unis, la Maison Blanche, les National Institutes of Health et Georgetown University (entre autres) ont publié l’ensemble de données CORD-19 et lancé un appel à l’action.

En l’espace de quelques jours seulement, plus de 362 collaborateurs d’Ericsson se sont mobilisés et ont offert de participer. Parmi les volontaires, on retrouve des data scientists, des data engineers, des data visualizers, ainsi que des chefs de projets, des gestionnaires, des chefs d’entreprises et des rédacteurs.

La réponse à ce challenge est divisée en neuf tâches principales, chacune d’entre elles comprend de nombreuses tâches annexes. Tous les volontaires ont été répartis en petits groupes affectés à la réalisation de ces tâches annexes. Bien entendu, le travail réalisé est entièrement effectué à distance.

Ces neuf tâches principales consistent donc à répondre aux interrogations suivantes :

  • Que sait-on sur la transmission, l'incubation ?
  • Que savons-nous des facteurs de risque de la COVID-19 ?
  • Que savons-nous sur la génétique, l'origine et l'évolution du virus ?
  • Qu'est-ce qui a été publié concernant les considérations éthiques de la recherche ?
  • Que savons-nous de l'efficacité des interventions non pharmaceutiques ?
  • Que savons-nous des diagnostics et de la surveillance ?
  • Qu'est-ce qui a été publié sur les soins médicaux ?
  • Qu'a-t-on publié sur le partage de l'information et la collaboration intersectorielle ?
  • Que savons-nous des vaccins et des traitements ?

Nous avons rencontré quelques personnes qui se sont portées volontaires pour travailler sur quelques-unes de ces tâches. Ils nous en disent davantage sur l’objet de leurs travaux.

 

Que savons-nous sur la surveillance de la santé publique ?

 

 

Nikhil Korati Prasanna travaille chez GAIA en tant que data scientist. En général, son quotidien comprend la détection d'anomalies, la vision par ordinateur, les knowledge graphs et le machine learning du traitement du langage naturel. Avec son équipe, il aide à identifier les publications au sujet des diagnostics à partir de la surveillance de la santé publique.  Nikhil espère pouvoir prédire les résultats cliniques. L'équipe tente également d'extraire des données de la recherche pour déterminer l'ampleur de l'exposition actuelle afin d'orienter les recommandations politiques sur les mesures d'atténuation.

Plus précisément, ils construisent un modèle pour identifier les orientations et les lignes directrices nationales sur les meilleures pratiques à l'intention des États, par exemple comment les États pourraient tirer parti des universités et des laboratoires privés à des fins d'essai. L'équipe essaie également de comprendre ce que dit la littérature sur la façon de communiquer la situation aux responsables de la santé publique et au grand public.

Pour se faire, l'équipe de Nikhil travaille à la synthèse de textes afin de trouver des données pertinentes dans un grand nombre d'articles. Elle développe ensuite un modèle de classification pour prédire les résultats cliniques positifs ou négatifs sur la base de ce qui a été publié.

Les outils qu'ils développent fourniront des données actualisées, même si d'autres articles sont ajoutés à l'ensemble de données, notamment sur les différentes approches diagnostiques et la démographie touchée. Entre les mains des chercheurs médicaux et des responsables de la santé publique, Nikhil espère que le travail de son équipe débouchera sur des résultats cliniques plus positifs.

 

Que savons-nous à propos des médicaments développés pour lutter contre le coronavirus ?

 

 

Emmett Moore est développeur de logiciels chez Ericsson. Il dirige une équipe chargée de trouver des informations dans l'ensemble des données sur les vaccins et les thérapies, comme la compréhension de l'efficacité et des risques des médicaments développés pour combattre le virus.

Son équipe a commencé par réfléchir à un ensemble de mots-clés, de phrases et de sujets à utiliser comme base lorsqu'ils analysent les publications pour essayer de trouver quels articles sont pertinents pour les questions auxquelles ils tentent de répondre. « Comme très peu d'entre nous ont une formation en médecine ou en pharmacie, cela s'avère très intéressant. Par exemple, si nous essayons de trouver des articles sur les vaccins, quels mots ou phrases auraient tendance à apparaître ? Nous espérons que cela nous aidera à écarter tout document hors sujet et à obtenir un ensemble de données plus restreint », déclare Emmett.

En parallèle, des data visualizers réfléchissent à la meilleure façon de présenter les conclusions de l'équipe. Par exemple, ils peuvent utiliser des nuages de mots ou des résumés plus concis des documents pertinents pour démontrer les principales conclusions.

Emmett espère que la prestation de son équipe aidera les chercheurs médicaux qui se penchent sur le sujet du traitement et de la prévention du COVID-19. Cet ensemble de données contient des dizaines de milliers de documents en texte intégral et continue de s'accroître. Il est impossible pour une seule personne ou même un grand groupe de chercheurs d’en lire la totalité. Mais Emmett est optimiste et pense que les nouvelles technologies comme le machine learning peuvent être réellement bénéfiques pour la société.

 

Que disent les publications sur les soins médicaux et le COVID-19 ?

 

 

Becky Prince était une ancienne professeure d’anglais et d’écriture. Elle travaille désormais en tant que rédactrice technique. L’équipe de Becky a été assignée à la tâche n°8, qui consiste à explorer tous les documents publiés concernant les soins médicaux et le COVID-19.

Les data scientists et data engineers de son équipe génèrent actuellement des idées et testent divers algorithmes pour leur codage. Le travail de Becky consiste ensuite à documenter leurs conclusions. Les soumissions seront notées dans trois catégories : précision, documentation et présentation. Chaque catégorie a un maximum de cinq points. La documentation et la présentation constituent donc une partie importante de la soumission.

Becky espère que l’impact constitué par le travail de son équipe aidera les chercheurs à accéder plus rapidement et plus facilement aux données spécifiques aux soins médicaux dont ils ont besoin afin de lutter contre le COVID-19.

 

Comment pouvons-nous répondre à des questions comme « Quelles sont les périodes d’incubation ? » ou « A quel point le virus est-il contagieux ? »

 

Manjeet Attri travaille à Ottawa en tant que développeur. Il est diplômé d’un Master en sciences de l’université d’Alberta et a également travaillé pour Ericsson pendant deux ans en Inde. Au sein de son équipe, son travail consiste à tester, vérifier et dépanner les cas de test. Sa tâche consiste à trouver des réponses sur les périodes d'incubation, la durée de contagion des individus et le mode de transmission du virus. Son équipe commence à réduire l'énorme ensemble de données en choisissant les données les plus pertinentes, afin de les rendre compréhensibles. Manjeet est responsable du rapport final et a déjà préparé une ébauche de rapport. Ce plan donnera aux scientifiques et aux ingénieurs chargés des données un objectif clair à atteindre.

« Nous réarrangeons des milliers de documents de recherche pour aider les professionnels médicaux à trouver des réponses à leurs questions en l’espace de quelques secondes en jetant juste un coup d’œil à nos propres réponses », commente Manjeet.

 

C’est en donnant de l’espoir aux participants que nous remportons la victoire

J'ai été subjuguée par la participation et le travail que les volontaires ont déjà accompli. J'ai pensé que nous pourrions avoir 20, peut-être 30 volontaires. Au lieu de cela, nous en avons maintenant plus de 360. Nous nous efforçons de mettre en place une structure pour que chaque volontaire sache sur quoi il travaille et avec qui il travaille. Nous avons également essayé de créer des processus pour la circulation de l'information afin de partager les meilleures pratiques.

Si nous réussissons, nous aiderons les médecins et les praticiens de la santé publique à accéder à des informations essentielles. Cela pourrait contribuer à sauver des vies et à réduire l'impact de COVID-19 sur la société et nos communautés. Cela donne de l'espoir aux participants, ce qui est essentiel dans des moments comme celui-ci. Pour moi, c'est ainsi que nous gagnons ce concours.

 

Pour aller plus loin

Pour en savoir plus sur la réponse donnée par Ericsson sur la pandémie du coronavirus, vous pouvez lire l’article du blog rédigé par notre directeur général : La réponse d’Ericsson au coronavirus.

Nous continuerons également de partager avec vous des informations sur notre approche vis-à-vis du coronavirus et les mesures que nous prenons sur notre page FAQ coronavirus.

The Ericsson Blog

Like what you’re reading? Please sign up for email updates on your favorite topics.

Subscribe now

At the Ericsson Blog, we provide insight to make complex ideas on technology, innovation and business simple.