#Covid-19 : l’#IA se heurte à un problème massif de données
Technologie : Les chercheurs ont rapidement rassemblé des combinaisons de réseaux neuronaux qui s’avèrent très prometteuses pour diagnostiquer le Covid-19 à partir de radiographies pulmonaires et de tomodensitométrie. Mais le manque de données entrave la capacité de nombreux efforts à aller de l’avant.
Malgré tous les efforts frénétiques déployés pour coordonner les activités de sauvetage dans le monde entier pendant la pandémie Covid-19, l’ère numérique se trouve entravée par un aspect très spécifique : l’information.
Des équipes de chercheurs en intelligence artificielle tentent de mettre à profit des décennies de technologie pour diagnostiquer et traiter la maladie, mais les données dont ils ont besoin pour développer leurs logiciels sont dispersées aux quatre coins du globe ce qui les rend pratiquement inaccessibles.
Le douloureux manque de données est évident dans un cas particulier d’utilisation de l’IA, le développement de tests de diagnostic pour Covid-19 basés sur les rayons X ou sur des scanners de « tomographie informatisée » des poumons.
Bien que les tests définitifs pour la maladie soient des tests génétiques, appelés « RT-PCR », ces tests sont notoirement rares dans de nombreuses régions du monde, y compris aux Etats-Unis. Les rayons X, en particulier, sont largement disponibles dans le monde entier et les résultats reviennent beaucoup plus rapidement que la RT-PCR. On pense généralement que les scanners CT sont plus « sensibles » que les RT-PCR, ce qui constitue un avantage potentiel de leur utilisation.
L’analyse des rayons X et des CT prend du temps, c’est pourquoi de nombreux chercheurs du monde entier ont mis en place ce que l’on appelle des réseaux neuronaux de deep learning qui peuvent calculer s’il y a des anomalies dans les scans.
L’idée est d’alléger le fardeau des radiologues soudainement inondés de patients atteints de Covid-19. Le triage des scanners comme une sore de premier passage peut donner lieu à une analyse préliminaire, et cela peut placer les cas prioritaires en tête du flux de travail d’un radiologue.
#Des projets prometteurs qui se heurtent à l’insuffisance des données
Des articles ont circulé décrivant les succès étonnants, en particulier en Chine, d’un certain nombre de projets de diagnostic de l’IA, dont le fabricant chinois de logiciels Infervision, la division santé de la compagnie d’assurance chinoise Ping An, le géant chinois de la recherche Alibaba et les startups technologiques chinoises Deepwise Technology et Iflytek. Les médias donnent l’impression que l’IA est une technologie miracle qui peut être mise en marche et qui permet d’établir des diagnostics.
La réalité est moins exaltante. Malgré quelques succès, de nombreux efforts se heurtent à des difficultés, la plus importante étant l’accès aux données. En particulier avec une nouvelle maladie telle que Covid-19, qui se distingue des autres infections pulmonaires, la présence de caractéristiques distinctives n’est pas toujours concluante. L’analyse doit être adaptée à cette nouvelle maladie.
« Nous voyons un grand potentiel dans cette technologie, mais leur déploiement réel est lent » a déclaré Wei Xu de l’Institut des sciences interdisciplinaires de l’information de l’Université de Tsinghua à Pékin, en Chine, à ZDNet. Wei Xu fait partie d’une équipe de plus de 30 chercheurs qui ont mis au point un système de deep learning pour lire les scanners CT qui a été déployé dans 16 hôpitaux en Chine, y compris à Wuhan, et qui a atteint un taux de 1 300 visionnages par jour.
Ce succès initial s’est heurté à la réalité qu’il peut être difficile d’aller de l’avant dans certains pays. La situation en Chine s’étant calmée, « nous sommes en train de déployer le système en Europe, mais le processus a été lent » a écrit Wei Xu.
#Un enjeu de partage de données
Le manque de données est aussi mis en avant par certains chercheurs. Dans un article publié le mois dernier, des chercheurs de l’OMS, de l’ONU Global Pulse et de l’Institut Mila de Montréal pour l’IA ont étudié le paysage des applications de l’IA, du diagnostic aux traitements potentiels, y compris les logiciels de radiographie et de tomodensitométrie. Les auteurs ont conclu que « le machine learning et l’IA peuvent soutenir la lutte contre Covid-19 dans un large éventail de domaines » ajoutant : « Cependant, nous constatons que très peu de systèmes examinés ont atteint leur maturité opérationnelle à ce stade ».
Interrogé sur les raisons pour lesquelles si peu de programmes ont atteint la maturité, Alexandra Luccioni, directrice des projets scientifiques à Mila a déclaré : « C’est une question de partage de données au niveau mondial ». « Actuellement, ce n’est pas le cas, il n’y a pas beaucoup de coopération mondiale autour du partage des données au niveau mondial. » Son avis faire échos aux opinions d’autres professionnels de la médecine et de l’informatique qui affirment qu’une sorte d’initiative « Big Data » est nécessaire pour donner aux chercheurs davantage de moyens de travailler.
Laissés à eux-mêmes, des chercheurs tels que Wei Xu de Tsinghua doivent s’occuper des questions de confidentialité des données. « Les différents pays ont des réglementations différentes sur la confidentialité des patients, même pour les ensembles de données anonymes, mais la formation d’un modèle d’IA nécessite de collecter beaucoup de données » a fait remarquer Wei Xu.
Sans aucun système global pour coordonner les choses, « nous travaillons sur des méthodes de traitement de données respectueuses de la vie privée (en utilisant des techniques de cryptographie) pour résoudre le problème. »
Source : ZDNet.com