Retour au numéro
Vue {count_0} fois
juillet 2018

Voyage au pays de l’intelligence artificielle : quelques pistes pour la France

Un voyage d’études a été organisé dans la baie de San Francisco sur le thème de l’intelligence artificielle (IA). Un écosystème unique d’entreprises et d’universités est mobilisé sur ce sujet et l’IA est d’ores et déjà utilisée dans de nombreux domaines d’application. En comparaison, la société française semble en retard sur les deux actifs stratégiques de l’IA que sont les données et l’attractivité des talents.

Une quinzaine d’entreprises et d’universités1 ont été visitées par la promotion 2017 du Corps des mines sur le thème de « l’intelligence artificielle », ce terme vague et à la mode qui rassemble l’ensemble des techniques permettant de prendre (ou de suggérer) des décisions de façon automatisée. Ces techniques, apparues dans les années 80, connaissent un regain d’intérêt grâce à la mise à disposition de grandes quantités de données, de progrès dans les capacités de calcul et de nouveaux champs d’application.

San Francisco est la capitale de l’intelligence artificielle pour les États-Unis, et l’Europe mais pas pour la Chine

En arrivant à San Francisco, même les affiches publicitaires visibles depuis l’autoroute parlent d’intelligence artificielle. Le sujet est omniprésent dans les discours des entreprises, dans les choix et les montants engagés par les investisseurs ou encore dans les axes de recherche des universités Berkeley et Stanford.

Pourtant, au contact de ses praticiens, on constate que les enjeux de l’IA ne sont pas consensuels. Les universités et certaines entreprises mobilisent ces technologies à des fins qu’elles espèrent socialement utiles, comme l’exploration sous-marine par un robot conçu dans un laboratoire de Stanford, l’épidémiologie et la biostatistique grâce à des algorithmes à l’université publique de Berkeley, ou la lutte contre le cancer chez Genentech. Pour leur part, les GAFA et les investisseurs cherchent plutôt à montrer l’étendue des performances théoriques (génération automatique de musique, reconnaissance de dessins, prédictions, etc.) et leur capacité à incorporer des nouvelles fonctions reposant sur l’IA dans leurs produits et services.

Pour tous les acteurs, la compétition sur la recherche constitue toutefois l’échelle d’évaluation commune : le nombre de doctorants (PhD), la participation à des conférences de premier plan ou la publication d’articles de recherche sont autant d’indicateurs que chacun scrute et valorise. Google et Facebook ont d’ailleurs créé des centres de recherche « académique » sur l’intelligence artificielle avec l’objectif d’y attirer les meilleurs éléments, au grand dam des institutions universitaires : ces chercheurs ont la possibilité de publier leurs résultats et d’étudier des applications plus ou moins lointaines du cœur d’activité du reste de l’entreprise.

Au-delà de la recherche, toutes ces entreprises, spécialisées ou non dans les technologies numériques, revendiquent l’utilisation de « l’intelligence artificielle » et de ses briques techniques les plus courantes (machine learning, A/B testing, etc.). Elles intègrent généralement, et de manière beaucoup plus systématique qu’en France, les experts « data » ou « IA » à tous les niveaux de l’organisation et notamment au sein des équipes de produits. Des solutions émergent pour proposer de l’IA « clé en main » aux entreprises qui veulent se mettre à niveau, à l’image de la start-up Databricks, fondée par deux Français à San Francisco pour donner accès immédiatement à des briques d’analyse de données et de machine learning.

Cette culture généralisée de l’IA et de la data offre aux innovateurs un écosystème unique au monde autour de ces technologies, à partir duquel chaque entreprise peut espérer rayonner sur les États-Unis mais aussi sur l’Europe et l’Occident en général. Beaucoup de Français que nous avons rencontrés pendant ce déplacement n’envisagent pas leur aventure entrepreneuriale ailleurs que dans cette région, y compris pour des applications agricoles, comme Farmwise, qui développe un robot de désherbage agricole et écologique fondé sur l’intelligence artificielle, en partenariat avec des producteurs californiens.

Pour ces acteurs, l’Europe est à portée de main et sa conquête est la suite logique d’un succès américain. L’hétérogénéité du marché européen, notamment du point de vue linguistique, est souvent citée comme le premier frein pour y lancer les premiers investissements et créer son entreprise, avant les considérations financières. Il est frappant de constater à l’inverse que la Chine est inatteignable : contrairement à l’Europe, les entreprises américaines ont renoncé à un marché chinois protectionniste et comprenant des champions nationaux : « Avec la Chine, c’est soit là-bas, soit ici, mais pas les deux ».

Enfin, les questions éthiques liées à l’utilisation de l’intelligence artificielle nous ont semblé finalement peu traitées, hormis la question de “l’explicabilité” des algorithmes, problématique à laquelle la plupart de ces sociétés sont confrontées.

Le terme « intelligence » surestime les performances des algorithmes actuels

Les algorithmes utilisés par la plupart des applications relèvent en réalité du domaine de l’optimisation, des régressions statistiques ou des réseaux de neurones (machine learning) : ils ne sont pas « intelligents » – au sens de l’intelligence humaine – mais sont capables de s’auto-configurer selon des données d’apprentissage. Ainsi, selon l’ensemble de données utilisé lors de l’entraînement, un même algorithme peut produire des modèles aux applications très différentes. Dans la conférence de clôture du déplacement, Michael Jordan, professeur à Berkeley et qualifié en 2016 par la revue Science comme le scientifique le plus influent du monde en informatique, a ainsi exigé que l’intégralité de la conférence se déroule sans mentionner les termes « intelligence artificielle » et « machine learning ».

À l’heure actuelle, c’est lorsque ces techniques sont utilisées dans des environnements bien contrôlés, tels que le jeu de Go ou les interactions web, qu’elles produisent des résultats remarquables. Le passage à des situations « réelles », qui représentent nécessairement une plus grande variabilité, fait apparaître des difficultés encore mal gérées et des résultats moins probants. Néanmoins, c’est sur ce type d’applications que réside la part la plus importante de leur potentiel… et que se concentrent la plupart des fantasmes.

En biologie, les chercheurs tentent ainsi de combiner données génétiques du patient et efficacité de certains traitements pour proposer des protocoles voire des médicaments personnalisés. La combinatoire à maîtriser est sans commune mesure avec celle du jeu de Go et les interactions biologiques sont bien plus complexes que la succession de clics dans un navigateur web. Il est clair que c’est dans ce type de domaines que le potentiel de progrès et, au cas d’espèce, d’amélioration des soins est fantastique mais les résultats actuels restent encore loin des espoirs.

Les enjeux de l’IA se situent dans ses applications et sur les données associées

Tous nos interlocuteurs ont souligné l’importance des données pour adapter les algorithmes aux applications concrètes. Plusieurs acteurs ont affirmé que l’accès à des données spécifiques ou « rares », comme les données génétiques, les essais cliniques ou les données clients, constitue un actif plus stratégique que l’accès à des algorithmes performants, souvent disponibles librement en open source (Tensorflow par exemple). De même, les performances les plus impressionnantes, chez Facebook ou Google, sont permises par l’accès à des quantités inégalées de données issues des réseaux sociaux ou des recherches en ligne que d’autres entreprises semblent très loin de pouvoir constituer à court terme, à cause de la fragmentation de leur « héritage » informatique.

Là encore, selon le type d’application, les données sont plus ou moins faciles à gérer. Dans le domaine de la santé par exemple, il faut déjà identifier quelles grandeurs (antécédents médicaux, gènes, taux hormonaux, clichés d’imagerie médicale, etc.) peuvent être pertinentes dans la recherche de corrélations avec des pathologies avant de les mesurer de manière systématique sur de nombreux patients pour créer la base nécessaire à l’apprentissage ! On est loin du pixel espion inséré sur un site web.

À notre surprise, le règlement général sur les données personnelles (GDPR) a été paradoxalement peu mentionné, l’Europe apparaissant comme un territoire naturel et directement accessible depuis les États-Unis, contrairement à la Chine.

Quelles leçons pour la France ?

Ces quelques jours passés dans l’écosystème de la baie de San Francisco ont suscité chez nous beaucoup de questionnements, notamment concernant la prise en compte des enjeux de l’intelligence artificielle par la France et l’Europe. Nous proposons ici modestement quelques pistes qui nous semblent importantes d’être creusées et analysées en profondeur.

En matière de stratégie industrielle, les actions doivent se concentrer sur les deux actifs rares de l’IA : les compétences et les données. De ce point de vue, deux voies principales doivent être explorées. D’une part, il s’agit de définir une politique d’attractivité des grands centres de R&D des entreprises mondiales pour faire de Paris un centre de référence pour l’intelligence artificielle. D’autre part, il serait bénéfique que des investissements importants dans des projets d’IA soient réalisés par les entreprises françaises, notamment en termes de recrutement, de mise à disposition et d’utilisation de données dans l’ensemble des secteurs d’activité.

S’agissant des entreprises françaises, il est de leur responsabilité de prendre les décisions adéquates et proportionnées pour prendre en compte les opportunités de l’intelligence artificielle. En particulier, sur les formes « mûres » d’IA, les entreprises ne devraient pas avoir besoin de subventions publiques pour déclencher des investissements importants. Néanmoins, l’État pourrait initier le mouvement en demandant aux entreprises où il est actionnaire de préparer un plan stratégique associé à des investissements et des partenariats (inter-entreprises ou académiques) dans le domaine.

L’État et l’administration doivent utiliser tout le potentiel de l’intelligence artificielle pour leurs besoins propres. Ils’agit de mobiliser ses moyens pour accroître les usages et les opportunités. Cesservices d’intelligence artificielle doivent être utilisés pour améliorer l’action publique. Des projets ciblés et à effets rapides pourraient être rapidement lancés avec le concours du monde de la recherche, en lançant par exemple un programme de thèses en IA dans l’administration et une réflexion sur le rôle des corps techniques de l’État. Par ailleurs, l’État pourrait organiser l’accès à de grandes bases de données d’intérêt général, rassemblant données publiques et données d’entreprises privées, afin de faciliter la création de services les utilisant.

En matière d’attractivité de la recherche, il semble difficile de pouvoir faire concurrence financièrement aux GAFA mais des programmes spécifiques pour attirer certains chercheurs, y compris ceux installés à San Francisco, pourraient être mis en place : par exemple, viser un objectif de quelques dizaines de bourses type ERC2 . Par ailleurs, il faut être vigilant sur les effets pervers sur la recherche publique de l’implantation des centres de recherche de Facebook et Google en France. L’investissement supplémentaire de Facebook de 10 millions d’euros dans FAIR à Paris ou l’annonce de Google de l’installation d’un centre Google Brain à Paris ne correspondent pas à des « grands centres de R&D »3 alors même que cela participe à assécher le marché des compétences dont d’autres entreprises ont besoin.

Enfin, le développement de l’intelligence artificielle pose des questions de souveraineté qui ne doivent pas être négligées : en particulier, l’entraînement des algorithmes outre Atlantique par des données issues du comportement des citoyens européens pose question. C’est pourquoi le sujet de la localisation des données, notamment personnelles, des citoyens français et européens nous semble pouvoir être examiné pour redonner à l’Europe un poids en la matière ; la réaction des entreprises américaines suite à l’entrée en vigueur du règlement GDPR (mai 2018) devra être analysée de façon approfondie pour juger si l’Europe peut reprendre la main sur ces sujets émergents.

L’intelligence artificielle pose également des questions de sécurité, dont nous ne sommes qu’aux prémisses4 ainsi que des questions de légalité importantes, notamment quand les algorithmes ont vocation à prendre des décisions sans intervention humaine directe. Des analyses complémentaires sur ces deux sujets pourraient être menées par les acteurs français et notamment l’ANSSI, la CNIL et la DINSIC. Enfin, la question de la prise en compte des enjeux éthiques semble pouvoir différencier l’Europe à condition que les dispositions contraignantes éventuelles qui y seront associées soient imposées à tous les acteurs, pour ne pas pénaliser uniquement les entreprises européennes. ■

1 L’atelier BNP Paribas, Bootstraps Lab, Compliance.ai, Université de stanford, Databricks, adynxx, FarmWise, Facebook, genentech, google Brain, A3 Labs (airbus), Bay Labs, affirm, Université de Berkeley, salesforce.
2 Mesure proposée dans le cadre de France IA en mars 2017 et mise en œuvre pour les chercheurs en environnement dans l’initiative “Make our planet great again”.
3 Cela représente moins de 5% du budget de ces entreprises dans le domaine.
4 Google Brain a souligné l’émergence de la question de la fraude aux algorithmes d’apprentissage automatique comme nouveau champ de recherche.

 

Auteurs

Articles du numéro

Commentaires

Aucun commentaire

Vous devez être connecté pour laisser un commentaire. Connectez-vous.