Les mégadonnées ont une grande valeur socioéconomique et peuvent profiter à toute la société. Illustration: Benoît Gougeon. Depuis 2003, nous produisons plus de données en deux jours que ce qu'a fait l'humanité depuis ses débuts. Créées par une multitude innombrable d'organisations, ces données massives - big data - sont quasiment impossibles à traiter avec des outils classiques de gestion de base de données.
"Ces mégadonnées ont une grande valeur socioéconomique et peuvent profiter à toute la société : on considère même qu'elles seront le ravitaillement d'une économie du savoir, le nouveau pétrole du 21e siècle", affirme Valérie Bécaert, responsable de l'
Institut de valorisation des données. Mais quel lien y a-t-il entre la recherche en intelligence artificielle et celle sur les données massives ?
"Ce qui fait le pont, c'est l'apprentissage automatique, dont l'apprentissage profond", précise le professeur Andrea Lodi, titulaire de la Chaire d'excellence en recherche du Canada sur la science des données concernant la prise de décision en temps réel, qui regroupe des chercheurs de Polytechnique Montréal, l'Université de Montréal et HEC Montréal.
Avec cette chaire, on vise à mettre au point de nouvelles méthodes d'utilisation des mégadonnées, en recourant notamment à l'apprentissage profond, afin que l'ordinateur soit en mesure de prendre les meilleures décisions en temps réel.
"Le défi consiste à apprendre de ces données et à résoudre les problèmes qu'elles posent à l'aide de nouveaux algorithmes, ajoute M. Lodi. Pour y arriver, nous devons adopter une approche appliquée et être en relation avec ceux qui disposent de telles données comme les hôpitaux, les municipalités, les producteurs et distributeurs d'énergie, de même que plusieurs entreprises de haute technologie."
Des exemples d'applications futures pour le transport
Le transport devrait être l'un des grands secteurs qui bénéficieront du mariage entre l'intelligence artificielle et les mégadonnées.
"Il sera bientôt possible de mieux planifier la livraison de marchandises en optimisant le transport par camion, en traitant les données relatives aux routes que chacun des chauffeurs emprunte habituellement pour livrer tel ou tel type de marchandise afin de déterminer quels chemins il peut prendre et aussi de quelle façon l'intermodalité peut être utilisée", illustre Bernard Gendron, professeur et directeur du
Centre interuniversitaire de recherche sur les réseaux d'entreprise, la logistique et le transport (CIRRELT). Le trafic routier aux heures de pointe pourrait être allégé. "Les feux de circulation sont actuellement synchronisés en fonction de la circulation de proximité, mais, en utilisant les mégadonnées, nous pourrions modifier la synchronisation des feux sur l'ensemble du territoire en temps réel, dit Emma Frejinger, professeure et membre du CIRRELT. Même chose pour le transport intermodal et le covoiturage : il serait possible de savoir s'il y a un stationnement ou un vélo Bixi disponibles en ville, en temps réel, ou encore on pourrait faciliter le transport de marchandises en sachant que quelqu'un peut prendre mon colis dans son véhicule pour le transporter de Montréal à Québec par exemple."
Par ailleurs, plusieurs constructeurs automobiles se sont lancés dans la course au véhicule autoguidé, capable d'aller chercher seul un passager et de le mener à destination. "La cohabitation sur la route de ces voitures avec les autres nécessitera une période d'adaptation, mais on anticipe que l'introduction de véhicules autoguidés réduira le nombre d'accidents ainsi que la pollution, puisque grâce à leur système de communication en temps réel ils pourront s'organiser afin de désengorger les réseaux routiers", avance Mme Frejinger.
Faire voyager l'information... à l'énergie solaire
La foule de données à traiter et sa gestion requièrent des serveurs actuellement très énergivores. "On estime que la production de gaz à effet de serre liée au domaine du stockage et du traitement de l'information en informatique a dépassé celle de l'industrie de l'aviation", spécifie Valérie Bécaert, de l'Institut de valorisation des données, une initiative de l'Université de Montréal, Polytechnique Montréal et HEC Montréal qui réunit 900 chercheurs en recherche opérationnelle et en sciences des données sur le campus.
Ainsi, l'une des solutions sur laquelle des chercheurs planchent consiste à valider la capacité de transférer l'information contenue dans les serveurs du monde entier vers d'autres alimentés par énergie solaire.
On vise ni plus ni moins à faire voyager les mégadonnées autour de la terre en temps réel, au fur et à mesure que la journée avance (en fonction des périodes d'ensoleillement) afin de réduire la quantité d'énergie requise pour les héberger!