Tous les mécanismes étaient en place pour éviter la panne majeure du réseau de métro de Montréal le 7 juillet dernier. Mais c’est ceux-là même qui ont fait défaut, immobilisant du coup 35 000 usagers.
Le bogue d’un seul ordinateur « n’aurait pas dû causer une panne dans le métro », convient Dominique Lemay, directeur principal du métro à la Société de transport de Montréal (STM).
Depuis l’incident, son équipe s’affaire à disséquer un à un les événements qui ont mené à cette panne. Son origine informatique la rend unique.
Le samedi 7 juillet, en matinée, l’ensemble du réseau a été paralysé pendant près d’une heure.
Un des trente serveurs du métro a flanché. Les tonnes de données qu’il traitait – essentielles à la gestion des trains – sont redirigées vers un serveur de sauvegarde.
Jusque-là, aucune conséquence sur le service. Les mécanismes de protection du réseau informatique, que M. Lemay nomme « le système de redondance », font leur travail comme il se doit.
Points névralgiques
« Il y a toujours quelque chose pour prendre la relève aux endroits névralgiques en cas d’erreur informatique », assure M. Lemay. Le réseau de métro devrait ainsi être à l’abri de tout pépin informatique.
Toutes les données ont été redirigées vers le « système de redondance » le 7 juillet, sauf celles d’un seul ordinateur.
Son logiciel de gestion du métro n’a pas été correctement programmé. Il emmagasine les informations jusqu’à saturer.
« On perdait des informations vitales, entre autres sur la ventilation et les trains », raconte M. Lemay.
L’ordinateur « coupable » tombe en panne pour de bon. Il déclenche une réaction en chaîne qui affecte l’ensemble des 200 ordinateurs du parc informatique de la STM.
Tout le métro est verrouillé. Un redémarrage des ordinateurs est nécessaire pour que les trains fonctionnent de nouveau.
Pépins informatiques
Il ne faut pas se leurrer, croit M. Lemay. Personne n’est à l’abri d’accrocs de temps à autre lorsqu’il est question d’informatique.
« Si la relève est bien faite (par les mécanismes de redondance), les pépins occasionnels ont des conséquences presque nulles sur le service », précise-t-il.
Correctifs à apporter
Le bogue du logiciel de l’ordinateur fautif a été analysé. Le fournisseur a remis à la STM une mise à jour qui permettra de corriger le problème pour de bon, espère le directeur du métro.
Le « patch », explique-t-il, est actuellement testé en laboratoire par les équipes de la STM. Il devrait être installé au cours de la nuit prochaine, si tout va bien.