Big data
Défense de rêver le long des murs
Philippe Curval, Cette chère humanité, 1976
Vous êtes un excellent technicial de classe C, nous sommes très contents de votre travail. Nous sommes fiers de vous avoir engagé comme collaborateur. Continuez !
C’est ce qu’ils disent de moi, mes chefs. Chaque année je reçois la notation Bon travail et je reste toujours calé en classe C, les mêmes commentaires accompagnent la conclusion du process et j’ai fini par comprendre que monter en classe B relevait de la Mission Impossible.
Au début ce n’était pas difficile, la job de classe C était dans mes compétence ; il suffisait de produire une certaine quantité de travail, autant de data sets à traiter par trimestre, autant d’Issues à résoudre en respectant les délais de livraison et de rapports de synthèse pour les Comités. Chaque année les chefs ajoutent des objectifs d’ambition personnelle, de mesures de qualité comportementale : Respectez-bien les Codes de Conduite et la Culture de la Ville-Entreprise ! disent-ils, c’est important, le Client-Citoyen est au centre de nos attentions !, mais les Comités s’empilent et les règles de gouvernance deviennent illisibles. Le volume des data sets augmente, le nombre de problèmes DQ aussi et les délais se raccourcissent. Il parait que c’est la conséquence d’une loi d’airain économique, systémique, expliquent les consultants de la Rand Cognizant à grand renfort de schémas présentés lors de la Townhall trimestrielle. C’est la seule Loi visible. Parce que pour tout le reste…
Je ne me plains pas. Depuis que j’ai quitté les dortoirs de l’entrepôt de Neder le long du Ring pour un conapt de seize mètres carrés le long du Kanaal, je suis passé du côté des privilégiés. Bye bye la misère ! Bonjour le luxe ! Inouï ! Je reçois un salaire à date fixe, régulier, en bons euromarks du Marcom, un pass gratuit pour les transports dans toute l’agglomération bruzelloise, sauf la Cité interdite du Marcom bien entendu et – j’ai envie de pouffer de rire – un panier de légumes frais bio une fois par mois ! Ce qui est moins drôle c’est qu’il faut se rendre à la perma-ferme des Taxiarques en compagnie d’autres employés de la Rand pour récupérer son panier, car le but véritable de cette visite recommandée par les services d’hygiène mentale est d’effectuer un travail sur soi, collectif, entouré par des collègues, dans le respect de chacun, sous la supervision d’un système apprenant et bienveillant. Un moment pénible que chacun laisse vite de côté avant de retourner à son travail, qui dans son conapt perso (C++), qui dans une coloc (C#), ou, pour les technos de classe D et inférieures, dans un trou d’homme, mais tous connectés à l’Urb et content de leur classe, de leur rang, de leurs chefs.
Nous sommes des privilégiés je vous dis. Certes, la moitié de mon salaire modeste, fut-il garanti, passe dans le loyer du conapt, qui appartient faut-il le préciser à la ville-entreprise, la Rand Cognizant, ou Brüzel, c’est pareil, et cela, que je travaille trois heures quarante-huit ou quinze heures cinquante-deux par jour-nuit. Avec le conapt all inclusive dans le vieux Leyken, j’estime que c’est un deal honnête, L’autre moitié passe pour l’essentiel à subvenir aux besoins de mon frangin, le Gros Pitche, un ancien technicial de classe « C » déclassé ; ça me fout la trouille quand j’y pense. Mais je préfère éviter le sujet quand je vais retrouver le Pitche, dans sa crèche de la Cité Joyeuse. Je lui apporte mon panier bio. Sa meuf en bave à chaque fois. Ils tiennent absolument à me faire goûter une mixture qui sent le champignon et l’oignon, une infusion bonne pour l’âme qu’elle dit. Je ne m’attarde pas.
Ils le savent bien sûr, eux, les chefs. C’est peut-être pour cela qu’ils m’ont engagé, une question de quota à respecter, une expression vieillotte parlait d’un ascenseur social. C’est mon ex-partner qui m’a refilé le gout d’aller fouiller dans des books, des livres. Une bizarrerie, une névrose certainement. Je n’en parle pas aux collègues. Lire ! Dans des livres, tu veux dire ces objets en papier dont on a rempli des containers ? Ils prendraient la chose avec le sourire, des sous-entendus scabreux, lire est presque pornographique. Les chefs attendent peut-être que je fasse un pas de côté de la data, et vlan, je serais moi aussi déclassé, mis au rebut pour obsolescence du matériel humain. Vous comprenez alors qu’entre le loyer et le frangin, l’aîné, respect aux ainés, il me reste presque rien mais je suis devenu ascète, ermite, j’ai peu de besoins et n’aime pas la compagnie. Ma vie c’est mon boulot et vice-versa.
N’empêche, être bien coté, classe C et tout ça me laisse parfois un sale goût en bouche, comme lorsque je mange trop vite une crasse commandée via Go ! Miam TM, les moins chers du marché, aliments recyclés à partir des déchets domestiques, une belle application d’économie circulaire pour notre bonne Ville-Entreprise s’amuse à vidphoner notre Bourg-Bouffon en se prenant des selfies sur le pont Van Praet. À l’arrière-plan, les dômes du spatioport des Docks de Brüzel ruissellent de flammes sorties de la gueule du démon Ravana.
Quelque chose ne colle pas avec la data depuis quelque temps. Je m’explique, ça va être un peu techniek tekno, sans quoi je produis du vent et vous me prenez pour un courant d’air, après tout je n’ai pas ma certification de technicial classe C pour rien !
Ma job ? En principe : faire l’audit des systèmes… En pratique : coller des étiquettes sur des pix, des vids, du deep-dream, du fake, du texto, de la sim, de la double-sim, en clair, cryptée ou hashée, décomposer les flux, recomposer un linéage clean, en Esperanto, en norme ISO, CRISC et NSI, Marcom compliant, pour une data de qualité qui va alimenter les modèles. La tambouille de la data propre, bien ingérée, filtrée, réconciliée, labellisée, améliore la performance des automates d’apprentissage. Le but est qu’ils arrivent à se débrouiller sans avoir besoin d’un technicial de classe C lorsqu’ils quittent la couveuse, qu’on les lâche dans la place de Marché, qu’ils deviennent autonomes, qu’ils acquièrent une personnalité juridique. En principe. C’est le process intégratif des réseaux neuronaux convolutifs que n’importe quel tekno peut lire dans le Vapourware, avec un nuage de lait s’il-vous-plait.
Mais c’est quoi au juste « apprendre » pour un automate ? Moi je savais tout d’emblée : tu sélectionne une étiquette ici, tu la colles là , tu compares le résultat entre I/O et tu enregistres, puis tu passes à la séquence suivante. À longueur de jour-nuit. C’est un peu répétitif alors entre deux étapes du jeu « marche ou crève » je prends un book et je lis… La job se donne un air compliqué, mais c’est juste que du testing, nous cotons les automates sur leurs bonnes réponses, ils s’améliorent, on sélectionne un autre jeu de data et ça repart pour un tour. Mais le moteur des algos il fait quoi, lui ? C’est le domaine réservé aux data scientists, des mathématiciens bourrés de psychotropes qui travaillent en caisson, ce sont nos Hauts-Elfes et ce qu’ils produisent est beau et incompréhensible pour les technos des classes inférieures, sublime comme la musique des Ainurs et inaudible pour nos oreilles, et ils créent des mondes à partir d’équations différentielles, invisibles aux sens, peut-être les devine-t-on avec les yeux de l’esprit, pour ma part je n’y arrive pas, je n’ai pas l’imagination enflammée comme les drogués de la Zone derrière le Ring. J’ai deviné un jour que Gros Pitche avait goûté à la psylo et je crois que c’est à partir de ce moment-là qu’il a entamé sa dégringolade sociale, son retour à la norme dont il était sorti pour mieux y retomber après un séjour dans le domaine des privilégiés. Je m’égare. Lorsque les modèles prennent chair par contre, j’assiste à leur naissance, ils ont faim, un appétit énorme, une voracité prête à engloutir des hexabytes de data au plus profond du trou noir des algos. Et il en ressort parfois une lumière, une révélation, une corrélation que personne n’avait identifiée… Une belle lumière, mais ce que j’ai observé m’inquiète : des projecteurs se sont allumés dans la nuit.
Je ne devrais pas écrire cela, je devrais arrêter de lire des books tirés de quelques containers sauvés de la déchetterie par une bande d’activistes ; « lire » est un verbe qui sera bientôt supprimé dans la prochaine édition du Marcom Esperanto Dictionary. Je devrais être satisfait de qui je suis et m’en tenir là : me contenter de tester les cycles d’apprentissage des applications de la Rand Cognizant (gloire et prospérité au fondateur et à sa famille !), en conformité avec la régulation, juste un pion qui vit dans seize mètres carrés au cœur du Marcom.
Le Marcom… les Régulateurs… la Bureaucratie Céleste… les Jurisconsultes…
Ces mots tournent dans ma tête, je m’enfonce dans le fauteuil ergonomique dur-mou, à trois degrés de liberté prêté par la firme, face à la fenêtre de mon conapt du côté du Kanaal, c’est la nuit, les flammes des Docks brillent au loin, une intense circulation alternée le long de l’enceinte de l’ancien Domaine Royal, (propriété de la Rand Cognizant), je m’installe dans mon trône de technicial classe C face aux quadruple dispositif de pilotage de la data, écrans et casque, playlist Psybient, Psychill Mix aux écouteurs, je sirote une limonade au gingembre pour le prix de deux repas de Go ! Miam TM et je vole, je vole dans un nuage empoisonné par les fumées d’usines mortes depuis longtemps. Depuis quand vivons-nous dans un monde qui ressemble à des places abandonnées, à des dépotoirs pollués avec des tours-citadelles qui lancent leurs flèches vers un ciel noir ? J’ai ma théorie.
Cela a commencé le jour où il n’y a plus eu de lois écrites et de Parlement pour les valider. Un beau jour, selon l’expression consacrée, tout naturellement, comme si c’était l’aboutissement d’un processus naturel devant lequel tout le monde avait démissionné, Le Journal Officiel tel qu’on le connaissait fut remplacé par un site en continu qui déversait des milliers d’adaptations pour un Léviathan réglementaire, sous forme de cas d’utilisation, de scénarios, de scripts, de modèles algorithmiques, de règles de contrôle de qualité des données, de linéage. Le Droit était devenu du jour au lendemain entièrement, exclusivement algorithmique, à l’échelle de l’ensemble du Marcom et de son emprise juridique sur tous les secteurs de l’existence matérielle, immatérielle, organique, inorganique. Il y avait, il y a toujours une forte rationalité à l’œuvre dans cette transformation globale. Brüzel, le siège central du Marcom, réglemente un empire de 48 anciens états-nations devenus une multitude de districts de contrôles codés sur 32 bits. Comment faire pour s’y retrouver ? On ne sait pas ce qui passe à l’Est, je préfère ne pas y penser, le Sud est une passoire. Il y a des zones tampons un peu partout, à l’intérieur des villes, à l’intérieur des entreprises, des marches sur lesquelles patrouillent les Missi Dominici impériaux mandatés par Brüzel qui doit coordonner des millions de « lois », terme désuet, banni, en principe censuré, que j’utilise avec une sombre jouissance, dans les faits des millions de situations, de problèmes, d’Issues, avec lesquels on doit faire avec, se battre, se faire entendre, demander que justice soit faite… Les IA seules pouvaient nous tirer d’affaire, arbitrer rapidement une masse de données impossibles à gérer par des humains. De là est née la Bureaucratie Céleste et les anciens spécialistes du Droit sont devenus les Jurisconsultes de la machine, les experts de classe A de l’apprentissage automatique.
L’autre jour j’ai reçu via le feed du Journal Officiel, un nouveau test script à exécuter sur quelques gigatonnes de data brut en provenance du registre des affaires sociales. Il s’agissait d’une vérification de routine en post-production. Et je suis tombé sur une fameuse Issue… quoi, trois millions d’enfants pauvres au cœur du Marcom avaient été exclus de prestations sociales au nom d’une hyper-corrélation quadratique non validée ? On se foutait de qui ? Je n’ai beau être qu’un technicial de classe C, autant dire un moins que rien, un minus, comparé aux Jurisconsultes, mais j’ai un poste fixe et un salaire marginalement confortable comparé à l’Allocation Universelle. Je ne suis qu’un pion, mais mon job dans une annexe bancaire du Marcom consiste à faire tourner des scripts de conformité et à vérifier ce qui ne tourne pas rond. Et j’ai l’œil pour cela ! Mes chefs n’arrêtent pas de chanter mes louanges lors des évaluations annuelles. Je demeure collé à ma classe, okay, ça aussi c’est réglo, c’est explicable. Le but du jeu est d’atteindre 100 % de résultats effectifs et de les publier dans le Green Book mensuel du Marcom, un rapport de douze mille pages, je m’occupe d’une sous-sous-sous-section du chapitre Soc de la division Econom du livre Minint. C’est ma spécialité. Je suis expert en pas grand-chose comparé au tout mais cette expertise-là , je la possède à fond et je détecte l’anomalie, et là , c’en était une fameuse d’anomalie. Trois millions d’enfants ! Pauvres, certes, mais enfin, des enfants. Comme ceux du Pitche, mon frangin, trois qu’ils en avaient fait avec sa blonde qu’il adorait, et chez les pauvres on ne se posait pas trop de questions, les enfants venaient et s’en allaient de plus en plus tôt. La mortalité infantile était en progression constante dans tous les districts codés sur 32 bits, ça faisait un paquet d’enfants. Mais trois millions d’enfants qui n’allaient plus bénéficier d’aides sociales, cela voulait dire que la guerre chez les pauvres allait vite s’enflammer. Je zoomai sur les data de géolocalisation. Je devais m’y attendre, l’essentiel de l’anomalie était concentrée ici, à Brüzel. Un grand coup de balai était annoncé. Le Pitche serait pris dans la tourmente et la moitié de mon salaire ne suffirait plus à garantir la subsistance de sa famille.
Que faire ?
Je devais identifier ce qui n’avait pas tourné rond dans l’apprentissage du système autonome. C’était l’IA qui avait pris cette décision évidemment, passée inaperçue, noyée dans le flux en temps réel de la data-gouvernance. Mais une IA n’est jamais aussi bonne ou mauvaise que la qualité de la data qu’on lui a fourguée à la naissance. Je décidai de ne pas notifier tout de suite l’autorité compétente sous laquelle tombait la juridiction de l’IA. Je n’aurais probablement jamais obtenu de réponse, certainement pas en provenance d’un simple C d’un département obscur. Je décidai de ne pas en informer non plus ma hiérarchie. Qu’allaient-ils faire de l’info ? Rien évidemment car ils ne leur viendraient pas à l’esprit qu’un modèle « validé pour la production » ait pu commettre une aussi lourde erreur et ils n’allaient certainement pas engager leur responsabilité et leur crédit de Lead Expert pour défendre un cas qui selon toute apparence était conforme au process. Il fallait donc remonter en amont la chaîne décisionnelle, revenir aux data sets qui avaient conduit à l’apprentissage défaillant du système. C’était une requête difficile à justifier, mais pas impossible à obtenir.
J’ai fini par obtenir une copie du jeu de données d’apprentissage de l’IA sociale. Évidemment, cela signifie que quelqu’un maintenant est au courant quelque part que des gigas ont été copiés vers l’adresse réseau de mon combinat. J’ai fait passer la demande auprès de mon chef comme justification d’une « étude destinée à renforcer mon potentiel évolutif et alignée sur les valeurs de développement en co-learning des collaborateurs prônée par la directive Culture & Conformité de la Ville-Enterprise ». Rien à redire ! J’ai pu vérifier ce que je soupçonnais : la data avait été empoisonnée par des paramètres biaisés, très subtilement certes mais détectable à la loupe de mon inspection, c’était du hacking de haut-vol, mais qui signait une conduite intentionnelle malveillante menée par des humains. J’aurais dû en informer immédiatement le responsable des risques opérationnels.
Les tours de Brüzel éclairent la nuit. Des phares apaisants, des repères, une sécurité pour le voyageur. Du côté des Docks une nouvelle fusée est parée au décollage. C’est la navette ultra-rapide qui relie le cœur du Marcom aux autres villes-mondes. Je consulte la grille des vols. Celle-là part pour Mumbaï. Peut-être qu’une équipe de consultants de la Rand Cognizant est du voyage, retour au siège social de l’entreprise-monde d’un univers réduit à de la data. Les flux sonores du Psybient Psychill Mix me font du bien. J’ai l’impression de flotter au-dessus de mon fauteuil, d’avoir quitté mon corps, de passer la fenêtre et de voler à la surface du Kanaal vers le spatioport. J’aurais aimé pouvoir un jour m’envoler vers Mumbaï, rencontrer les dieux de la compagnie, me faire admettre dans leurs rangs, à titre de démon mineur, subalterne, de leur prouver que j’étais sorti de ma condition sociale, de mon rang inférieur. Mais les kshatryas nous ignorent superbement.
Il faudra que je demande au Gros Pitche de me fourguer une carte d’anciens chemins oubliés, la piste des Navajos, celle qui mène au Soleil, celle qui permet de pirater le cœur du système, car ce qui a été détruit par le poison dans la data peut être guéri par un antidote, il faut juste que j’apprenne comment injecter le contrepoison à la source, c’est un réglage de paramètres, je dois faire en sorte que l’équation soit rebalancée et relancer les algos décisionnels. La décision peut être effacée, les enfants pourraient être sauvés. J’ai juste besoin d’un peu de temps.
L’épée de la loi est à double tranchant.
Remerciements : à Philippe Curval pour l’utilisation du mot « Marcom », le Marché Commun (précurseur de l’Union Européenne), tel que l’imaginait l’auteur de Cette chère humanité en 1976, une vision dystopique de notre futur. Et à tous les chercheurs en machine learning et deep learning qui prennent au sérieux les questions de la sécurité et de la sûreté des intelligences artificielles.