Lorsque la quantité devient synonyme de qualité
Je suis un programmeur d’algorithmes pour les moteurs de recherche sur l’internet. J’ai aussi participé à quelques conceptions d’intelligence artificielle semblable au ChatGPT. Je réussis plutôt bien, je ne suis pas un expert, mais je suis assez bon dans ce que je fais. Il n’y a qu’un faible pourcentage de la population qui comprend vraiment la programmation et le fonctionnement d’un algorithme ou une IA, j’en fais partie. Je suis certainement nul pour bien d’autres domaines, mais dans celui-ci, j’ai fait mes preuves. J’ai aussi fait des erreurs.
J’ai un esprit cartésien, pour moi, un mensonge reste un mensonge, peu importe le nombre de fois qu’une personne le raconte. N’est-ce pas? La logique le veut, mais j’ai appris que la psychologie humaine n’y adhère pas totalement. Lorsque j’étais adolescent, avec des copains, nous avions fait une vidéo qui était devenue virale sur le web. C’était un aigle qui survolait un parc et qui enlevait un bébé dans son vol en piqué. L’effet était saisissant, malgré quelques défaillances mineures, plusieurs personnes l’ont vraiment cru. C’était tout au début des hypertrucages, de nos jours, il existe une panoplie d’outils informatiques sur l’internet pour en créer de façon bien plus réaliste.
J’ai conçu plusieurs programmes de recherche qui renvoient une liste de sites répondant à une demande. Un algorithme, ou maintenant une intelligence artificielle (IA), sélectionne les sujets pertinents reliés à la question et affiche par ordre décroissant les résultats. Sur quels critères se base-t-il? Les avis responsables et éclairés des experts en la matière? La présence des mots clés de l’interrogation formulée? Ou encore la popularité du sujet? Je considère ces trois aspects et parfois plusieurs autres, mais quel poids attribuer à chacun? Ici débute un calcul mathématique de multiplicateurs et d’addition pour livrer un score permettant de créer cette liste décroissante de pertinence. Mais ce top dix est-il crédible? Le sujet le plus adéquat, le plus exact et de meilleures qualités se retrouve-t-il en première position? D’un moteur de recherche à un autre cet ordre varie, comment peut-on avoir confiance? Quel est leur niveau de fiabilité? De quelle manière évalue-t-on leur performance et leur efficacité? Auprès des internautes, des spécialistes ou selon les critères des ingénieurs informatiques?
Pendant longtemps, j’ai réfléchi et j’ai suivi différents séminaires de perfectionnement afin de parfaire mon talent. J’ai tenté de trouver un moyen de reconnaître l’avis d’un expert parmi tous ceux émis par la population. Avec le web bombardé de milliers d’avis à tout instant, c’est comme chercher une aiguille dans une botte de foin. Un individu a aimé son expérience à un certain restaurant, il le mentionne sur son réseau social, ses amis émettent des commentaires positifs, il se forme un petit fan-club qui adore aussi l’endroit et ce dernier monte en popularité sur l’internet. Un moteur de recherche que j’ai conçu perçoit cet engouement pour ce restaurant, lui donne un score, l’affiche sur sa liste de recommandations, propulse sa renommée sur le web et il devient un endroit gastronomique prisé. Offre-t-il pour autant des plats savoureux de qualité? Rien ne le démontre mis à part sa popularité, la quantité de personnes qui ont aimé ce restaurant. La quantité devient synonyme de qualité.
Séparons alors le grain de l’ivraie, mais comment arriver à déceler les avis des experts? Est-ce celui qui n’émet que rarement de bonnes évaluations, qui juge sévèrement? Quels sont leurs critères, sur quelles bases se fondent-ils, de façon complète ou sur un seul aspect? Est-ce celui qui publie le plus de recommandations, le plus populaire auprès des auditeurs, qui fait consensus? Je dispose de certaines données: le nombre de clics, temps qu’un internaute passe sur une page web, le flux de circulation d’un site, les informations personnelles des utilisateurs. Mon algorithme peut attribuer une valeur d’intérêt à ces données, développer un profil pour ce promeneur de l’internet puis lui proposer des sujets similaires. Mais je ne peux pas percevoir sa sincérité, sa volonté, ni sa motivation; il n’existe pas de moyens pour récolter ces aspects afin de déterminer la qualité d’un avis.
J’étais plutôt fier d’avoir contribué à un site de recommandation de restaurants aux États-Unis. Quelques mois après son lancement, quelques confrères de travail ont remarqué que le programme ne présentait jamais d’endroits où la cuisine mexicaine était offerte. Pourtant, chaque grande ville possède au moins un restaurant mexicain, alors pourquoi n’était-il pas sur la liste? Nous avons découvert que le système avait commis une maladresse en liant la mauvaise presse au sujet de l’immigration mexicaine et sa cuisine. Aujourd’hui, je comprends qu’il existe plusieurs biais difficilement repérables causés par la logique de système, par les consignes des programmeurs, par leurs valeurs et par la qualité des données. Par exemple, un technicien en programmation pourrait considérer que seuls les hommes constituent une base de données pertinente, l’algorithme pourrait faire une distinction entre les termes masculins et féminins, une base de données alimentée que par des femmes représenterait mal les hommes. Tous ces biais sont parfois difficiles à contrôler et à identifier, il est même accepté d’avoir des discriminations positives dans certaines sociétés. Autre exemple: comment une IA de conduite automobile autonome peut-elle faire la distinction entre une grosse personne, une femme enceinte, un enfant, un chien ou un arbre s’il devait choisir d’éviter l’un ou l’autre et assurer la sécurité de ses passagers? Pour réussir, il faut l’alimenter d’une énorme quantité de données et de plusieurs possibilités différentes, le tout confirmé par des personnes qui ont leur propre système de valeurs et de perception. L’ordinateur a-t-il alors toujours la meilleure réponse logique, impartiale, équitable et stratégique?
Un jour, je me suis demandé si du miel se mariait bien avec un cornichon. Je l’ai essayé et malgré le dégoût de mes amis à cette proposition, j’ai trouvé la combinaison plutôt savoureuse. L’IA ne possède pas de papilles gustatives pour l’expérimenter et en tirer sa propre conclusion, elle se base sur des statistiques: celles qu’elle accumule par essai-erreur et celles qu’elle trouve à partir des bases de données sur l’internet. À l’origine, elle se réfère toujours à l’expérience humaine, elle ne peut pas s’y déroger afin de répondre aux questions. Elle peut suggérer par association de diverses sources d’information qu’il serait probable que j’aime du bacon agrémenté d’un coulis de sirop d’érable. Pour peindre un tableau, une IA pourrait être qualifiée de créatrice puisqu’elle essaie différentes combinaisons de formes et d’agencements de couleurs. Cependant, c’est le regard humain qui juge l’élégance et qui apprécie ces compositions; l’IA portera un commentaire basé sur l’ensemble de cette évaluation humaine.
J’ai réalisé depuis peu que je travaille à créer de puissants moteurs de recherche qui ne peuvent pas deviner, percevoir ou évaluer la pensée des personnes sur les réseaux sociaux. Ils ne peuvent pas déterminer la qualité, le raisonnement ou la justification des commentaires émis sur le web. Ils sont incapables de saisir cette partie intangible; il leur faut des données concrètes. Ils se rabattent avec force sur les chiffres et tentent par des calculs et des conditions complexes de transformer ces chiffres, des quantités, en qualité. Et alors les mensonges deviennent des vérités.