Tests Basés sur les Risques: Prioriser ce qu'il Faut Tester Quand On Ne Peut Pas Tout Tester

Le test basé sur les risques utilise une formule probabilité multipliée par impact pour allouer l'effort de test. Les zones à forte probabilité et fort impact reçoivent une couverture approfondie, tandis que les zones à faible risque reçoivent un minimum de tests ou aucun.

Pourquoi "tout tester" est une fiction

Imaginez un flux de paiement avec quatre champs de formulaire : nom, e-mail, numéro de carte de paiement, et adresse de livraison. Chaque champ a une poignée d'états valides et invalides. Les combinaisons d'entrées sur les quatre champs se comptent en milliers avant même d'avoir pris en compte les différences de navigateurs, les conditions réseau ou les états de session utilisateur. Ajoutez un champ de code promo et vous multipliez encore l'espace de test.

C'est l'explosion combinatoire, et elle rend les tests exhaustifs mathématiquement impossibles pour toute fonctionnalité non triviale. Le nombre de cas de test possibles croît de façon exponentielle à mesure que vous ajoutez des variables. Vous ne pouvez pas tous les tester. La question n'est jamais "avons-nous tout testé ?" La question est "avons-nous testé les bonnes choses ?"

Les rendements décroissants posent aussi problème. Vos dix premiers tests sur une nouvelle fonctionnalité détectent les bugs les plus évidents. Les dix suivants en trouvent quelques de plus. Au cinquantième test, vous générez des cas de test qui échouent rarement en pratique, avec des entrées que presque aucun utilisateur ne fournit jamais. Le temps que vous passez sur le cinquantième cas de test pourrait couvrir une autre zone à fort risque qui n'a aucun test.

Le temps est fini. Les sprints se terminent. Les releases partent. Vous avez besoin d'une façon d'allouer votre budget de test qui reflète réellement les dommages qu'une défaillance dans une zone donnée causerait.

Risque = probabilité × impact

Chaque zone d'un système porte un niveau de risque. Ce risque a deux composantes : quelle est la probabilité que quelque chose tourne mal ici, et à quel point ce serait grave si ça arrivait ?

La probabilité dépend de facteurs comme la complexité du code, les modifications récentes, le nombre de développeurs qui ont touché cette zone, la présence d'intégrations tierces, et la quantité de logique conditionnelle. Une page statique simple qui n'a pas été touchée depuis six mois a une faible probabilité d'échec. Un module de traitement de paiement nouvellement refactorisé, réécrit par deux développeurs en parallèle, a une probabilité élevée.

L'impact dépend de ce qui se casse si cette zone échoue. Un bouton de tri cassé est agaçant. Un bouton de checkout cassé coûte de l'argent à chaque seconde qu'il est en panne. Un bug d'exposition de données dans les profils utilisateur est un problème légal. L'impact correspond au risque métier : revenus, réputation, conformité, données utilisateur.

Multipliez mentalement ces deux éléments et vous obtenez un niveau de risque pour n'importe quelle zone. Une forte probabilité d'échec combinée à un fort impact signifie que ça reçoit votre attention la plus profonde. Une faible probabilité combinée à un faible impact signifie un smoke test et on passe.

La version pratique n'est pas une formule avec des chiffres précis. C'est une conversation et un jugement. "Si ça casse, que se passe-t-il ?" combiné à "Quelle est la probabilité que ça casse compte tenu de ce qu'on sait ?" vous donne assez pour prioriser.

L'évaluation des risques n'a pas besoin d'un tableur pour être utile. Même un classement mental rapide (critique, important, faible) vous donne une base de priorisation. L'objectif est d'arrêter de traiter toutes les zones de test comme égales quand elles ne le sont pas.

Identifier le risque : à qui demander et quoi demander

Les meilleures informations sur le risque ne viennent pas de regarder la fonctionnalité seule. Elles viennent des personnes qui savent ce qui est fragile, ce qui a changé, et ce qui a mal tourné avant.

Parlez au développeur qui a construit la fonctionnalité. Demandez où il est incertain. Les développeurs savent souvent exactement où vit la logique délicate : le cas limite qu'ils ont géré avec une solution de contournement, l'intégration qui a un problème de timeout, la validation dont ils n'étaient pas sûrs. Ils offrent rarement cette information spontanément, mais ils répondent directement si vous demandez.

Parlez au chef de produit ou au product owner. Demandez quels scénarios utilisateurs les rendent les plus nerveux. Les PMs savent souvent où se concentre le risque métier : le flux qui génère le plus de revenus, la fonctionnalité que les clients ont spécifiquement demandée et remarqueront si elle se comporte mal.

Regardez les tickets de support et les anciens rapports de bugs. Si une zone particulière a généré trois tickets de support au dernier trimestre, ça vous dit quelque chose. L'instabilité passée est l'un des meilleurs prédicteurs de l'instabilité future. Un bug tracker plein de problèmes liés au flux de paiement signifie que le flux de paiement reçoit une attention supplémentaire, même si les modifications du sprint actuel semblent mineures.

Regardez ce qui a changé. Le nouveau code a plus de bugs que l'ancien. Le code fortement modifié dans ce sprint est plus risqué que le code peu touché. Le diff vous dit où regarder.

Enfin, pensez aux intégrations. Tout endroit où deux systèmes communiquent est plus risqué que l'un ou l'autre système pris isolément. La jonction entre votre front-end et l'API de paiement. La transition entre votre service et le système de notification par e-mail. Les points d'intégration échouent de façons que les tests unitaires ne détectent jamais, parce que chaque côté se teste en isolation.

Construire une matrice de risques : l'exemple du flux de paiement

Prenez une fonctionnalité réaliste : un checkout e-commerce avec traitement de paiement. Voici comment construire une matrice de risques pour elle.

Commencez par lister les zones du flux : sélection de produit, mise à jour de quantité, application de coupon, saisie d'adresse, sélection du mode de paiement, saisie de carte, soumission de commande, e-mail de confirmation, création de l'enregistrement de commande, décrémentation d'inventaire.

Pour chaque zone, vous évaluez la probabilité et l'impact. La saisie de carte s'intègre avec un processeur de paiement tiers. L'intégration est complexe et les échecs ici perdent directement des revenus. Probabilité élevée, impact élevé : ça reçoit une couverture de tests scriptés complète plus des tests exploratoires. La soumission de commande lie tout le flux ensemble. Un échec ici signifie qu'aucune commande n'est passée. Même si la probabilité est modérée, l'impact est critique. La validation d'adresse est moins risquée. Sa logique est simple, elle n'a pas changé récemment, et un échec affiche juste un message d'erreur à l'utilisateur. Priorité plus faible.

La matrice pourrait ressembler à ceci en pratique :

|---|---|---|---|

La matrice n'a pas besoin d'être exactement ce tableau. Ça peut être un document simple, une page Confluence, un tableau Notion. Le format compte moins que l'acte de rendre ces jugements explicites et visibles, pour que toute l'équipe travaille à partir de la même compréhension de ce qui est à enjeux élevés.

Construisez votre matrice de risques avant que les tests du sprint commencent, pas après. Une fois en cours d'exécution, il y a une pression pour tester ce qui est devant vous. La matrice vous donne une structure de priorisation sur laquelle vous appuyer quand le temps est court.

Allouer la couverture de tests par niveau de risque

Une fois que vous avez une matrice de risques, les décisions de couverture suivent naturellement. Les zones à fort risque reçoivent une couverture en couches : cas de test scriptés pour les scénarios connus, régression automatisée pour l'exécution répétée, et sessions exploratoires pour trouver ce que les scripts ont manqué. Les zones à faible risque reçoivent un traitement plus léger.

Pour l'exemple du flux de paiement, l'intégration de traitement de carte reçoit des tests scriptés pour le chemin nominal (carte valide, charge réussie). Elle couvre aussi les chemins d'erreur (carte refusée, carte expirée, fonds insuffisants, CVV invalide) et les cas limites (cartes avec des codes pays spécifiques, cartes qui déclenchent des vérifications anti-fraude). Puis une session exploratoire axée sur la gestion d'état. Que se passe-t-il si l'utilisateur soumet le formulaire deux fois ? Et si le réseau tombe pendant l'appel API ? Et si la réponse est retardée de dix secondes ?

Le champ de validation d'adresse reçoit un smoke test : saisir une adresse valide, confirmer qu'elle est sauvegardée. C'est tout. Si ça casse, l'impact est récupérable : l'utilisateur voit une erreur et réessaie. Ça ne justifie pas le même investissement.

Cette allocation de couverture est la sortie pratique du test basé sur les risques. Vous ne coupez pas le travail arbitrairement ; vous êtes explicite sur là où la profondeur est justifiée et où la largeur suffit.

Le même principe s'applique aux suites de régression. Tous les cas de test n'ont pas besoin de s'exécuter à chaque sprint. Les flux à fort risque s'exécutent à chaque sprint, ou à chaque build si vous avez l'automatisation. Les flux à risque moyen s'exécutent à chaque sprint. Les flux à faible risque peuvent tourner ou s'exécuter uniquement quand le code pertinent a changé.

Communiquer les décisions de risque aux parties prenantes

Le test basé sur les risques nécessite de l'adhésion, parce qu'il signifie décider explicitement de ne pas tester certaines choses en profondeur. Cette décision doit être visible et documentée, pas invisible.

L'outil pratique pour ça est un registre de risques ou un rapport de couverture. Pas besoin d'être élaboré. L'essentiel : ce que vous avez testé, ce que vous n'avez pas testé, et pourquoi. "Nous n'avons pas exécuté de régression complète sur le module de validation d'adresse ce sprint parce qu'il n'y avait pas de modifications de code et que la zone n'a pas d'historique d'échecs. Risque accepté." Cette phrase, dans un résumé de test de sprint, est ce qui vous protège de la question "pourquoi n'avez-vous pas détecté ça ?" quand quelque chose à faible risque finit par échouer.

Un rapport de couverture sert un objectif différent : il montre aux parties prenantes où votre test était concentré. Si un VP demande si vous avez testé le flux de paiement avant la release Black Friday, vous voulez pouvoir pointer vers un document montrant une couverture P1 avec des tests scriptés, de l'automatisation et une session exploratoire, pas donner une réponse verbale de mémoire.

Les décisions de risque prises explicitement et documentées créent de la responsabilité sans culpabilité. Vous avez fait un jugement basé sur les informations disponibles. Si le jugement s'avère erroné parce qu'une zone à faible risque a échoué de façon inattendue, vous revisitez la matrice et mettez à jour votre évaluation. Ce n'est pas un échec du processus ; c'est le processus qui fonctionne comme prévu.

Test basé sur les risques dans les sprints Agile

En Agile, le risque n'est pas statique. Chaque sprint apporte du nouveau code, de nouvelles fonctionnalités et de nouvelles informations sur ce qui est fragile. Une évaluation des risques valide il y a trois sprints peut être complètement fausse aujourd'hui si le module de paiement a été réécrit.

La discipline est de réévaluer les risques au début de chaque sprint, dans le cadre du sprint planning ou du lancement des tests. Regardez ce qui a changé. Demandez aux développeurs ce qui les rend incertains. Vérifiez le diff. Mettez à jour la matrice. Ça prend quinze minutes si vous le faites systématiquement, et ça maintient vos priorités de test actuelles plutôt que de dériver vers l'habitude.

Le backlog de sprint lui-même donne des signaux de risque. Les stories avec de grandes estimations, les stories qui touchent des intégrations, les stories qui ont été débattues en refinement : ce sont des candidats à une classification de risque plus élevée. Une story qui a traversé le refinement avec une estimation de deux points d'un développeur qui maîtrise ce code est probablement moins risquée. Une story de six points ayant nécessité trois sessions de refinement pour être délimitée porte plus d'incertitude.

La qualité des critères d'acceptation est un autre signal. Quand les critères d'acceptation sont détaillés et spécifiques, le comportement attendu de la fonctionnalité est bien compris. Quand ils sont vagues (ex. "l'utilisateur peut gérer ses paramètres de profil"), l'ambiguïté augmente. Des cas limites restent non pensés, ce qui signifie généralement un risque plus élevé.

L'objectif en Agile n'est pas de construire une matrice de risques parfaite une fois pour toutes. C'est d'avoir une image de risque légère et révisable au début de chaque sprint. Avec le temps, ça devient rapide. Vous développez une intuition pour là où le risque se concentre dans votre produit spécifique. L'évaluation formelle devient plus rapide parce que vous mettez à jour une image familière plutôt qu'en construire une depuis zéro.

Comment appliquer ça dès lundi matin

Pas d'outil nouveau ni de nouveau processus nécessaire pour commencer. Voici ce que vous pouvez faire dans votre prochain sprint.

Avant de commencer à tester une nouvelle fonctionnalité, passez dix minutes à noter les zones de cette fonctionnalité et à les classer en risque élevé, moyen ou faible. Utilisez deux questions : "À quel point cette zone est-elle complexe ou incertaine ?" et "Qu'est-ce qui casse dans le business si cette zone échoue ?" Ce classement est votre matrice de risques.

Allouez votre temps avant de commencer à exécuter. Si vous avez huit heures pour une fonctionnalité, décidez à l'avance : quatre heures sur le flux de paiement (scriptés et exploratoires), deux heures sur la validation de formulaire (scriptés). Ajoutez une heure sur l'écran de succès (smoke) et une heure pour la documentation et les cas limites. Cette allocation, notée, rend la décision de risque explicite.

Posez une question directe à un développeur avant que les tests commencent : "Sur quoi de cette fonctionnalité es-tu le plus incertain ?" Notez la réponse et ajoutez-la à votre évaluation des risques. Cette seule habitude détecte plus de bugs que de nombreuses techniques de test, parce que les développeurs savent souvent exactement où sont enterrés les cadavres.

À la fin du sprint, rédigez un paragraphe dans votre résumé de test sur ce que vous avez testé et ce que vous n'avez pas testé. Gardez-le dans un emplacement partagé. Sur trois sprints, vous aurez un historique de risques qui vous dit quelles zones ont été constamment légères en couverture, et lesquelles peuvent être en retard pour un examen plus approfondi.

Le test basé sur les risques n'est pas un framework qu'on implémente une fois. C'est une habitude de penser au test comme un problème d'allocation de ressources, pas un exercice de cases à cocher. L'habitude s'apprend. Elle produit des résultats visibles : moins de surprises en production et des releases plus confiantes. La pratique de test évolue avec un produit en croissance plutôt que de s'effondrer sous son propre poids.

Pourquoi "tout tester" est une fiction

Risque = probabilité × impact

Identifier le risque : à qui demander et quoi demander

Construire une matrice de risques : l'exemple du flux de paiement

Allouer la couverture de tests par niveau de risque

Communiquer les décisions de risque aux parties prenantes

Test basé sur les risques dans les sprints Agile

Comment appliquer ça dès lundi matin

Continue reading