Тестирование на основе рисков: как расставить приоритеты, когда нельзя протестировать всё

Форма чекаута с четырьмя полями (имя, email, номер карты, адрес доставки) имеет тысячи возможных комбинаций ввода ещё до того как учтены различия браузеров или сетевые условия. Исчерпывающее тестирование математически невозможно на любой реальной фиче. Риск-ориентированное тестирование решает это через формулу "вероятность × влияние": статья разбирает как оценивать риск для любой области приложения, как строить матрицу которую команда использует в спринт-планировании, и как корректировать покрытие когда приоритеты меняются в середине спринта.

Почему "тестировать всё" нереально

Представь checkout flow с четырьмя полями формы: имя, email, номер платёжной карты, адрес доставки. У каждого поля несколько валидных и невалидных состояний. Комбинации входных данных по всем четырём полям измеряются тысячами до того как учтены различия браузеров, сетевые условия или состояния пользовательской сессии. Добавь поле промокода и тестовое пространство умножится снова.

Это комбинаторный взрыв, и он делает исчерпывающее тестирование математически невозможным на любой нетривиальной фиче. Количество возможных тест-кейсов растёт экспоненциально при добавлении переменных. Протестировать всё нельзя. Вопрос никогда не "протестировали ли мы всё?". Вопрос: "протестировали ли мы правильные вещи?"

Есть и проблема убывающей отдачи. Первые десять тестов новой фичи ловят самые очевидные баги. Следующие десять ловят ещё несколько. К пятидесятому тесту генерируются тест-кейсы которые почти никогда не падают на практике, против входных данных которые почти ни один пользователь никогда не вводит. Время потраченное на пятидесятый тест-кейс можно было потратить на другую высокорискованную область у которой ноль тестов.

Время конечно. Спринты заканчиваются. Релизы выходят. Нужен способ распределить тест-бюджет отражающий насколько серьёзный ущерб реально причинит сбой в той или иной области.

Риск = вероятность × влияние

Каждая область системы несёт уровень риска. У него два компонента: насколько вероятно что-то пойдёт не так здесь, и насколько плохо будет если это произойдёт?

Вероятность зависит от таких факторов как сложность кода, недавние изменения, сколько разработчиков касалось этой области, участвуют ли сторонние интеграции, и сколько задействовано условной логики. Простая статическая страница которую не трогали полгода имеет низкую вероятность сбоя. Недавно рефакторизованный модуль обработки платежей переписанный двумя разработчиками параллельно имеет высокую.

Влияние зависит от того что сломается если эта область отказывает. Сломанная сортировка раздражает. Сломанная кнопка чекаута стоит денег каждую секунду простоя. Баг утечки данных в профилях пользователей: юридическая проблема. Влияние отображается на бизнес-риск: выручка, репутация, соответствие требованиям, данные пользователей.

Перемножь это мысленно и получишь уровень риска для любой данной области. Высокая вероятность сбоя плюс высокое влияние: это получает самое пристальное внимание. Низкая вероятность плюс низкое влияние: smoke-тест и дальше.

Практическая версия не предполагает формулу с точными числами. Это разговор и суждение. "Что происходит если это сломается?" плюс "Насколько вероятно что это сломается исходя из того что мы знаем?" Этого достаточно для приоритизации.

Оценка риска не требует таблицы чтобы быть полезной. Даже быстрый мысленный ранжинг (критично, важно, низко) даёт основу для приоритизации. Цель: перестать относиться ко всем областям тестирования как равным когда они таковыми не являются.

Выявление риска: кого спрашивать и о чём

Лучшая информация о рисках приходит не от изучения фичи в одиночку. Она приходит от людей которые знают что хрупко, что изменилось и что ломалось раньше.

Поговори с разработчиком который строил фичу. Спроси где они неуверены. Разработчики часто точно знают где живёт сложная логика: edge case который обработали обходным решением, интеграция с проблемой таймаута, валидация в которой не были уверены. Они редко сами об этом говорят, но ответят напрямую если спросить.

Поговори с продукт-менеджером или продукт-оунером. Спроси о каких пользовательских сценариях они больше всего беспокоятся. PM часто знают где концентрируется бизнес-риск: флоу который генерирует большую часть выручки, фича которую клиенты специально просили и заметят если она плохо работает.

Смотри на тикеты поддержки и прошлые баг-репорты. Если конкретная область генерировала три тикета поддержки в прошлом квартале: это говорит тебе что-то. Прошлая нестабильность: один из лучших предикторов будущей нестабильности. Трекер багов полный проблем из платёжного флоу значит что платёжный флоу получает дополнительное внимание, даже если изменения текущего спринта выглядят небольшими.

Смотри что изменилось. В новом коде больше багов чем в старом. Код сильно изменённый в этом спринте несёт больший риск чем код которого касались минимально. Diff говорит тебе куда смотреть.

Наконец, думай об интеграциях. Любое место где две системы взаимодействуют несёт больший риск чем каждая система по отдельности. Стык между фронтендом и платёжным API. Передача между сервисом и системой email-уведомлений. Интеграционные точки ломаются способами которые юнит-тесты никогда не поймают, потому что каждая сторона тестирует себя в изоляции.

Построение матрицы рисков: пример платёжного флоу

Возьмём реалистичную фичу: e-commerce чекаут с обработкой платежей. Так строится для неё матрица рисков.

Начни с перечисления областей флоу: выбор продукта, обновление количества, применение промокода, ввод адреса, выбор способа оплаты, ввод карты, отправка заказа, подтверждение по email, создание записи заказа, уменьшение остатков.

Для каждой области оцениваешь вероятность и влияние. Ввод карты интегрируется со сторонним платёжным процессором. Интеграция сложная и сбои здесь напрямую теряют выручку. Высокая вероятность, высокое влияние: получает полное покрытие скриптованными тестами плюс исследовательское тестирование. Отправка заказа связывает весь флоу воедино. Сбой здесь означает что ни один заказ не разместится. Даже при средней вероятности влияние критично. Валидация адреса несёт меньший риск: прямолинейная логика которая не менялась недавно, и сбой просто показывает пользователю сообщение об ошибке. Более низкий приоритет.

Матрица может выглядеть так на практике:

|---------|------------|---------|-----------|

Матрица не обязана быть именно этой таблицей. Может быть простым документом, страницей Confluence, таблицей Notion. Формат менее важен чем сам акт явного и видимого оформления этих суждений, чтобы вся команда работала из одного понимания что находится под высоким риском.

Строй матрицу рисков до начала тестирования в спринте, а не после. Когда ты в середине выполнения, есть давление тестировать то что перед тобой. Матрица даёт структуру приоритизации для возврата к ней когда время ограничено.

Распределение покрытия тестами по уровню риска

Имея матрицу рисков, решения о покрытии следуют естественно. Высокорискованные области получают многоуровневое покрытие: скриптованные тест-кейсы для известных сценариев, автоматизированная регрессия для повторного выполнения, и исследовательские сессии чтобы найти то что пропустили скрипты. Низкорискованные области получают более лёгкую обработку.

Для примера с платёжным флоу: интеграция обработки карт получает скриптованные тесты для happy path (валидная карта, успешное списание), путей ошибок (отклонённая карта, просроченная карта, недостаточно средств, невалидный CVV) и edge case (карты с конкретными кодами стран, карты запускающие проверки мошенничества). Потом исследовательскую сессию сфокусированную на управлении состоянием: что если пользователь отправляет форму дважды? Что если сеть падает во время API-вызова? Что если ответ задержан на десять секунд?

Поле валидации адреса получает smoke-тест: введи валидный адрес, подтверди что сохраняется. Всё. Если сломается, влияние устранимо: пользователь видит ошибку и пробует снова. Не заслуживает таких же инвестиций.

Это распределение покрытия: практический результат риск-ориентированного тестирования. Работа не срезается произвольно; явно указывается где оправдана глубина, а где достаточно широты.

Тот же принцип применяется к регрессионным сьютам. Не каждый тест-кейс нужно запускать каждый спринт. Высокорискованные флоу запускаются каждый спринт, или каждый билд если есть автоматизация. Среднерискованные флоу запускаются каждый спринт. Низкорискованные флоу могут чередоваться или запускаться только когда изменился соответствующий код.

Коммуникация решений по рискам со стейкхолдерами

Риск-ориентированное тестирование требует buy-in, потому что означает явное решение не тестировать некоторые вещи глубоко. Это решение должно быть видимым и задокументированным, а не невидимым.

Практический инструмент: лог рисков или отчёт о покрытии. Не обязательно сложный. Главное: что тестировали, что не тестировали, и почему. "Мы не запускали полную регрессию на модуле валидации адреса в этом спринте потому что изменений кода не было и у области нет истории сбоев. Риск принят." Это предложение в итоговом резюме тестирования спринта защищает от вопроса "почему вы не поймали это?" когда что-то низкорискованное в конце концов ломается.

Отчёт о покрытии служит другой цели: показывает стейкхолдерам где было сконцентрировано тестирование. Если VP спрашивает тестировали ли вы платёжный флоу до релиза к Чёрной пятнице, нужно указать на документ показывающий P1-покрытие скриптованными тестами, автоматизацией и исследовательской сессией, а не давать устный ответ по памяти.

Явные и задокументированные решения по рискам создают ответственность без вины. Принято суждение на основе доступной информации. Если суждение оказалось неверным потому что низкорискованная область неожиданно отказала: пересматривай матрицу и обновляй оценку. Это не провал процесса; это процесс работающий как задумано.

Риск-ориентированное тестирование в Agile-спринтах

В Agile риск не статичен. Каждый спринт приносит новый код, новые фичи и новую информацию о том что хрупко. Оценка риска действительная три спринта назад может быть полностью неверной сегодня если платёжный модуль был переписан.

Дисциплина: переоценивать риск в начале каждого спринта как часть спринт-планирования или тест-кикоффа. Смотри что изменилось. Спрашивай разработчиков в чём они неуверены. Проверяй diff. Обновляй матрицу. Это занимает пятнадцать минут при последовательном применении, и держит приоритеты тестирования актуальными а не дрейфующими к привычке.

Сам спринт-бэклог даёт сигналы о рисках. Истории с большими оценками, истории затрагивающие интеграции, истории которые обсуждались на грумминге: это кандидаты на более высокую классификацию риска. История которая прошла грумминг легко с оценкой в два поинта от разработчика владеющего этим кодом вероятно несёт меньший риск чем история в шесть поинтов потребовавшая трёх сессий грумминга для оценки объёма.

Качество критериев приёмки: ещё один сигнал. Когда критерии детальные и конкретные, ожидаемое поведение фичи хорошо понято. Когда они размытые (например "пользователь может управлять настройками профиля"), больше неоднозначности, что обычно означает больше непродуманных edge case, что обычно означает более высокий риск.

Цель в Agile не построить идеальную матрицу рисков один раз. Цель иметь лёгкую, пересматриваемую картину рисков в начале каждого спринта. Со временем это становится быстрым. Развивается интуиция где концентрируется риск в конкретном продукте, и формальная оценка ускоряется потому что обновляется знакомая картина а не строится с нуля.

Как применить это в понедельник утром

Новый инструмент или новый процесс не нужны. Вот что можно сделать в следующем спринте.

Перед началом тестирования новой фичи потрать десять минут чтобы записать области этой фичи и ранжировать их как высокий, средний или низкий риск. Два вопроса: "Насколько сложна или неопределённа эта область?" и "Что ломается в бизнесе если эта область отказывает?" Это ранжирование: матрица рисков.

Распредели время до начала выполнения. При восьми часах на фичу, реши заранее: четыре часа на платёжный флоу (скриптованное и исследовательское), два часа на валидацию формы (скриптованное), один час на экран успеха (smoke), один час на документацию и edge case которые хочешь исследовать. Это распределение в записанном виде делает решение о риске явным.

Задай одному разработчику прямой вопрос до начала тестирования: "Где в этой фиче ты наиболее неуверен?" Запиши ответ и добавь в оценку риска. Одна эта привычка ловит больше багов чем многие техники тестирования, потому что разработчики часто точно знают где зарыты проблемы.

В конце спринта напиши один абзац в итоговом резюме тестирования о том что тестировал и что нет. Храни в общедоступном месте. За три спринта появится история рисков показывающая какие области стабильно получали лёгкое покрытие, и какие могут быть готовы к более глубокому взгляду.

Риск-ориентированное тестирование не фреймворк который внедряется один раз. Это привычка думать о тестировании как о задаче распределения ресурсов, а не упражнении по расстановке галочек. Привычка обучаема, и даёт видимые результаты: меньше сюрпризов в продакшне, более уверенные релизы, и тест-практика которая масштабируется с растущим продуктом а не рушится под собственным весом.

Почему "тестировать всё" нереально

Риск = вероятность × влияние

Выявление риска: кого спрашивать и о чём

Построение матрицы рисков: пример платёжного флоу

Распределение покрытия тестами по уровню риска

Коммуникация решений по рискам со стейкхолдерами

Риск-ориентированное тестирование в Agile-спринтах

Как применить это в понедельник утром

Continue reading