Случайные заметки

Поправка Бонферонни и Холма-Бонферонни

Общие обозначения

Всего есть $m$ нулевых гипотез. Из них $m_0$ нулевых гипотез верны. Количества $m$ и $m_0$ — это константы. Известна только величина $m$. Множество индексов $I_0$ — номера верных нулевых гипотез.

Исходные, несортированные $p$-значения: $p_1$, $p_2$, …, $p_n$.

Отсортируем $p$-значения: $p_{(1)} \leq p_{(2)} \leq \ldots p_{(m)}$.

Случайная величина $V$ — число ложно отвергнутых нулевых гипотез, $0 \leq V \leq m_0$.

\[FWER = P(V > 0)\]

Поправка Бонферонни

Цель. Хотим, чтобы при любом $m_0$ \(FWER \leq \alpha.\)

Алгоритм: Отвергаем те нулевые гипотезы, у которых $p_i \leq \alpha / m$. Остальные не отвергаем.

Доказательство.

\[FWER = P(V > 0) = P(\cup \{p_i \leq \alpha /m \}) \leq \sum_{i \in I_0} P(p_i \leq \alpha/m) = m_0 \cdot \alpha/m \leq \alpha.\]

Поправка Холма-Бонферонни

Цель. Хотим, чтобы при любом $m_0$ \(FWER \leq \alpha.\)

Алгоритм: Сортируем $p$-значения от меньшего к большему, $p_{(1)} \leq p_{(2)} \leq \ldots \leq p_{(m)}$.

Рисуем на графике: по горизонтали ранг $k$, по вертикали $p_{(k)}$.

Добавляем на график линию $y(k) = \alpha / (m + 1 - k)$.

Находим первое $p$-значение, лежащее выше графика или на нём. Соответствующую ему гипотезу не отвергаем. Гипотезы, соответствующие $p$-значениям правее не отвергаем. Гипотезы, соответствующие $p$-значениям левее отвергаем.

Доказательство.

Шаг 1. Для начала докажем, что первая отвергнутая верная гипотеза имеет $p$-значение меньше $\alpha/m_0$.

Доказательство: Пусть $N$ — номер первой отвергнутой верной гипотезы. Её $p$-значение было $p_{(N)} < \frac{\alpha}{m - N + 1}$.

Слева от первой отвергнутой верной гипотезы лежат только неверные гипотезы. Справа от первой отвергнутой верной гипотезы лежат $m - N$ гипотез, они могут быть как верные, так и неверные. Значит: \(m - N + 1 \geq m_0\)

Следовательно, \(p_{(N)} < \frac{\alpha}{m - N + 1} \leq \frac{\alpha}{ m_0 }\)

Шаг 2. Из того, что первой отвергнутой гипотезы $p$-значение меньше $\alpha/m_0$ следует, что хотя бы у одной верной гипотезы есть $p$-значение меньше $\alpha/m_0$.

\[FWER = P(V > 0) \leq P(p_{(N)} < \alpha / m_0) \leq P(\cup_{i\in I_0}\{ p_i \leq \alpha / m_0 \})\]

А дальше, как и в поправке Бонферонни, мажорируем вероятность объединения суммой вероятностей: \(P(\cup_{i\in I_0}\{ p_i \leq \alpha / m_0 \}) \leq \sum_{i \in I_0} P( p_i \leq \alpha / m_0 ) = m_0 \alpha / m_0 = \alpha.\)