![]() |
![]() ![]() ![]() ![]() ![]() |
![]() |
Binomial DistributionBoost , Math Toolkit 2.5.0 , Distributions
|
![]() |
Note |
---|---|
Случайная переменная для биномиального распределения — это число успехов (число испытаний является фиксированным свойством распределения), тогда как для отрицательного биномиала случайная переменная — это число испытаний, для фиксированного числа успехов. |
PDF для биномиального распределения дается:
Следующие два графика иллюстрируют, как PDF изменяется в зависимости от параметров дистрибутивов, сначала мы сохраним дробь успехаpфиксированной на 0,5 и варьируем размер выборки:
Альтернативно, мы можем сохранить размер выборки фиксированным при N=20 и варьировать дробь успехаp:
![]() |
Caution |
---|---|
Биномиальное распределение — это дискретное распределение: внутренне такие функции, как< Квантильная функция по умолчанию возвращает целый результат, который был округленнаружу. То есть нижние квантили (где вероятность меньше 0,5) округлены вниз, а верхние квантили (где вероятность больше 0,5) округлены вверх. Такое поведение гарантирует, что если запрашивается квантиль X%, топо крайней мерезапрашиваемое покрытие будет присутствовать в центральном регионе, ане болеезапрашиваемое покрытие будет присутствовать в хвостах. Это поведение может быть изменено таким образом, что функции квантиля округляются по-разному или даже возвращают реальный результат, используяПолитики. Настоятельно рекомендуется прочитать учебникПонимание квантилей дискретных распределенийперед использованием функции квантиля на биномиальном распределении.справочные документыописывают, как изменить политику округления для этих распределений. |
binomial_distribution(RealType n, RealType p);
Конструктор:n— общее количество испытаний,p— вероятность успеха одного испытания.
<0<=
p<=
1
>и<n
>=0
>, иначе вызываетдоменную ошибку.
RealType success_fraction() const;
Возвращает параметрр, из которого было построено это распределение.
RealType trials() const;
Возвращает параметрр, из которого было построено это распределение.
static RealType find_lower_bound_on_p( RealType trials, RealType successes, RealType alpha, unspecified-type method = clopper_pearson_exact_interval);
Возвращает нижнюю границу на долю успеха:
Общее количество проведенных испытаний.
Количество успехов, которые произошли.
Наибольшая приемлемая вероятность того, что истинное значение доли успехаменьшевозвращенного значения.
Необязательный параметр, который определяет метод, который будет использоваться для вычисления интервала (см. ниже).
Например, если вы наблюдаетеkуспехи изnиспытаний, то наилучшая оценка для фракции успеха простоk/n, но если вы хотите быть на 95% уверены, что истинное значениебольше, чемнекоторое значение,pмин, то:
pmin = binomial_distribution<RealType>::find_lower_bound_on_p( n, k, 0.05);
В настоящее время доступны два возможных значения для методанеобязательного параметра:Clopper_pearson_exact_intervalилиjeffreys_prior_interval. Эти константы являются членами шаблона класса<binomial_distribution
>, так что использование, например:
p = binomial_distribution<RealType>::find_lower_bound_on_p( n, k, 0.05, binomial_distribution<RealType>::jeffreys_prior_interval);
Методом по умолчанию, если этот параметр не указан, является «точный» интервал Клоппера Пирсона. Это создает интервал, который гарантирует по меньшей мере<100(1-alpha)%
>покрытие, но который, как известно, является чрезмерно консервативным, иногда создавая интервалы с гораздо большим, чем запрашиваемое покрытие.
Альтернативный метод расчета дает неинформативный интервал Джеффриса Приора. Он производит<100(1-alpha)%
>покрытие тольков среднем случае, хотя обычно очень близок к запрашиваемому уровню покрытия. Это один из основных методов расчета, рекомендованных в обзоре Брауном, Каем и Дасгуптой.
Обратите внимание, что метод расчета «учебника» с использованием нормального приближения (интервал Вальда) намеренно не предусмотрен: известно, что он дает стабильно плохие результаты, даже когда размер выборки удивительно велик. Обратитесь к Брауну, Каю и Дасгупте за полным объяснением. Существует множество других методов расчета, которые могут быть более подходящими для конкретных ситуаций. К сожалению, среди статистиков нет консенсуса относительно того, что является «лучшим»: обратитесь к дискуссии в конце Брауна, Кай и Дасгупты для примеров.
Эти два метода были выбраны главным образом потому, что они могут использоваться как для одного, так и для двух боковых интервалов. Смотрите также:
Lawrence D. Brown, T. Tony Cai and Anirban DasGupta (2001), Interval Estimation for a Binomial Proportion, Statistical Science, Vol. 16, No. 2, 101-133.
T. Tony Cai (2005), One-sided confidence intervals in discrete distributions, Journal of Statistical Planning and Inference 131, 63-88.
Agresti, A. and Coull, B. A. (1998). Примерный лучше, чем «точный» для интервальной оценки биномиальных пропорций. Амер. Статист. 52 119-126.
Clopper, C. J. and Pearson, E. S. (1934). Использование доверительных или фидуциальных пределов иллюстрируется в случае биномиала. Биометрика 26 404-413.
static RealType find_upper_bound_on_p( RealType trials, RealType successes, RealType alpha, unspecified-type method = clopper_pearson_exact_interval);
Возвращает верхнюю границу на дроби успеха:
Общее количество проведенных испытаний.
Количество успехов, которые произошли.
Наибольшая приемлемая вероятность того, что истинное значение дроби успехабольше, чемвозвращенного значения.
Необязательный параметр, который определяет способ, который будет использоваться для вычисления интервала. См. вышеприведенную документацию<find_upper_bound_on_p
>для определения вариантов способа.
Например, если вы наблюдаетеkуспехи изnиспытаний, лучшая оценка для фракции успеха составляет простоk/n, но если вы хотите быть на 95% уверены, что истинное значениеменьшенекоторое значение,pмакс, то:
pmax = binomial_distribution<RealType>::find_upper_bound_on_p( n, k, 0.05);
![]() |
Note |
---|---|
Чтобы получить двухстороннюю связь на дроби успеха, вы называете оба< Если желаемый уровень риска, что истинная доля успеха лежит вне пределов, составляет α то вы переходите α/2 к этим функциям. Так, например, двухсторонний 95% доверительный интервал будет получен путем прохождения α = 0,025 к каждой из функций. |
static RealType find_minimum_number_of_trials( RealType k, // number of events RealType p, // success fraction RealType alpha); // probability threshold
Эта функция оценивает минимальное количество испытаний, необходимых для обеспечения того, чтобы наблюдалось более чем k событий с уровнем рискаальфа, что происходит k или меньше событий.
Количество наблюдаемых успехов.
Вероятность успеха каждого испытания.
Максимально допустимая вероятность того, что k событий или меньше будет наблюдаться.
Например:
binomial_distribution<RealType>::find_number_of_trials(10, 0.5, 0.05);
Возвращает наименьшее количество испытаний, которые мы должны провести, чтобы быть на 95% уверенными в том, что мы увидим 10 событий, которые происходят с частотой одна половина.
static RealType find_maximum_number_of_trials( RealType k, // number of events RealType p, // success fraction RealType alpha); // probability threshold
Эта функция оценивает максимальное количество испытаний, которые мы можем провести для обеспечения того, чтобы наблюдались успехи или меньше, с рискомальфа, что происходит больше, чем k.
Количество наблюдаемых успехов.
Вероятность успеха каждого испытания.
Максимально допустимая вероятность того, что будет наблюдаться более k событий.
Например:
binomial_distribution<RealType>::find_maximum_number_of_trials(0, 1e-6, 0.05);
Возвращает наибольшее количество испытаний, которые мы можем провести, и все еще на 95% уверен, что не наблюдаем каких-либо событий, которые происходят с частотой один на миллион. Обычно это используется в анализе неудач.
Поддерживаются всеобычные нечленные функции доступа, которые являются общими для всех распределений:Кумулятивная функция распределения,Функция плотности вероятности,Количественная,Функция опасности,Кумулятивная функция опасности,среднее,медианное,режим,дисперсия,стандартное отклонение,искажение,куртоз,куртоз_избыток,диапазониподдержка.
Домен для случайной переменнойkявляется<0<=k<=N
>, в противном случае возвращаетсядомен_ошибка.
Стоит потратить некоторое время, чтобы определить, что эти аксессуары на самом деле означают в контексте этого распределения:
Table 5.1. Meaning of the non-member accessors
Функция |
значение |
---|---|
Вероятность полученияточно k успеховиз n испытаний с долей успеха p. Например: < |
|
Вероятность полученияk успехов или меньшеиз n испытаний с долей успеха p. Например: < |
|
Вероятность полученияболее k успеховиз n испытаний с долей успеха p. Например: < |
|
наибольшеечисло успехов, которые могут наблюдаться из n испытаний с долей успеха p, при вероятности P. Обратите внимание, что возвращенное значение является реальным числом, а не целым числом. В зависимости от варианта использования вы можете взять пол или потолок результата. Например: < |
|
наименьшеечисло успехов, которое можно наблюдать из n испытаний с долей успеха p, при вероятности P. Обратите внимание, что возвращенное значение является реальным числом, а не целым числом. В зависимости от варианта использования вы можете взять пол или потолок результата. Например: < |
Доступны различныепримеры, иллюстрирующие использование биномиального распределения.
Это распределение реализуется с использованием неполных бета-функцийibetaиibetac, пожалуйста, обратитесь к этим функциям для получения информации о точности.
В следующей таблицеpесть вероятность того, что одно испытание будет успешным (фракция успеха),n— число испытаний,k— число успехов,p— вероятность иq = 1-p.
Функция |
Записки об осуществлении |
---|---|
Реализация в терминахibeta_derivative: еслиnCkявляется биномиальным коэффициентом a и b, то мы имеем: Что может быть оценено как< Здесь используется функцияibeta_derivative, поскольку она уже оптимизирована для наименьшей возможной ошибки — действительно, это всего лишь тонкая обертка вокруг части внутренних частей неполной бета-функции. Существуют также различные особые случаи: обратитесь к коду для деталей. |
|
cdf |
Используя соотношение: <p=I[sub1-p](n-k,k+1) =1-I[subp](k+1,n-k) =ibetac(k+1,n-k,p)> Существуют также различные особые случаи: обратитесь к коду для деталей. |
cdf |
Используя соотношение: q =ibeta(k + 1, n - k, p) Существуют также различные особые случаи: обратитесь к коду для деталей. |
квантиль |
Поскольку cdf является нелинейным в вариацииk, ни одна из обратных неполных бета-функций не может быть использована здесь. Вместо этого квантиль обнаруживается численно с использованием производного свободного методаалгоритма TOMS 748 . |
квантиль от дополнения |
Найдено численно, как выше. |
означает |
< |
Разница |
< |
режим |
< |
Косоглазие |
< |
Куртоз |
< |
Избыток куртоза |
< |
оценка параметров |
Функции-члены< |
Статья Binomial Distribution раздела Math Toolkit 2.5.0 Distributions может быть полезна для разработчиков на c++ и boost.
Материалы статей собраны из открытых источников, владелец сайта не претендует на авторство. Там где авторство установить не удалось, материал подаётся без имени автора. В случае если Вы считаете, что Ваши права нарушены, пожалуйста, свяжитесь с владельцем сайта.
:: Главная :: Distributions ::
реклама |