формой этого распределения уже не будет хорошо нам знакомая колоколообразная кривая нормального распределения.

Вместо этого мы должны предположить, что многие выборки, состоящие лишь из 25 взрослых, будут порождать больший разброс вблизи истинного коэффициента совокупности и, следовательно, это распределение будет с «более толстыми хвостами».
А многие выборки из 10 взрослых будут порождать еще больший разброс и, соответственно, распределение с еще более толстыми хвостами. По сути, t-распределение представляет собой некую совокупность, или «семейство», функций плотности вероятности, которые варьируются в зависимости от величины выборки. В частности, чем больше данных содержится в выборке, тем больше «степеней свободы»[64] у нас имеется при определении подходящего распределения, которое служит нам эталоном для оценки результатов. Если вы решите изучать более продвинутый курс статистики, то узнаете, как именно вычисляются степени свободы; пока же можем считать, что они примерно равны количеству наблюдений в выборке. Например, регрессионный анализ с выборкой, размер которой составляет 10, и с единственной объясняющей переменной, имеет 9 степеней свободы. Чем больше степеней свободы, тем больше уверенность, что выборка представляет истинную совокупность, и тем «плотнее» будет распределение, как следует из приведенной ниже диаграммы[65].

Когда число степеней свободы увеличивается, t-распределение сходится к нормальному распределению. Именно поэтому при работе с большими совокупностями данных вы можете использовать для соответствующих вычислений нормальное распределение.

t-распределение лишь добавляет определенные нюансы в тот же процесс статистического вывода, который мы неоднократно использовали в этой книге. Мы по-прежнему формулируем нулевую гипотезу, а затем проверяем ее на наблюдаемых нами данных. Если эти данные крайне маловероятны в случае правильности нулевой гипотезы, то она отвергается. Единственное, что изменяется при использовании t-распределения, – это основные вероятности для оценивания наблюдаемых исходов. Чем «толще» хвост у конкретного распределения вероятностей (например, t-распределение для восьми степеней свободы), тем больший разброс следует ожидать в наблюдаемых данных и, следовательно, тем меньше уверенность в правильности отказа от нулевой гипотезы.

Допустим, мы решаем уравнение регрессии и, согласно нулевой гипотезе, коэффициент при какой-то конкретной переменной равняется нулю. После того как мы получим результаты вычислений, мы могли бы рассчитать t-статистику, которая представляет собой отношение наблюдаемого коэффициента к стандартной ошибке для этого коэффициента[66]. Эта t-статистика затем оценивается с точки зрения величины выборки данных, для которой подходит t-распределение (поскольку именно это в значительной мере определяет число степеней свободы). Когда t-статистика достаточно велика, то есть наблюдаемый коэффициент далек от того, что предсказывает нулевая гипотеза, мы можем отвергнуть нулевую гипотезу на некотором уровне статистической значимости. Опять-таки это тот же самый базовый процесс статистического вывода, с которым мы неоднократно сталкивались в этой книге.

Чем меньше степеней свободы (и, следовательно, чем «толще» хвосты у соответствующего t-распределения), тем больше должна быть t-статистика, чтобы мы могли отвергнуть нулевую гипотезу на некотором заданном уровне статистической значимости. Если бы в описанном выше гипотетическом примере регрессии было четыре степени свободы, то нам понадобилось бы, чтобы t-статистика была не менее 2,13: только в этом случае мы могли бы отвергнуть нулевую гипотезу на доверительном уровне 0,05 (при использовании одностороннего критерия).

Если бы у нас было 20 000 степеней свободы (что вполне позволяет использовать нормальное распределение), то для того чтобы отвергнуть нулевую гипотезу на доверительном уровне 0,05 (при использовании того же одностороннего критерия), необходимо, чтобы t-статистика равнялась всего 1,65.

Уравнение регрессии для веса

<< | >>
Источник: Чарльз Уилан. Голая статистика. Самая интересная книга о самой скучной науке. 2016

Еще по теме формой этого распределения уже не будет хорошо нам знакомая колоколообразная кривая нормального распределения.:

  1. Глава 15. Кривая нормального распределения, великий интеллектуальный обман
  2. Интегральная функция нормального распределения
  3. Рис. 11.1. Нормальное распределение ценовых колебаний
  4. Наша реклама хорошая, она принесет нам клиентов. – Лучше повесьте логотип компании на холодильнике в своей квартире – эффект будет больше
  5. Рис. 9.10. Нормальная кривая доходности
  6. Хорошие партнерские отношения участников це­почки распределения необходимое, но не достаточ­ное условие преуспевания бизнеса.
  7. Каналы распределения. Понятия, функции и структура каналов распределения
  8. Глава 30. ТЕХНИЧЕСКИЕ ТЕРМИНЫ С КОТОРЫМИ ВЫ УЖЕ НЕМНОГО ЗНАКОМЫ
  9. Каналы распределения и товародвижение. Природа каналов распределения
  10. Настоящее правило успеха: забудьте о гениальных идеях, возьмите то, что уже хорошо работает у других, и повторите это! А затем уже совершенствуйте и ищите идеи, но никак не наоборот.
  11. Итак, на дворе финансовый кризис. Как же все-таки грамотно управлять своими личными финансами, чтобы минимизировать воздействие этого неприятного явления на вас и вашу семью, ваших близких и знакомых?
  12. Распределение ставки доходности
  13. Предметом залогаможет быть, как движимое, так и недвижимое имущество, а также имущественные права, т. е. объективные права участников взаимоотношений, связанные с владением, пользованием и распоряжением имуществом, а также с теми материальными (имущественными) требованиями, которые возникают между участниками экономического оборота по поводу распределения этого имущества и обмена товарами, услугами, ценными бумагами и т. п.
  14. Распределение
  15. Эмиссия дополнительных акций акционерного общества, размещаемых путем распределения среди акционеров. Решение о размещении дополнительных акций и решение о дополнительном выпуске акций, размещаемых путем распределения среди акционеров
  16. Влияние характера распределения на размер страхового запаса
  17. Распределение в логистике
  18. Экономика распределения