docgid.ru

Что показывает коэффициент стьюдента. Определение достоверности различий по t - критерию Стьюдента

В большинстве случаев для сравнения средних значений двух независимых выборок (с. 91) применяют критерий Стью­дента. Так как критерий Стьюдента относится к параметриче­ским, его использование возможно только в том случае, когда ре­зультаты исследования представлены в виде измерений по шкале отношений (с. 90).

Критерий Стьюдента обозначается t и вычисляется по фор­муле*:

t = х1 – x2 / √ m1² + m2²

В случаях, когда число наблюдений (n) более 500, уровень значимости при р = 0,05 достигается при t = 1 ,96, уровни значи­мости при р = 0,01 или р = 0,001, соответственно достигаются при t = 2,59 и t = 3,29.

Если число наблюдений менее 500, необходимая величина t для различных уровней значимости определяется по таблице 10.

Прежде чем обратиться к таблице, необходимо определить число степеней свободы. Этим термином называют число неза­висимых величин, участвующих в образовании того или иного параметра (f). Правила определения степеней свободы представ­лены в различных пособиях по математической статистике (Ю.К. Демьяненко, 1968). При вычислении критерия Стьюдента t общее число степеней свободы (f) будет равно n1 + n2 - 2.

Так, например, при сравнении результатов, показанных лыжниками экспериментальной и контрольной групп в прохож­дении контрольной дистанции получены следующие данные: средний показатель в экспериментальной группе (n = 12 чело­век) составил х = 34,6 сек, ошибка среднего значения m = 0,47 сек; в контрольной группе (n = 14 человек) эти данные были, со­ответственно, х = 37,3 сек, m = 0,49 сек.

Подставив значения в формулу, получаем значение t.

t = 37,3 - 34,6 / √ V 0,49 2 + 0,47 2 = 2,7 / 0,68 = 3,97

После определения числа степеней свободы (f =12 + 14 - 2 = 24) по таблице находим значение t. Полученное значение 3,97 превышает табличное значение для 99% доверительного уровня. Значит, мы можем утверждать, что между результатами двух сравниваемых групп существуют достоверные различия при уровне значимости р < 0,01.



При сравнительно больших числах измерений условно при­нято считать, что если разница между средними арифметиче­скими показателями равна или больше трех своих ошибок, разли­чия считаются достоверными. В этом случае достоверность раз­личий определяется по следующему уравнению:

Х Э -Х К >3√ mэ + mк ²

В приведенном примере велось сравнение результатов зани­мающихся разных групп, то есть независимых выборок. В случае, когда сравниваются результаты, полученные в начале и конце эксперимента в одной и той же группе, то есть при зависимых вы­борках, вычислить критерий Стьюдента по обычной формуле нельзя . Критерий Стьюдента в этом случае должен вычисляться по формуле:

t = Х 1 -Х 2 / m1 ² + m2² - 2rm1 m2

где r - коэффициент корреляции между начальными и конечными резуль­татами по изучаемому признаку.

Таблица 10

Граничные значения t(критерий Стьюдента)

f Доверительные уровни (Р)
95% . 99% 99,9%
12,71 63.60
4.30 9.93 31.60
3.18 5.84 12.94
2.78 4.60 8.61
2.57 4.03 6.86
2.45 3.71 5.96
2.37 3.50 5.41
2.31 3.36 5,04
2.26 3.25 4.78
2.23 3.17 4.59
П 2.20 3.11 4.44
2.18 3.06 4.32
1.16 3.01 4.22
2.15 2,98 4,14
2.13 2.95 4.07
2.12 2,92 4.02
2.11 2.90 3.97
2.10 2.88 3.92
2.09 2.86 3.88
2.09 2.85 3.85
2.08 2,83 3.82
2.07 2.82 3.79
2.07 2.81 3,77
2.06 2.80 3.75
2,06 2.79 3.73
2.06 2.78 3.71
2.05 2.77 3.69
2.05 2.76 3.67
2.04 2.76 3.66
2.04 2,75 " 3.65
2.02 2,70 3.55
2.01 2.68 3,50
2.00 2.66 3.46
1.99 2.64 3.42
1.98 2.63 3.39
1.98 2,62 3.37
1.97 2.60 3.34
1.96 2,59 3.31
оо 1.96 2.59 3.29
Уровни значимости (р)
0,05 0,01 0,001

Формулирование выводов

(заключение)

В конце работы делаются выводы. Формулирование выводов, наряду с формулированием введения, является одним из самых сложных и ответственных этапов оформления любой курсовой работы.

В выводах необходимо отразить наиболее существенные результаты исследования.

Существуют несколько распространенных ошибок при формулировании выводов. Часто студент строит предложение так, что оно звучит как декларация о результатах проделанной им работы («изучено», «разработано» и т.п.). Например:

«В ходе исследования были определены основные положения экспериментальной методики…» или «Выделены показатели, позволя­ющие оценивать коммуникативные умения студентов педагогических специальностей по осуществлению физкультурно-оздоровительной работы со школьниками…».

Чтобы изложенное являлось выводами, фразы следовало построить примерно так: «Сформулированные нами положения экспериментальной методики позволяют…» и, соответственно: «Из выделенных показателей наиболее информативными, позволяющими оценивать уровень коммуникативных умений студентов педагогических специальностей , являются...»

Другой распространенной ошибкой является утверждение студентом в выводе чего-то очевидного, для констатации которого не требуется проводить специального исследования. Например:

«На занятиях физическими упражнениями со школьниками необходимо учитывать особенности развития подростка этого возраста».

Иногда вывод оказывается, вовсе бессо­держательным. Таким обычно бывает первый вывод, который студент делает на основе анализа литературы. Например:

«Анализ научно-методической литературы показал, что в теории физического воспитания вопрос об использовании тренажеров в спортивной подготовке пловцов еще не полностью раскрыт».

Выводы должны информативно отражать проделанную студентом работу, но не должны быть многословными.


ТРЕБОВАНИЯ К ОФОРМЛЕНИЮ

КУРСОВЫХ РАБОТ

В выпускной квалификационной работе должны быть представлены следующие структурные компоненты:

· титульный лист ;

· введение;

· основной текст (глава 1, глава 2);

· выводы (заключение);

· список литературы;

· приложения (если в них имеется необходимость).

Оптимальный объем курсовой работы составляет 40-50 страниц машинописного текста через 1,5 интервала (включая рисунки, таблицы, графики, список литературы и приложения).

Размер шрифта 14 Times New Roman.

Работа оформляется в компьютерном или рукописном виде (второй вариант менее желателен).

В компьютерном варианте текст работы печатается через полтора интервала на одной стороне стандартного листа бумаги форматом А4 (210x297 мм). Поля страницы работы должны иметь следующие размеры: левое - 30 мм, правое -10 мм, верхнее - 20 мм, нижнее - 25 мм.

Таблицы, рисунки, чертежи, схемы, графики должны быть выполнены на стандартных листах форматом А4 (210x297 мм). Подписи и пояснения должны быть с лицевой стороны.

Все страницы выпускных аттестационных работ, включая иллюстрации и приложения, нумеруются по порядку от титульного листа до последней страницы без пропусков и повторений. Первой страницей считается титульный лист, на ней цифра "1" не ставится, на следующей странице ставится цифра "2" и т.д. Порядковый номер ставится в середине нижнего поля страницы.

Весь материал выпускных аттестационных работ в соответствии с оглавлением (планом) разделяется на параграфы. Наименование параграфов должно соответствовать содержанию и печататься в виде заголовка строчными буквами без подчеркивания.

В работе допустимы стандартные общепринятые сокращения типа "и т.д.", "и т.п.", "и др." "и проч.", "см.", "стр."

Образец оформления таблиц и иллюстраций дан в Приложении 3.

Титульный лист

Титульный лист- это информация о работе. На нем указывается название учреждения, где выполнялась работа; фамилия, имя, отчество ав­тора; название; фамилия, имя, отчество, ученая сте­пень и ученое звание научного руководителя (консультанта); город, год. Вид титульного листа выпускных аттестационных работ представлен на рисунке 1.

Федеральное государственное автономное образовательное учреждение

Высшего образования

«Нижегородский государственный университет им. Н.И. Лобачевского»

Арзамасский филиал

Естественно-географический факультет

Кафедра физической культуры

Курсовая работа по дисциплине

«Теория и методика физической культуры»

на тему:

"Методические особенности физкультурно-оздоровительных занятий

с детьми дошкольного возраста"

Выполнил:

Иванов А.В.,

студент(ка) направления 034300 (49.03.01)

Физическая культура

профиль «Менеджмент в сфере

физической культуры»

форма обучения – заочная

(полный срок обучения /

ускоренная программа обучения)

1 (2) курс обучения, группа 11(12)

Научный руководитель:

к.п.н., доцентСидорова Т.В.

Арзамас

Рис. 1. Образец титульного листа курсовой работы

В выпускных аттестационных работах используется слово «оглавление», а не «содержание». Оглавление – это указатель рубрик (глав) единого произведения, в то время как содержание – это указатель заглавий различных произведений, включенных в издание. С точки зрения культуры чтения оглавление размещается в начале работы: читающий именно с оглавления начинает знакомство с исследованием.

При оформлении оглавления необходимо каждый подчиненный заголовок располагать с отступом вправо от предшествующего основного заголовка, к которому он относится, располагая первую цифру под заглавной буквой заголовка, к которому он непосредственно относится. Все заголовки равной ступени следует начинать от одной вертикальной линии. Подобное построение плана позволяет четко видеть соподчиненность всего материала. Например:

Введение. . . . . . . . . . . . . . . . . . . . . . . .. . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Проблема формирования у студентов знаний с целью повышения у них мотивации к занятиям физическими упражнениями. . . . ………….. . . .
1. Физическая культура студентов на современном этапе. . . . .………...
1.11.1 Изменение приоритетов в занятиях студентов физическими упражнениями в 20-90-х годах. . . . . . . . ………..
1.1 1.2 Направленность современного образования студентов в области физической культуры. . . . . . . . …………
2. Формирование мотивации студентов к занятиям физическими упражнениями. . . . . . . . . . . . . . . . . . . . ………
2.12.2 Отношение студентов к занятиям физическими упражнениями.
Заключение…………………………………………………………………… . 14
Список литературы………………………………………………………………
Приложения

Для того чтобы сделать отступы в оглавлении одинаковыми и выровнять номера страниц, целесообразно использовать формат таблицы, линии которой задать в параметрах невидимыми.

В выпускных аттестационных работах большое значение имеет рубрикация текста. Рубрики раскрывают строение текста, показывают связь и взаимозависимость разделов и подразделов.

Заголовки параграфов должны точно отражать содержание относящегося к ним текста. Они не должны сокращать или расширять объем смысловой информации, которая в них заключена.

Заголовки параграфов и подпараграфов располагаются посередине отдельной строки и печатаются полужирным прямым шрифтом, строчными буквами, кроме первой – заглавной (рис. 2).

1.1. Понятие об осанке

Рис. 2. Образец оформления названия параграфа

Заголовок отделяется от идущего за ним текста одним интервалом (одним непечатным символом), а от предшествующего текста – двумя интервалами (двумя непечатными символами, стоящими друг под другом). Заголовок не может быть последней строчкой на странице.

Абзацный отступ выставляется через опции «Формат» ® «Абзац» ® «Отступы и интервалы» ® «Первая строка» ® «Отступ» ® 1,25 см (1,27 см). Ударом клавиши абзацный отступ не выставляется!

Выделения шрифтом

Соподчинение содержания внутри параграфа, разграничение частей и элементов текста по значимости оформляется при помощи выделения шрифтом (другой насыщенности, с наклоном штрихов букв, в разрядку).

В научных работах принято использовать соподчинение шрифтов (табл. 11).

Проверка статистической гипотезы позволяет сделать строгий вывод о характеристиках генеральной совокупности на основе выборочных данных. Гипотезы бывают разные. Одна из них – это гипотеза о средней (математическом ожидании). Суть ее в том, чтобы на основе только имеющейся выборки сделать корректное заключение о том, где может или не может находится генеральная средняя (точную правду мы никогда не узнаем, но можем сузить круг поиска).

Общий подход в проверке гипотез описан , поэтому сразу к делу. Предположим для начала, что выборка извлечена из нормальной совокупности случайных величин X с генеральной средней μ и дисперсией σ 2 (знаю-знаю, что так не бывает, но не нужно меня перебивать!). Средняя арифметическая из этой выборки, очевидно, сама является случайной величиной. Если извлечь много таких выборок и посчитать по ним средние, то они также будут иметь с математическим ожиданием μ и

Тогда случайная величина

Возникает вопрос: будет ли генеральная средняя c вероятностью 95% находиться в пределах ±1,96s x̅ . Другими словами, являются ли распределения случайных величин

эквивалентными.

Впервые этот вопрос был поставлен (и решен) одним химиком, который трудился на пивной фабрике Гиннеса в г. Дублин (Ирландия). Химика звали Уильям Сили Госсет и он брал пробы пива для проведения химического анализа. В какой-то момент, видимо, Уильяма стали терзать смутные сомнения на счет распределения средних. Оно получалось немного более размазанным, чем должно быть у нормального распределения.

Собрав математическое обоснование и рассчитав значения функции обнаруженного им распределения, химик из Дублина Уильям Госсет написал заметку, которая была опубликована в мартовском выпуске 1908 года журнала «Биометрика» (главред – Карл Пирсон). Т.к. Гиннесс строго-настрого запретил выдавать секреты пивоварения, Госсет подписался псевдонимом Стьюдент.

Несмотря на то что, К. Пирсон уже изобрел распределение , все-таки всеобщее представление о нормальности еще доминировало. Никто не собирался думать, что распределение выборочных оценок может быть не нормальным. Поэтому статья У. Госсета осталась практически не замеченной и забытой. И только Рональд Фишер по достоинству оценил открытие Госсета. Фишер использовал новое распределение в своих работах и дал ему название t-распределение Стьюдента . Критерий для проверки гипотез, соответственно, стал t-критерием Стьюдента . Так произошла «революция» в статистике, которая шагнула в эру анализа выборочных данных. Это был краткий экскурс в историю.

Посмотрим, что же мог увидеть У. Госсет. Сгенерируем 20 тысяч нормальных выборок из 6-ти наблюдений со средней () 50 и среднеквадратичным отклонением (σ ) 10. Затем нормируем выборочные средние, используя генеральную дисперсию :

Получившиеся 20 тысяч средних сгруппируем в интервалы длинной 0,1 и подсчитаем частоты. Изобразим на диаграмме фактическое (Norm) и теоретическое (ENorm) распределение частот выборочных средних.

Точки (наблюдаемые частоты) практически совпадают с линией (теоретическими частотами). Оно и понятно, ведь данные взяты из одной и то же генеральной совокупности, а отличия – это лишь ошибки выборки.

Проведем новый эксперимент. Нормируем средние, используя выборочную дисперсию .

Снова подсчитаем частоты и нанесем их на диаграмму в виде точек, оставив для сравнения линию стандартного нормального распределения. Обозначим эмпирическое частоты средних, скажем, через букву t .

Видно, что распределения на этот раз не очень-то и совпадают. Близки, да, но не одинаковы. Хвосты стали более «тяжелыми».

У Госсета-Стьюдента не было последней версии MS Excel, но именно этот эффект он и заметил. Почему так получается? Объяснение заключается в том, что случайная величина

зависит не только от ошибки выборки (числителя), но и от стандартной ошибки средней (знаменателя), которая также является случайной величиной.

Давайте немного разберемся, какое распределение должно быть у такой случайной величины. Вначале придется кое-что вспомнить (или узнать) из математической статистики. Есть такая теорема Фишера, которая гласит, что в выборке из нормального распределения:

1. средняя и выборочная дисперсия s 2 являются независимыми величинами;

2. соотношение выборочной и генеральной дисперсии, умноженное на количество степеней свободы, имеет распределение χ 2 (хи-квадрат) с таким же количеством степеней свободы, т.е.

где k – количество степеней свободы (на английском degrees of freedom (d.f.))

На этом законе основывается множество других результатов в статистике нормальных моделей.

Вернемся к распределению средней. Разделим числитель и знаменатель выражения

на σ X̅ . Получим

Числитель – это стандартная нормальная случайная величина (обозначим ξ (кси)). Знаменатель выразим из теоремы Фишера.

Тогда исходное выражение примет вид

Это и есть в общем виде (стьюдентово отношение). Вывести функцию его распределения можно уже непосредственно, т.к. распределения обеих случайных величин в данном выражении известны. Оставим это удовольствие математикам.

Функция t-распределения Стьюдента имеет довольно сложную для понимания формулу, поэтому не имеет смысла ее разбирать. Все равно ей никто не пользуется, т.к. вероятности приведены в специальных таблицах распределения Стьюдента (иногда называют таблицами коэффициентов Стьюдента), либо забиты в формулы ПЭВМ.

Итак, вооружившись новыми знаниями, вы сможете понять официальное определение распределения Стьюдента.
Случайной величиной, подчиняющейся распределению Стьюдента с k степенями свободы, называется отношение независимых случайных величин

где ξ распределена по стандартному нормальному закону, а χ 2 k подчиняется распределению χ 2 c k степенями свободы.

Таким образом, формула критерия Стьюдента для средней арифметической

Есть частный случай стьюдентова отношения

Из формулы и определения следует, что распределение т-критерия Стьюдента зависит лишь от количества степеней свободы.

При k > 30 t-критерий практически не отличается от стандартного нормального распределения.

В отличие от хи-квадрат, t-критерий может быть одно- и двухсторонним. Обычно пользуются двухсторонним, предполагая, что отклонение может происходить в обе стороны от средней. Но если условие задачи допускает отклонение только в одну сторону, то разумно применять односторонний критерий. От этого немного увеличивается мощность, т.к. при фиксированном уровне значимости критическое значение немного приближается к нулю.

Условия применения t-критерия Стьюдента

Несмотря на то, что открытие Стьюдента в свое время совершило переворот в статистике, t-критерий все же довольно сильно ограничен в возможностях применения, т.к. сам по себе происходит из предположения о нормальном распределении исходных данных. Если данные не являются нормальными (что обычно и бывает), то и t-критерий уже не будет иметь распределения Стьюдента. Однако в силу действия центральной предельной теоремы средняя даже у ненормальных данных быстро приобретает колоколообразную форму распределения.

Рассмотрим, для примера, данные, имеющие выраженный скос вправо, как у распределения хи-квадрат с 5-ю степенями свободы.

Теперь создадим 20 тысяч выборок и будет наблюдать, как меняется распределение средних в зависимости от их объема.

Отличие довольно заметно в малых выборках до 15-20-ти наблюдений. Но дальше оно стремительно исчезает. Таким образом, ненормальность распределения – это, конечно, нехорошо, но некритично.

Больше всего t-критерий «боится» выбросов, т.е. аномальных отклонений. Возьмем 20 тыс. нормальных выборок по 15 наблюдений и в часть из них добавим по одному случайном выбросу.

Картина получается нерадостная. Фактические частоты средних сильно отличаются от теоретических. Использование t-распределения в такой ситуации становится весьма рискованной затеей.

Итак, в не очень малых выборках (от 15-ти наблюдений) t-критерий относительно устойчив к ненормальному распределению исходных данных. А вот выбросы в данных сильно искажают распределение t-критерия, что, в свою очередь, может привести к ошибкам статистического вывода, поэтому от аномальных наблюдений следует избавиться. Часто из выборки удаляют все значения, выходящие за пределы ±2 стандартных отклонения от средней.

Пример проверки гипотезы о математическом ожидании с помощью t- критерия Стьюдента в MS Excel

В Excel есть несколько функций, связанных с t-распределением. Рассмотрим их.

СТЬЮДЕНТ.РАСП – «классическое» левостороннее t-распределение Стьюдента. На вход подается значение t-критерия, количество степеней свободы и опция (0 или 1), определяющая, что нужно рассчитать: плотность или значение функции. На выходе получаем, соответственно, плотность или вероятность того, что случайная величина окажется меньше указанного в аргументе t-критерия.

СТЬЮДЕНТ.РАСП.2Х – двухсторонне распределение. В качестве аргумента подается абсолютное значение (по модулю) t-критерия и количество степеней свободы. На выходе получаем вероятность получить такое или еще больше значение t-критерия, т.е. фактический уровень значимости (p-level).

СТЬЮДЕНТ.РАСП.ПХ – правостороннее t-распределение. Так, 1-СТЬЮДЕНТ.РАСП(2;5;1) = СТЬЮДЕНТ.РАСП.ПХ(2;5) = 0,05097. Если t-критерий положительный, то полученная вероятность – это p-level.

СТЬЮДЕНТ.ОБР – используется для расчета левостороннего обратного значения t-распределения. В качестве аргумента подается вероятность и количество степеней свободы. На выходе получаем соответствующее этой вероятности значение t-критерия. Отсчет вероятности идет слева. Поэтому для левого хвоста нужен сам уровень значимости α , а для правого 1 — α .

СТЬЮДЕНТ.ОБР.2Х – обратное значение для двухстороннего распределения Стьюдента, т.е. значение t-критерия (по модулю). Также на вход подается уровень значимости α . Только на этот раз отсчет ведется с двух сторон одновременно, поэтому вероятность распределяется на два хвоста. Так, СТЬЮДЕНТ.ОБР(1-0,025;5) = СТЬЮДЕНТ.ОБР.2Х(0,05;5) = 2,57058

СТЬЮДЕНТ.ТЕСТ – функция для проверки гипотезы о равенстве математических ожиданий в двух выборках. Заменяет кучу расчетов, т.к. достаточно указать лишь два диапазона с данными и еще пару параметров. На выходе получим p-level.

ДОВЕРИТ.СТЬЮДЕНТ – расчет доверительного интервала средней с учетом t-распределения.

Рассмотрим такой учебный пример. На предприятии фасуют цемент в мешки по 50кг. В силу случайности в отдельно взятом мешке допускается некоторое отклонение от ожидаемой массы, но генеральная средняя должна оставаться 50кг. В отделе контроля качества случайным образом взвесили 9 мешков и получили следующие результаты: средняя масса () составила 50,3кг, среднеквадратичное отклонение (s ) – 0,5кг.

Согласуется ли полученный результат с нулевой гипотезой о том, что генеральная средняя равна 50кг? Другими словами, можно ли получить такой результат по чистой случайности, если оборудование работает исправно и выдает среднее наполнение 50 кг? Если гипотеза не будет отклонена, то полученное различие вписывается в диапазон случайных колебаний, если же гипотеза будет отклонена, то, скорее всего, в настройках аппарата, заполняющего мешки, произошел сбой. Требуется его проверка и настройка.

Краткое условие в обще принятых обозначениях выглядит так.

H 0: μ = 50 кг

H 1: μ ≠ 50 кг

Есть основания предположить, что распределение заполняемости мешков подчиняются нормальному распределению (или не сильно от него отличается). Значит, для проверки гипотезы о математическом ожидании можно использовать t-критерий Стьюдента. Случайные отклонения могут происходить в любую сторону, значит нужен двухсторонний t-критерий.

Вначале применим допотопные средства: ручной расчет t-критерия и сравнение его с критическим табличным значением. Расчетный t-критерий:

Теперь определим, выходит ли полученное число за критический уровень при уровне значимости α = 0,05. Воспользуемся таблицей t-распределения Стьюдента (есть в любом учебнике по статистике).

По столбцам идет вероятность правой части распределения, по строкам – число степеней свободы. Нас интересует двухсторонний t-критерий с уровнем значимости 0,05, что равносильно t-значению для половины уровня значимости справа: 1 — 0,05/2 = 0,975. Количество степеней свободы – это объем выборки минус 1, т.е. 9 — 1 = 8. На пересечении находим табличное значение t-критерия – 2,306. Если бы мы использовали стандартное нормальное распределение, то критической точкой было бы значение 1,96, а тут она больше, т.к. t-распределение на небольших выборках имеет более приплюснутый вид.

Сравниваем фактическое (1,8) и табличное значение (2.306). Расчетный критерий оказался меньше табличного. Следовательно, имеющиеся данные не противоречат гипотезе H 0 о том, что генеральная средняя равна 50 кг (но и не доказывают ее). Это все, что мы можем узнать, используя таблицы. Можно, конечно, еще p-level попробовать найти, но он будет приближенным. А, как правило, именно p-level используется для проверки гипотез. Поэтому далее переходим в Excel.

Готовой функции для расчета t-критерия в Excel нет. Но это и не страшно, ведь формула t-критерия Стьюдента довольно проста и ее можно легко соорудить прямо в ячейке Excel.

Получили те же 1,8. Найдем вначале критическое значение. Альфа берем 0,05, критерий двухсторонний. Нужна функция обратного значения t-распределения для двухсторонней гипотезы СТЬЮДЕНТ.ОБР.2Х.

Полученное значение отсекает критическую область. Наблюдаемый t-критерий в нее не попадает, поэтому гипотеза не отклоняется.

Однако это тот же способ проверки гипотезы с помощью табличного значения. Более информативно будет рассчитать p-level, т.е. вероятность получить наблюдаемое или еще большее отклонение от средней 50кг, если эта гипотеза верна. Потребуется функция распределения Стьюдента для двухсторонней гипотезы СТЬЮДЕНТ.РАСП.2Х.

P-level равен 0,1096, что больше допустимого уровня значимости 0,05 – гипотезу не отклоняем. Но теперь можно судить о степени доказательства. P-level оказался довольно близок к тому уровню, когда гипотеза отклоняется, а это наводит на разные мысли. Например, что выборка оказалась слишком мала для обнаружения значимого отклонения.

Пусть через некоторое время отдел контроля снова решил проверить, как выдерживается стандарт заполняемости мешков. На этот раз для большей надежности было отобрано не 9, а 25 мешков. Интуитивно понятно, что разброс средней уменьшится, а, значит, и шансов найти сбой в системе становится больше.

Допустим, были получены те же значения средней и стандартного отклонения по выборке, что и в первый раз (50,3 и 0,5 соответственно). Рассчитаем t-критерий.


Критическое значение для 24-х степеней свободы и α = 0,05 составляет 2,064. На картинке ниже видно, что t-критерий попадает в область отклонения гипотезы.

Можно сделать вывод о том, что с доверительной вероятностью более 95% генеральная средняя отличается от 50кг. Для большей убедительности посмотрим на p-level (последняя строка в таблице). Вероятность получить среднюю с таким или еще большим отклонением от 50, если гипотеза верна, составляет 0,0062, или 0,62%, что при однократном измерении практически невозможно. В общем, гипотезу отклоняем, как маловероятную.

Расчет доверительного интервала с помощью t-распределения Стьюдента

С проверкой гипотез тесно связан еще один статистический метод – расчет доверительных интервалов . Если в полученный интервал попадает значение, соответствующее нулевой гипотезе, то это равносильно тому, что нулевая гипотеза не отклоняется. В противном случае, гипотеза отклоняется с соответствующей доверительной вероятностью. В некоторых случаях аналитики вообще не проверяют гипотез в классическом виде, а рассчитывают только доверительные интервалы. Такой подход позволяет извлечь еще больше полезной информации.

Рассчитаем доверительные интервалы для средней при 9 и 25 наблюдениях. Для этого воспользуемся функцией Excel ДОВЕРИТ.СТЬЮДЕНТ. Здесь, как ни странно, все довольно просто. В аргументах функции нужно указать только уровень значимости α , стандартное отклонение по выборке и размер выборки. На выходе получим полуширину доверительного интервала, то есть значение которое нужно отложить по обе стороны от средней. Проведя расчеты и нарисовав наглядную диаграмму, получим следующее.

Как видно, при выборке в 9 наблюдений значение 50 попадает в доверительный интервал (гипотеза не отклоняется), а при 25-ти наблюдениях не попадает (гипотеза отклоняется). При этом в эксперименте с 25-ю мешками можно утверждать, что с вероятностью 97,5% генеральная средняя превышает 50,1 кг (нижняя граница доверительного интервала равна 50,094кг). А это довольно ценная информация.

Таким образом, мы решили одну и ту же задачу тремя способами:

1. Древним подходом, сравнивая расчетное и табличное значение t-критерия
2. Более современным, рассчитав p-level, добавив степень уверенности при отклонении гипотезы.
3. Еще более информативным, рассчитав доверительный интервал и получив минимальное значение генеральной средней.

Важно помнить, что t-критерий относится к параметрическим методам, т.к. основан на нормальном распределении (у него два параметра: среднее и дисперсия). Поэтому для его успешного применения важна хотя бы приблизительная нормальность исходных данных и отсутствие выбросов.

Напоследок предлагаю посмотреть видеоролик о том, как проводить расчеты, связанные с t-критерием Стьюдента в Excel.

История

Данный критерий был разработан Уильямом Госсеттом для оценки качества пива в компании Гиннесс . В связи с обязательствами перед компанией по неразглашению коммерческой тайны (руководство Гиннесса считало таковой использование статистического аппарата в своей работе), статья Госсета вышла в 1908 году в журнале «Биометрика» под псевдонимом «Student» (Студент).

Требования к данным

Для применения данного критерия необходимо, чтобы исходные данные имели нормальное распределение . В случае применения двухвыборочного критерия для независимых выборок также необходимо соблюдение условия равенства дисперсий . Существуют, однако, альтернативы критерию Стьюдента для ситуации с неравными дисперсиями.

Двухвыборочный t-критерий для независимых выборок

В случае с незначительно отличающимся размером выборки применяется упрощённая формула приближенных расчётов:

В случае, если размер выборки отличается значительно, применяется более сложная и точная формула:

Где M 1 ,M 2 - средние арифметические, σ 1 ,σ 2 - стандартные отклонения, а N 1 ,N 2 - размеры выборок.

Двухвыборочный t-критерий для зависимых выборок

Для вычисления эмпирического значения t-критерия в ситуации проверки гипотезы о различиях между двумя зависимыми выборками (например, двумя пробами одного и того же теста с временным интервалом) применяется следующая формула:

где M d - средняя разность значений, а σ d - стандартное отклонение разностей.

Количество степеней свободы рассчитывается как

Одновыборочный t-критерий

Применяется для проверки гипотезы об отличии среднего значения от некоторого известного значения :

Количество степеней свободы рассчитывается как

Непараметрические аналоги

Аналогом двухвыборочного критерия для независимых выборок является U-критерий Манна-Уитни . Для ситуации с зависимыми выборками аналогами являются критерий знаков и T-критерий Вилкоксона

Автоматический расчет t-критерия Стьюдента


Wikimedia Foundation . 2010 .

Смотреть что такое "T-критерий Стьюдента" в других словарях:

    Критерий Стьюдента t-к - Критерий Стьюдента, t к. * крытэрый Ст’юдэнта, t к. * Student’s criterion or t c. or S. t test статистический критерий существенности разности между сравниваемыми средними. Определяется отношением этой разности к ошибке разности: При значениях t… … Генетика. Энциклопедический словарь

    T критерий Стьюдента общее название для класса методов статистической проверки гипотез (статистических критериев), основанных на сравнении с распределением Стьюдента. Наиболее частые случаи применения t критерия связаны с проверкой равенства… … Википедия

    критерий Стьюдента - Stjūdento kriterijus statusas T sritis augalininkystė apibrėžtis Skirtumo tarp dviejų vidurkių patikimumo rodiklis, išreiškiamas skirtumo ir jo paklaidos santykiu. atitikmenys: angl. Student’s test rus. критерий Стьюдента … Žemės ūkio augalų selekcijos ir sėklininkystės terminų žodynas

    критерий Стьюдента - Статистический критерий, в котором, в предположении нулевой гипотезы, используемая статистика соответствует t распределению (распределению Стьюдента). Примечание. Вот примеры применения этого критерия: 1. проверка равенства среднего из… … Словарь социологической статистики

    КРИТЕРИЙ СТЬЮДЕНТА - Биометрический показатель достоверности разницы (td) между средними значениями двух сравниваемых между собой групп животных (M1 и М2) по какому либо признаку. Достоверность разницы определяется по формуле: Полученное значение td сравнивается с… … Термины и определения, используемые в селекции, генетике и воспроизводстве сельскохозяйственных животных

    КРИТЕРИЙ СТЬЮДЕНТА - оценивает близость двух средних значений с точки зрения отнесения или не отнесения ее к случайной (при заданном уровне значимости), отвечая на вопрос о том, отличаются ли средние значения статистически достоверно друг от друга }

Загрузка...