Статистическая проверка гипотез excel

  • Редакция Кодкампа

17 авг. 2022 г.
читать 2 мин


В статистике проверка гипотезы используется для проверки некоторого предположения о параметре совокупности .

Существует множество различных типов проверки гипотез, которые вы можете выполнять в зависимости от типа данных, с которыми вы работаете, и цели вашего анализа.

В этом руководстве объясняется, как выполнять следующие типы проверок гипотез в Excel:

  • Один образец t-критерия
  • Два выборочных t-теста
  • Парные выборки t-критерий
  • Z-тест одной пропорции
  • Z-тест с двумя пропорциями

Давайте прыгать!

Пример 1: один образец t-критерия в Excel

Одновыборочный t-критерий используется для проверки того, равно ли среднее значение совокупности некоторому значению.

Например, предположим, что ботаник хочет знать, равна ли средняя высота определенного вида растений 15 дюймам.

Чтобы проверить это, она собирает случайную выборку из 12 растений и записывает их высоту в дюймах.

Она записала бы гипотезы для этого конкретного t-критерия одной выборки следующим образом:

  • H 0 : µ = 15
  • НА : мк ≠ 15

Обратитесь к этому руководству для пошагового объяснения того, как выполнить эту проверку гипотезы в Excel.

Пример 2. Двухвыборочный t-критерий в Excel

Двухвыборочный t-критерий используется для проверки того, равны ли средние значения двух совокупностей.

Например, предположим, что исследователи хотят знать, имеют ли два разных вида растений одинаковую среднюю высоту.

Чтобы проверить это, они собирают случайную выборку из 20 растений каждого вида и измеряют их высоту.

Исследователи записали бы гипотезы для этого конкретного двухвыборочного t-критерия следующим образом:

  • Н 0 : мк 1 = мк 2
  • H A : µ 1 ≠ µ 2

Обратитесь к этому руководству для пошагового объяснения того, как выполнить эту проверку гипотезы в Excel.

Пример 3: t-критерий парных выборок в Excel

Стьюдентный критерий для парных выборок используется для сравнения средних значений двух выборок, когда каждое наблюдение в одной выборке может быть сопоставлено с наблюдением в другой выборке.

Например, предположим, что мы хотим знать, значительно ли влияет определенная учебная программа на успеваемость студента на конкретном экзамене.

Чтобы проверить это, у нас есть 20 учеников в классе, которые проходят предварительный тест. Затем каждый из студентов участвует в учебной программе в течение двух недель. Затем учащиеся пересдают пост-тест аналогичной сложности.

Мы бы записали гипотезы для этого конкретного двухвыборочного t-критерия следующим образом:

  • H 0 : µ до = µ после
  • H A : µ до ≠ µ после

Обратитесь к этому руководству для пошагового объяснения того, как выполнить эту проверку гипотезы в Excel.

Пример 4: Z-тест одной пропорции в Excel

Z-критерий одной пропорции используется для сравнения наблюдаемой пропорции с теоретической.

Например, предположим, что телефонная компания утверждает, что 90% ее клиентов удовлетворены их услугами.

Чтобы проверить это утверждение, независимый исследователь собрал простую случайную выборку из 200 клиентов и спросил их, довольны ли они своим сервисом.

Мы бы записали гипотезы для этого конкретного двухвыборочного t-критерия следующим образом:

  • Н 0 : р = 0,90
  • НА : р ≠ 0,90

Обратитесь к этому руководству для пошагового объяснения того, как выполнить эту проверку гипотезы в Excel.

Пример 5: Z-тест для двух пропорций в Excel

Z-критерий двух пропорций используется для проверки разницы между двумя пропорциями населения.

Например, предположим, что руководитель школьного округа утверждает, что процент учащихся, предпочитающих шоколадное молоко обычному молоку в школьных столовых, одинаков для школы 1 и школы 2.

Чтобы проверить это утверждение, независимый исследователь получает простую случайную выборку из 100 учеников из каждой школы и опрашивает их об их предпочтениях.

Мы бы записали гипотезы для этого конкретного двухвыборочного t-критерия следующим образом:

  • Н 0 : р 1 = р 2
  • Н А : п 1 ≠ п 2

Обратитесь к этому руководству для пошагового объяснения того, как выполнить эту проверку гипотезы в Excel.


Здесь даны ссылки на статьи о проверке статистических гипотез о среднем значении и дисперсии распределения. Также рассмотрены двухвыборочный

z

-тест,

t

-тест и

F

-тест.


Статистическая гипотеза

– это некое утверждение о неизвестных параметрах распределения. В зависимости от оцениваемого параметра распределения и условий задачи, в процедуре

проверки гипотез

используются различные

эталонные распределения

:

стандартное нормальное распределение

,

t-распределение

,

распределение ХИ-квадрат

,

F-распределение

.

Ниже приведен перечень статей, в которых рассматриваются различные

проверки гипотез

.

Одновыборочные критерии

  • Проверка гипотез о равенстве среднего значения распределения (дисперсия известна)
  • Проверка гипотез о равенстве среднего значения распределения (дисперсия НЕИЗВЕСТНА)
  • Проверка гипотез о дисперсии нормального распределения

Двухвыборочные критерии

  • Двухвыборочный z-тест для средних
  • Двухвыборочный t-тест для средних (с одинаковыми дисперсиями)
  • Двухвыборочный t-тест для средних (с разными дисперсиями)
  • Парный двухвыборочный t-тест для средних
  • Двухвыборочный F-тест для дисперсии

Другие критерии

  • Критерий независимости хи-квадрат
  • Критерий согласия Пирсона хи-квадрат (

    простые

    и

    сложные гипотезы

    )


СОВЕТ

: О

доверительных интервалах

см. статью

Доверительные интервалы в MS EXCEL

.


In statistics, a hypothesis test is used to test some assumption about a population parameter.

There are many different types of hypothesis tests you can perform depending on the type of data you’re working with and the goal of your analysis.

This tutorial explains how to perform the following types of hypothesis tests in Excel:

  • One sample t-test
  • Two sample t-test
  • Paired samples t-test
  • One proportion z-test
  • Two proportion z-test

Let’s jump in!

Example 1: One Sample t-test in Excel

A one sample t-test is used to test whether or not the mean of a population is equal to some value.

For example, suppose a botanist wants to know if the mean height of a certain species of plant is equal to 15 inches.

To test this, she collects a random sample of 12 plants and records each of their heights in inches.

She would write the hypotheses for this particular one sample t-test as follows:

  • H0µ = 15
  • HAµ ≠15

Refer to this tutorial for a step-by-step explanation of how to perform this hypothesis test in Excel.

Example 2: Two Sample t-test in Excel

A two sample t-test is used to test whether or not the means of two populations are equal.

For example, suppose researchers want to know whether or not two different species of plants have the same mean height.

To test this, they collect a random sample of 20 plants from each species and measure their heights.

The researchers would write the hypotheses for this particular two sample t-test as follows:

  • H0µ1 = µ2
  • HAµ1 ≠ µ2

Refer to this tutorial for a step-by-step explanation of how to perform this hypothesis test in Excel.

Example 3: Paired Samples t-test in Excel

A paired samples t-test is used to compare the means of two samples when each observation in one sample can be paired with an observation in the other sample.

For example, suppose we want to know whether a certain study program significantly impacts student performance on a particular exam.

To test this, we have 20 students in a class take a pre-test. Then, we have each of the students participate in the study program for two weeks. Then, the students retake a post-test of similar difficulty.

We would write the hypotheses for this particular two sample t-test as follows:

  • H0µpre = µpost
  • HAµpre ≠ µpost

Refer to this tutorial for a step-by-step explanation of how to perform this hypothesis test in Excel.

Example 4: One Proportion z-test in Excel

one proportion z-test is used to compare an observed proportion to a theoretical one.

For example, suppose a phone company claims that 90% of its customers are satisfied with their service.

To test this claim, an independent researcher gathered a simple random sample of 200 customers and asked them if they are satisfied with their service.

We would write the hypotheses for this particular two sample t-test as follows:

  • H0: p = 0.90
  • HA: p ≠ 0.90

Refer to this tutorial for a step-by-step explanation of how to perform this hypothesis test in Excel.

Example 5: Two Proportion z-test in Excel

A two proportion z-test is used to test for a difference between two population proportions.

For example, suppose a superintendent of a school district claims that the percentage of students who prefer chocolate milk over regular milk in school cafeterias is the same for school 1 and school 2.

To test this claim, an independent researcher obtains a simple random sample of 100 students from each school and surveys them about their preferences.

We would write the hypotheses for this particular two sample t-test as follows:

  • H0: p1= p2
  • HA: p1 ≠ p2

Refer to this tutorial for a step-by-step explanation of how to perform this hypothesis test in Excel.

На чтение 4 мин. Просмотров 53 Опубликовано 06.06.2021

Проверка гипотез – одна из основных тем в области логической статистики. Есть несколько шагов для проверки гипотезы, и многие из них требуют статистических расчетов. Статистическое программное обеспечение, такое как Excel, можно использовать для проверки гипотез. Мы увидим, как функция Excel Z.TEST проверяет гипотезы о неизвестном среднем значении совокупности.

Содержание

  1. Условия и предположения
  2. Структура проверки гипотез
  3. Функция Z.TEST
  4. Примечания и предупреждения
  5. Пример

Условия и предположения

Начнем формулируя предположения и условия для этого типа проверки гипотез. Для вывода о среднем мы должны иметь следующие простые условия:

  • Выборка представляет собой простую случайную выборку.
  • Размер выборки невелик по сравнению с генеральной совокупностью. Обычно это означает, что размер генеральной совокупности более чем в 20 раз превышает размер выборки.
  • Изучаемая переменная имеет нормальное распределение.
  • Стандартное отклонение генеральной совокупности известно .
  • Среднее значение для генеральной совокупности неизвестно.

Маловероятно, что все эти условия будут выполнены на практике. Однако эти простые условия и соответствующая проверка гипотезы иногда встречаются на ранних этапах статистического класса. После изучения процесса проверки гипотез эти условия смягчаются, чтобы работать в более реалистичных условиях.

Структура проверки гипотез

Рассматриваемая нами конкретная проверка гипотез имеет следующую форму:

  1. Сформулируйте нулевую и альтернативную гипотезы.
  2. Рассчитайте статистику теста, которая представляет собой z -счет.
  3. Рассчитайте p-значение, используя нормальное распределение. В этом случае p-значение представляет собой вероятность получения не менее экстремальной, чем наблюдаемая статистика теста, при условии, что нулевая гипотеза верна.
  4. Сравните p-значение с уровнем значимости, чтобы определить отвергать или не отвергать нулевую гипотезу.

Мы видим, что шаги два и три требуют больших вычислительных ресурсов по сравнению с двумя шагами один и четыре. Функция Z.TEST выполнит эти вычисления за нас.

Функция Z.TEST

Функция Z.TEST делает все расчетов из шагов два и три выше. Он выполняет большую часть обработки чисел для нашего теста и возвращает p-значение. В функцию можно ввести три аргумента, каждый из которых отделяется запятой. Ниже объясняются три типа аргументов для этой функции.

  1. Первый аргумент для этой функции – это массив образцов данных. Мы должны ввести диапазон ячеек, который соответствует расположению выборки данных в нашей электронной таблице.
  2. Второй аргумент – это значение μ, которое мы проверяем в наших гипотезах. Итак, если наша нулевая гипотеза H 0 : μ = 5, то мы должны ввести 5 для второго аргумента.
  3. Третий аргумент – это значение известное стандартное отклонение населения. Excel рассматривает это как необязательный аргумент.

Примечания и предупреждения

Следует отметить несколько моментов. об этой функции:

  • Значение p, выводимое функцией, одностороннее. Если мы проводим двусторонний тест, то это значение необходимо удвоить.
  • Односторонний вывод p-значения из функции предполагает, что выборочное среднее больше, чем значение μ, которое мы тестируем против. Если выборочное среднее меньше значения второго аргумента, то мы должны вычесть выходные данные функции из 1, чтобы получить истинное p-значение нашего теста.
  • Последний аргумент для Стандартное отклонение населения не является обязательным. Если он не введен, это значение автоматически заменяется в расчетах Excel на стандартное отклонение выборки. Когда это будет сделано, теоретически следует использовать t-тест.

Пример

Мы предполагаем, что следующие данные взяты из простой случайной выборки нормально распределенной совокупности с неизвестным средним и стандартным отклонением 3:

1, 2, 3, 3, 4 , 4, 8, 10, 12

При уровне значимости 10% мы хотим проверить гипотезу о том, что данные выборки взяты из генеральной совокупности со средним большим чем 5. Более формально мы имеем следующие гипотезы:

  • H 0 : μ = 5
  • H a : μ> 5

Мы используем Z. ТЕСТ в Excel, чтобы найти значение p для этой проверки гипотезы.

  • Введите данные в столбец в Excel. Предположим, это от ячейки A1 до A9.
  • В другую ячейку введите = Z.TEST (A1: A9,5,3)
  • Результат – 0,41207.
  • Поскольку наше значение p превышает 10%, мы не можем отклонить нулевую гипотезу.

Z.TEST Функция может использоваться для тестов с нижним хвостом, а также для двусторонних тестов. Однако результат не такой автоматический, как в этом случае. Другие примеры использования этой функции см. Здесь.

18

Министерство
образования и науки Украины

Севастопольский
национальный технический университет

«ВЫПОЛНЕНИЕ
ПРОВЕРКИ

СТАТИСТИЧЕСКИХ
ГИПОТЕЗ И

ДИСПЕРСИОННОГО
АНАЛИЗА

ПРИ
ПОМОЩИ
EXCEL»

МЕТОДИЧЕСКИЕ
УКАЗАНИЯ

к
лабораторной
работе

по дисциплинам
«Прикладная статистика»

для студентов
специальностей:

для студентов
специальностей:

7.050201
– «Менеджмент организаций»,

7.050104
– «Финансы»

7.050106
– «Учет и аудит»

7.050107
– «Экономика предприятия»

всех форм обучения

Севастополь

2007

УДК
681.5.015.:330.43

«Выполнение
проверки статистических гипотез и
дисперсионного анализа при помощи
Excel»
методические
указания к лабораторной работе
по дисциплине
«Прикладная статистика» для студентов
специальностей: 7.050201
– «Менеджмент организаций», 7.050104 –
«Финансы», 7.050106 – «Учет и аудит», 7.050107
– «Экономика предприятия» всех форм
обучения /
Сост. А.А.
Загорулько, А.Д. Горобец. – Севастополь:
Изд-во СевНТУ, 2007г. – 16с.

Целью
методических указаний является
закрепление теоретических знаний и
приобретение практических навыков по
темам «Проверка статистических гипотез»
и «Дисперсионный анализ» при решении
ситуаций с помощью Excel.
Методические
указания предназначены для студентов
экономических специальностей всех форм
обучения.

Методические
указания утверждены на заседании кафедры
менеджмента и экономико-математических
методов, (протокол № 7
от «16»
марта
2007г.)

Допущено
учебно-методическим центром СевНТУ в
качестве методических указаний

Рецензент:
Одинцова Т.М., канд. эконом. наук, доцент
кафедры «Финансы и кредит»

СОДЕРЖАНИЕ

1. Цель
работы…………………………………………………………………..4

2.Теоретическая
часть…………………………….………………………..4

2.1.
Проверка
статистических гипотез………………………………………4

2.2.
Проверка
статистических гипотез в
Excel………………………………..5

2.3.
Дисперсионный
анализ……………………………………………………..7

2.4.
Выполнение
дисперсионного анализа в Excel…………………………..8

3.Варианты
заданий………………………………………………………….12

3.1. Варианты заданий
по теме «Проверка статистических
гипотез»………………………………………………………………………12

3.2. Варианты заданий
по теме «Однофакторный дисперсионный
анализ»……………………………………………………………………….13

4. Содержание
отчета………………………………………………………..14

5. Контрольные
вопросы……………………………………………………14

Библиографический
список……………………………………………….15

Данные
методические указания предназначены
для закрепления теоретических знаний
и получения практических навыков
студентов при проверке статистических
гипотез и выполнении дисперсионного
анализа в Excel.

2. Теоретическая часть

2.1. Проверка статистических гипотез

Статистическая
гипотеза — некоторое предположение о
законе распределения случайной величины
или о параметрах этого закона в рамках
данной выборки.

Пример статистической
гипотезы: «генеральная совокупность
распределена по нормальному закону»,
«различие между дисперсиями двух выборок
незначимо» и т.д.

При аналитических
расчетах часто необходимо выдвигать и
проверять гипотезы. Проверка статистической
гипотезы осуществляется с помощью
статистического критерия в соответствии
со следующим алгоритмом:

1)
формулировка гипотезы. Гипотеза
формулируется в терминах различия
величин. Например, есть случайная
величина х и константа a. Они не равны
(арифметически), но нужно установить,
значимо ли статистически между ними
различие. Существует
два типа критериев:
а) двухсторонний
критерий вида: х
a;
б)
односторонний критерий вида: х<
a или х<
a.

Необходимо
отметить, что знаки >, <, = здесь
используются не в арифметическом, а в
«статистическом» смысле. Их необходимо
читать «значимо больше», «значимо
меньше», «различие незначимо».

2)
Установка закона распределения. Далее
необходимо установить или постулировать
закон распределения. Существуют также
критерии, которые не зависят от вида
распределения — так называемые
непараметрические критерии.

3)
Вычисление тестовой статистики. Тестовая
статистика — некоторая функция от
рассматриваемых величин, закон
распределения которой точно известен
и ее можно сравнить с табличным значением.

4)
Сравнение с табличным значением. Затем
тестовая статистика сравнивается с
табличным значением. Тестовая статистика
всегда зависит от доверительной
вероятности, и, в некоторых случаях, от
дополнительных параметров. Так, в
приведенном выше примере сравнения
двух дисперсий тестовая статистика
сравнивается с табличным значением
критерия Фишера («критическим» значением),
которое зависит от доверительной
вероятности и числа степеней свободы
дисперсий.

5)
Вывод. На основании сравнения делается
вывод о том, выполняется ли гипотеза
(например, значимо ли различие и т.д.).

2.2. Проверка статистических гипотез в Excel

Рассмотрим пример.

Туристическая фирма в среднем реализует
21 путевку в страны ближнего зарубежья
в день. Количество проданных путевок
за последнюю неделю составило: 17, 19, 25,
32, 27, 30, 28. Полагая, что уровень значимости
равен 5% определить:

— выполняет ли компания план по продаже
путевок в страны ближнего зарубежья;

— увеличился ли среднего ежедневного
объема продаж путевок за последнюю
неделю.

Для выполнения
проверки статистических гипотез в Excel
необходимо произвести расчеты и вычислить
значение критерия Стьюдента.

Решение.

На первом этапе
выдвигаются нулевая и альтернативная
гипотезы:

H0:

H1:
.

После чего необходимо определить
табличное значение критерия Стьюдента.
Для этого в меню «Вставка» выбирается
команда «Функция». Устанавливается
категория «Статистические» и выбирается
функция «СТЬЮДРАСПРОБР». Пример
заполнения окна для определения
табличного значения критерия Стьюдента
представлен на рисунке 1.

Рисунок 1 – Пример
заполнения окна для определения
табличного значения критерия Стьюдента

В
поле «Вероятность» вводится заданный
уровень значимости (),
а так как альтернативная гипотеза имеет
следующий вид: H1:
,
то необходимо применять двусторонний
тест. При использовании двустороннего
теста вместо значения

берется значение
/2
(для рассматриваемого примера
/2=0,025).

В
поле «Степени свободы» вводится значение,
равное n-1,
где n-
число элементов в выборке (для
рассматриваемого примера n-1=6).

В результате мы
определили, что табличное значение
критерия Стьюдента для данной задачи
равно 2,968.

Правило
принятия (отвержения) гипотезы: если
TR<-2,968
и TR>2,968,
то отвергается H0
и принимается H1.

Далее необходимо
выполнить следующие вычисления:

Вычисление
t
расчетного (TR)
производиться по следующей формуле:

,
(1)

.
(2)

Таблица 1 —
Промежуточные вычисления

17

-8,43

71,0649

19

-6,43

41,3449

25

-0,43

0,1849

32

6,57

43,1649

27

1,57

2,4649

30

4,57

20,8849

28

2,57

6,6049

185,7143

Таким
образом имеем:

==5,563

==2,11

На заключительном
этапе происходит принятие статистического
решения.

Так
как -2,968<TR<2,968,
тогда с
=0,05
гипотеза Н0
о равенстве
среднего значения количества проданных
путевок за день в размере 21 штуки
принимается. Следовательно, туристическая
компания
выполняет план по продаже путевок в
страны ближнего зарубежья.

При ответе на
второй вопрос задания нулевая и
альтернативная гипотеза будут иметь
вид:

H0:

H1:
.

Так
как альтернативная гипотеза имеет
следующий вид: H1:
,
то необходимо применять односторонний
тест. При использовании одностороннего
теста табличное значение критерия
Стьюдента определяется таким же образом,
как и для двустороннего теста, но в поле
«Вероятность» указывается значение

(для рассматриваемого примера
=0,05).
Таким образом, табличное значение
критерия Стьюдента для одностороннего
теста равно 2,446.

,
то принимается гипотеза H0
о равенстве
среднего значения количества проданных
путевок в размере 21 штуки в день при
=0,05.
Следовательно, нельзя говорить об
увеличении
среднего ежедневного объема продаж
путевок за последнюю неделю.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

Понравилась статья? Поделить с друзьями:

А вот еще интересные статьи:

  • Статистическая обработка данных в excel пример
  • Статистическая обработка результатов исследования excel
  • Статистическая обработка данных в excel практическая работа
  • Статистическая обработка результатов измерений в excel
  • Статистическая обработка данных в excel информатика

  • 0 0 голоса
    Рейтинг статьи
    Подписаться
    Уведомить о
    guest

    0 комментариев
    Старые
    Новые Популярные
    Межтекстовые Отзывы
    Посмотреть все комментарии