ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ «ШУЙСКИЙ ГОСУДАРСТВЕННЫЙ ПЕДАГОГИЧЕСКИЙ УНИВЕРСИТЕТ»
Кафедра математики и методики обучения Кафедра информационных технологий и методики обучения
Статистическая обработка экспериментальных данных
Методическое пособие
Шуя 2009
1
ББК |
Печатается по решению редакционно-издательского Совета ГОУ ВПО |
УДК |
«Шуйский государственный педагогический университет» |
М |
Авторы-составители: Завьялова О.А., Замогильнова Л.В.
Рецензент: к.ф.-м.н., доцент Кашицын А.С.
Статистическая обработка экспериментальных данных. Методическое пособие – Шуя: Изд-во «Весть» ГОУ ВПО «ШГПУ», 2009. – …..с.
Методическое пособие написано с целью оказания помощи студен там в овладении статистическими методами обработки экспериментальных данных. Доступно изложены основные понятия математической статистики, основы корреляционного и регрессионного анализа, элементы теории статистического вывода – проверка статистических гипотез. Изложение теоретического материала сопровождается достаточным количеством практических примеров и расчетов. Показана реализация простейших из методов в табличном процессоре Microsoft Excel for Windows.
Рекомендуется студентам заочного обучения всех специальностей, изучающих элементы теории вероятностей и математической статистики. Пособие может быть использовано и студентами дневного отделения для самостоятельной проработки отдельных разделов математической статистики.
@ ГОУ ВПО «Шуйский государственный педагогический университет», 2009.
2
СОДЕРЖАНИЕ |
||
Стр. |
||
1. |
Основные понятия математической статистики |
4 |
2. |
Числовые характеристики выборки |
10 |
3. |
Основы корреляционного и регрессионного анализа |
17 |
4. |
Понятие статистической гипотезы |
28 |
5. |
Статистические критерии |
29 |
6. |
Справочная информация по технологии работы в среде |
35 |
MS Excel |
||
7. |
Задачи для самостоятельного выполнения |
44 |
8. |
Литература |
46 |
3
I. Основные понятия математической статистики
1.1. Возникновение и развитие математической статистики
Издавна в каждом государстве соответствующими органами власти собирались сведения о числе жителей по полу, возрасту, занятости в различных сферах труда, наличии различных воинов, вооружения, денежных средств, орудий труда, средств производства и т.д. Все эти и подобные им данные называются статистическими. С развитием государства и международных отношений возникла необходимость анализа статистических данных, их прогнозирование, обработка, оценка достоверности основанных на их анализе выводов и т.п. К решению таких задач стали привлекаться математики. Таким образом, в математике сформировалась новая область — математическая статистика, изучающая общие закономерности статистических данных или явлений и взаимосвязи между ними.
Сфера применения математической статистики распространилась во многие, особенно экспериментальные, науки. Так появились экономическая статистика, медицинская статистика, биологическая статистика, статистическая физика и т.д. Использование персональных компьютеров увеличивает возможность применения математической статистики в различных сферах деятельности человека. Для этого имеются статистические пакеты обработки данных на компьютере Statistica, Stadia, SPSS и др. Остановимся на некоторых основных понятиях математической статистики.
1.2. Статистические данные
В настоящее время под термином «статистические данные» понимают все собранные сведения, которые в дальнейшем подвергаются статистической обработке. В различной литературе их еще называют: переменные, варианты, величины, даты и т.д. Все статистические данные можно разделить на:
качественные, труднодоступные для измерения (имеется, не имеется; больше, меньше; сильно, слабо; красный, черный; мужской, женский и т.д.),
и количественные, которые можно измерить и представить в виде числа общих мер
(2 кг, 3 м, 10 раз, 15 с и т.д.);
точные, величина или качество которых не вызывают сомнений (в группе 6 человек,
5столов, деревянный, металлический, мужской, женский и т.д.),
иприближенные, величина или качество которых вызывает сомнение (все измерения: рост 170 см, вес 56 кг, результат бега на 100 м — 10,3 с и т.д.; близкие понятия
— синий, голубой; мокрый, влажный и т.д.);
определенные (детерминированные), причины появления, не появления или изменения которых известны (2 + 3 = 5, подброшенный вверх камень обязательно будет иметь вертикальную скорость, равную 0 и т.д.),
и случайные, которые могут появляться и не появляться или не все причины изменения которых известны (пойдет дождь или нет, родится девочка или мальчик, команда выиграет или нет, результат в беге на 100 м будет равен 12,2 с, принятая нагрузка окажет положительное влияние на спортивный результат или отрицательное). В
4
большинстве случаев в экспериментальных исследованиях мы имеем дело с приближенными случайными данными.
1.3. Генеральная и выборочные совокупности, статистические признаки
Общее свойство, присущее нескольким статистическим данным, называют их статистическим признаком. Например, рост игроков команды, результат бега на 100 м, принадлежность к виду спорта, частота сердечных сокращений и т.д.
Статистической совокупностью называют несколько статистических данных, объединенных в группу хотя бы одним статистическим признаком. Например, 7.50, 7.30, 7.21, 7.77 — результаты прыжка в длину в метрах у одного спортсмена; 10, 12, 15, 11, 11
— результаты подтягивания на перекладине пяти студентов и т.д. Число данных в статистической совокупности называют ее объемом и обозначают n . Различают следующие совокупности:
бесконечные — n (масса планет Вселенной, число молекул и т.д.); конечные — n — конечное число;
большие — n > 30; малые — n 30;
генеральные — содержащие все данные, обусловленные постановкой задачи; выборочные — части генеральных совокупностей.
Например, пусть рост студентов 17-22 лет в РФ — генеральная совокупность, тогда рост студентов ШГПУ, всех студентов города Шуя или студентов II курса — выборки.
Выборка должна быть представительной (репрезентативной), чтобы по ней можно было судить о генеральной совокупности. Репрезентативность означает, что объекты выборки достаточно хорошо представляют генеральную совокупность.
Предупреждение систематических ошибок выборочного наблюдения достигается в результате применения научно обоснованных способов формирования выборочной совокупности, в зависимости от которых выборка может быть:
собственно-случайной;
механической;
типической;
серийной;
комбинированной.
Втабличном процессоре Microsoft Excel реализована собственно-случайная выборка (выборка формируется на основе генератора случайных чисел). Суть такой выборки
состоит в том, что выборочная совокупность образуется в результате случайного отбора отдельных единиц из генеральной совокупности. Принцип случайности и предупреждает возникновение систематических ошибок выборки.
1.4. Случайные события и величины. Виды представления статистических данных
Эксперимент (испытание) – осуществление какого-либо определенного комплекса условий, который может быть произведен сколь угодно большое число раз.
Результаты каждого испытания характеризуются наступлением (или не наступлением) каких-либо событий или измеренными значениями исследуемых признаков.
5
Отдельные числовые значения исследуемого признака называются вариантами. Если при статистической обработке совокупности безразлично, в какой
последовательности записывать данные, то бывает удобным расположить эти данные (варианты) в соответствии с их значением либо по возрастанию xi ~ 2, 3, 3, 5, 5, 6, 6, 6, 6, 7 (неубывающая совокупность), либо по убыванию xi ~ 7, 6, 6, 6, 6, 5, 5, 3, 3, 2 (невозрастающая совокупность). Этот процесс называется ранжированием. А место каждой варианты в ранжированном ряду называется рангом.
Число m наступлений события А в серии из n испытаний или число испытаний, в которых наблюдалось какое-то значение признака, называется абсолютной частотой этого события (варианты).
Отношение абсолютной частоты m к общему числу испытаний n называется относительной частотой события А (варианты). Очевидно, что 0 mn 1.
Относительную частоту события А (варианты) будем называть вероятностью события А (варианты): Р(А)=m/n. Например, вероятность появления варианты 6 в приведенной выше совокупности значений 4/10, а варианты 7 – 1/10.
Если Р(А)=1, то событие А называется достоверным, если Р(А)=0, то невозможным, если 0<P(A)<1, то событие А называют случайным.
Случайной называется переменная величина, принимающая в зависимости от исхода испытания то или иное числовое значение.
Случайные величины могут быть дискретные и непрерывные. Дискретные случайные величины принимают изолированные значения.
Случайная величина называется непрерывной случайной величиной, если ее
значения принадлежат числовому промежутку.
Чтобы дать полное математическое описание случайной величине, нужно указать множество ее значений и соответствующее случайной величине распределение вероятностей на этом множестве.
Один из основных способов задания распределения случайной величины – статистический ряд распределения.
Статистический ряд распределения представляет собой упорядоченное распределение единиц изучаемой совокупности по определенному варьирующему признаку. Он характеризует структуру исследуемого явления, позволяет судить об однородности совокупности, границах ее изменения, закономерностях развития наблюдаемого объекта. Построение рядов распределения является составной частью сводной обработки статистической информации.
В зависимости от признака, положенного в основу образования ряда распределения, различают атрибутивные (качественные) и вариационные (количественные) ряды распределения. Вариационные в зависимости от характера вариации признака делятся на дискретные и интервальные ряды распределения.
Процесс группировки в интервальный ряд, как правило, состоит из 4-х шагов.
1 шаг состоит в определении числа интервалов, при этом можно пользоваться следующей таблицей
Таблица 1. Выбор числа интервалов в зависимости от объема выборки
Объем выборки, n |
Число интервалов, L |
25-40 |
5-6 |
40-60 |
6-8 |
60-100 |
7-10 |
100-200 |
8-12 |
Более 200 |
10-15 |
2 шаг состоит в определении размаха варьирования (R) результатов: R=Xmax-Xmin
6
3 шаг состоит в нахождении ширины интервала группировки h по формуле h=R/L. В случае получения дробной величины для удобства расчетов эту величину можно округлить, но в большую сторону.
4 шаг состоит в том, что по h строятся интервалы, содержащие выборочные значения.
Удобнее всего ряды распределения анализировать с помощью их графического изображения, позволяющего судить о форме распределения данных. Для изображения дискретных вариационных рядов используется полигон распределения, для изображения интервальных вариационных рядов – гистограммы.
При построении полигона распределения в прямоугольной системе координат по оси абсцисс в одинаковом масштабе откладываются ранжированные значения варьирующего признака, а по оси ординат наносится шкала частот (или частостей; частость – частота, выраженная в долях единицы или в % к итогу). Для построения полигона распределения используется мастер диаграмм Microsoft Excel (режим «График»).
Например, по результатам выполнения контрольной работы можно построить полигон распределения данных
Число оценок
35 |
|||
30 |
|||
25 |
|||
20 |
|||
Ряд1 |
|||
15 |
|||
10 |
|||
5 |
|||
0 |
|||
5 |
4 |
3 |
2 |
Оценка |
Рис.1.1 Полигон распределения
Для построения гистограммы используется мастер диаграмм Microsoft Excel (режим «Гистограмма»). При построении гистограммы на оси абсцисс откладываются значения интервалов, а частоты изображаются прямоугольниками, построенными на соответствующих интервалах.
Например, для результатов в беге на 100 м (в сек) гистограмма имеет вид
Число студентов
30 |
|
25 |
|
20 |
|
15 |
Ряд1 |
10 |
|
5 |
|
0 |
|
13,5-14,5 14,5-15,5 15,5-16,5 16,5-17,5 |
|
Интервалы |
рис 1.2. Гистограмма распределения данных На практике нередко возникает потребность в преобразовании рядов
распределения в кумулятивные ряды, которые строятся по накопленным частотам. Например,
7
накопленная частость
1,2 |
|
1 |
|
0,8 |
|
0,6 |
Ряд1 |
0,4 |
|
0,2 |
|
0 |
|
13,5-14,5 14,5-15,5 15,5-16,5 16,5-17,5 |
|
интервалы |
Рис.2. График накопленных частостей (кумулята)
При задании закона распределения непрерывной случайной величины используют понятие функции распределения случайной величины.
Функцией распределения случайной величины Х называется функция F(x),
задающая вероятность того, что случайная величина X принимает значение, меньшее x, то есть F(x)=P(X<x). Второй способ задания непрерывной случайной величины – дифференциальная функция распределения или плотность распределения: f (x) F (x) .
График функции f(x) называется кривой распределения. Кривая распределения, выражающая общую закономерность данного типа распределения, называется теоретической кривой распределения.
В статистике широко используются такие теоретические распределения как нормальное распределение (см.п.2.3), биномиальное, распределение Пуассона и др.
Полигон и кумулята дают начальное представление о функции и плотности распределения случайной величины. При этом полигон можно рассматривать в качестве статистического аналога плотности распределения, а кумуляту – в качестве статистического аналога функции распределения.
Пример 1. В ходе опроса 30 студентов было выявлено, сколько времени ежедневно (час) они затрачивают на подготовку к занятиям. Получены следующие данные
(варианты): 2,3,4,2,4,3,3,3,4,2,2,3,4,3.5,4,3.5,4,2.5,4,3.5,4,4,5,4,3.5,4,3,4,4,2.5
Представить этот ряд данных в виде таблицы абсолютных и относительных частот. Построить полигон относительных частот полученных значений.
Решение.
Абсолютная частота варианты m – число повторений варранты в полученном ряду, например, абсолютная частота числа 3 – это 6. Отношение абсолютной частоты m к
общему числу полученных данных n называется относительной варианты ( 0 |
m |
1 ). |
||||||||||
n |
||||||||||||
Относительная частота варианты 3 равна 6/30=0,2. |
||||||||||||
Требуемые числовые данные представим в виде таблицы |
||||||||||||
Затрачиваемое время |
2 |
2.5 |
3 |
3.5 |
4 |
5 |
||||||
(час) (Xi) |
||||||||||||
8 |
||||||||||||
Количество студентов |
4 |
2 |
6 |
4 |
13 |
1 |
(Ki) |
||||||
Относительная частота |
0,13 |
0,07 |
0,2 |
0,13 |
0,44 |
0,03 |
Накопленная |
0,13 |
0,2 |
0,4 |
0,53 |
0,97 |
1 |
относительная частота |
||||||
Полигон относительных частот |
||||||
частота |
0,5 |
|||||
0,4 |
||||||
Относительная |
0,3 |
|||||
Ряд1 |
||||||
0,2 |
||||||
0,1 |
||||||
0 |
||||||
2 |
2,5 |
3 |
3,5 |
4 |
5 |
|
Значения вариант |
Рис.3. Полигон относительных частот Пример 2. Известны 20 вариант– результаты прыжка в высоту (см). Построить
интервальный ряд распределения данных и гистограмму.
Хi ~170,174,175,177,177,178,178,179,180,182,187,189,189,189,190,191,191,192,193,194.
(далее в тексте для этих данных будут вычислены все основные статистические характеристики)
Решение.
Так как значений 20, возьмем число интервалов равным 4. Размах варьирования R=194-170=24; ширина интервала группировки h=24/4=6.
Интервальный ряд распределения имеет вид
Номер |
Границы интервала |
Серединные |
Частота |
Накопленная |
интервала |
значения |
частота |
||
1. |
170-176 |
173 |
3 |
3 |
2. |
176-182 |
179 |
6 |
9 |
3. |
182-188 |
185 |
2 |
11 |
4. |
188-194 |
191 |
9 |
20 |
Гистограмма имеет вид:
число значений
10 |
|||
9 |
|||
8 |
|||
7 |
|||
6 |
|||
5 |
Ряд1 |
||
4 |
|||
3 |
|||
2 |
|||
1 |
|||
0 |
|||
173 |
179 |
185 |
191 |
серединные значения |
Рис.4
9
2. Числовые характеристики выборки
Вариационные ряды и графики эмпирических распределений дают наглядное представление о том, как варьирует признак в выборке. Но они недостаточны для полной характеристики выборки. Рассмотрим обобщающие числовые характеристики выборки, которые дают количественное представление об эмпирических данных и позволяют сравнивать их между собой.
Такими характеристиками являются –
Характеристики положения;
Характеристики рассеяния.
2.1.Характеристики положения
1.Средним арифметическим называется частное от деления суммы всех значений вариант рассматриваемой совокупности на их число (n):
(1).
Например, для совокупности данных 5, 4, 3, 5, 4, 4, 3, 4 среднее равно
(5+4+3+5+4+4+3+4)/8=4.
Среднее арифметическое обладает следующими свойствами:
а) измеряется в тех же единицах, что и основные варианты;
б) если каждое число совокупности уменьшить (увеличить) на одно и то же число, то ее среднее уменьшится (увеличится) на это же число;
в) если каждое число совокупности увеличить (уменьшить) в несколько раз, то ее среднее увеличится (уменьшится) в такое же число раз;
г) сумма отклонений статистических данных совокупности от их точного среднего всегда равна нулю: .
Для сгруппированных данных х1,х2,…хk среднее Х вычисляется по формуле:
= |
n1* x1 n2* x2 … nk * xk |
(2), где n1, n2,…nk – частоты соответствующих интервалов, |
||||||||||||
Х |
||||||||||||||
n1 n2 … nk |
||||||||||||||
х1,…хk – серединные значения интервалов. |
||||||||||||||
Пример |
1. Вычислить среднее |
значение |
для данных, представленных |
|||||||||||
интервальным рядом (данные примера 2,п.1.4) |
||||||||||||||
Номер |
Границы интервала |
Серединные |
Частота |
Накопленная |
||||||||||
интервала |
значения |
частота |
||||||||||||
1. |
170-176 |
173 |
3 |
3 |
||||||||||
2. |
176-182 |
179 |
6 |
9 |
||||||||||
3. |
182-188 |
185 |
2 |
11 |
||||||||||
4. |
188-194 |
191 |
9 |
20 |
||||||||||
Решение. |
Х =(3*173+6*179+2*185+9*191)/20=184,1 |
10
Статистическая значимость в экспериментах и анализе данных
Добро пожаловать в 11-ю часть серии статей о статистике в электротехнике. До сих пор мы рассматривали как высокоуровневые определения, так и конкретные примеры статистических концепций, полезных для инженера-практика. Чтобы узнать больше о том, что мы рассмотрели, ознакомьтесь со статьями, перечисленными в меню с оглавлением выше, над статьей.
Статистическая значимость: туманная концепция?
Любой, кто обычно читает исследовательские статьи, часто сталкивается со «статистической значимостью», часто сопровождаемой загадочной ссылкой на p
Статистическая значимость – это базовый инструмент, который помогает исследователям понять, что на самом деле показали их эксперименты и их данные, и помогает коллегам решить, заслуживают ли сообщенные результаты дальнейшего рассмотрения или исследования.
В то же время статистическая значимость – это несколько туманное понятие, которое легко неверно истолковать и которое вызвало немало споров в научном сообществе.
Фактически, не так давно три профессора опубликовали статью «комментарий» в журнале Nature, в которой рекомендовалось полностью отказаться от статистической значимости как основы для принятия или отклонения гипотезы – и им потребовалась всего одна неделя, чтобы найти 800 других ученых и исследователей, которые были готовы выразить формальное согласие с их позицией.
Что такое статистическая значимость?
Эксперимент начинается с нулевой гипотезы, которая утверждает, что нет никакой связи между двумя явлениями, для которых будут собираться данные. Если цель эксперимента состоит в том, чтобы найти или продемонстрировать какой-то тип взаимосвязи или влияние, нулевая гипотеза равносильна утверждению, что эксперимент «потерпел неудачу».
Статистическая значимость – это математический критерий, который мы можем использовать, чтобы решить, следует ли нам принять или отвергнуть нулевую гипотезу.
Статистически значимый результат на основе заранее определенного порога вероятности указывает на то, что мы должны отклонить нулевую гипотезу; другими словами, что-то действительно произошло (связь наблюдалась, было произведено влияние, связь существует), и поэтому эксперимент выявил что-то потенциально значимое или интересное.
Явления, управляемые случайными процессами, обычно приводят к нормальному распределению значений. Таким образом, общепринято представлять концептуальную нулевую гипотезу в виде гауссовой кривой, что означает, что это распределение наблюдений, которое мы ожидаем, когда одна экспериментальная переменная не зависит от другой экспериментальной переменной.
Рисунок 1 – Если мы предполагаем, что нулевая гипотеза верна, мы часто будем использовать гауссову кривую в качестве функции плотности вероятности, с помощью которой мы решаем, является ли результат статистически значимым.
Порог вероятности
Статистическая значимость основана на вероятности получения результата при предположении, что нулевая гипотеза верна. Предположим, что в ходе нашего эксперимента мы получили число x (это может быть что угодно: артериальное давление, доход от продаж, средний балл теста).
Обращаясь к функции плотности вероятности, связанной с нулевой гипотезой, мы можем определить, будет ли вероятность получения x или какого-либо другого числа, которое более маловероятно, чем x, менее 5% (p <0,05) или 1% ( p <0,01) или какой-либо другого порога (p <⍺, где ⍺ обозначает требуемый уровень значимости).
Таким образом, p-значение (p-value, p-уровень значимости, p-критерий) передает вероятность получения результата, равного или более экстремального, чем наблюдаемый результат, когда нет взаимосвязи между интересующими переменными.
Рисунок 2 – Гауссова кривая – это функция плотности вероятности, которая соответствует распределению значений, когда нулевая гипотеза верна. Мы вычисляем p-значение наблюдаемого результата путем интегрирования части этой функции плотности вероятности.
Если p-значение достаточно низкое, нет смысла продолжать предполагать, что между двумя переменными нет никакой связи. Таким образом, мы отвергаем нулевую гипотезу и утверждаем, что связь существует.
Интерпретация статистической значимости
Это же общее сообщение можно передать другими способами, которые могут оказаться полезными:
- p-значение – это вероятность того, что наши наблюдения являются чистой случайностью. Таким образом, если p = 0,05, существует 5%-ная вероятность того, что результат является случайным, и 95%-ная вероятность того, что это связано с условиями, которые мы создали в нашем эксперименте.
- p-значение – это вероятность того, что мы неправильно сделаем вывод о взаимосвязи между интересующими нас переменными. Таким образом, значение p, равное 0,05, означает, что на каждые 100 экспериментов, в которых мы вывели взаимосвязь, 95 из этих взаимосвязей действительно существовали, а 5 не существовали.
Толкование слова «значимость»
Большая путаница в отношении статистической значимости возникает из-за использования слова «значимость», которое в данном контексте ограничивается конкретным статистическим использованием и не совпадает со словом «значимость» в обычном языке.
Статистически значимые результаты не обязательно являются важными или значимыми результатами. Статистическая значимость не означает практической значимости, а также отсутствие статистической значимости не означает, что экспериментальные результаты не имеют практической ценности.
Уровень значимости
Чтобы установить статистическую значимость, мы должны сравнить p-значение с уровнем значимости, обозначенным как ⍺. Уровни значимости в некоторой степени произвольны и выбираются в соответствии с условиями заданной области. Как было указано выше, часто используются ⍺ = 0,05 и ⍺ = 0,01, хотя в некоторых случаях выбирается более высокое или гораздо более низкое значение.
Заключение
Несмотря на возможное неправильное использование статистической значимости и доказательства широко распространенной неверной интерпретации, она остается важным методом в исследованиях и экспериментах. Мы продолжим изучение этой темы в следующей статье.
Описательная статистика в Excel
8 1.3. Структуры данных Источники данных Первичные Вторичные Планирование и сбор данных Маркетинговые исследования Социологические опросы Проведение экспериментов на производстве Поиск в Internet Специальные издания и журналы Покупка готовых данных у специализирующихся компаний
Мнение эксперта
Знайка, самый умный эксперт в Цветочном городе
Если у вас есть вопросы, задавайте их мне!
Задать вопрос эксперту
4 Области применения анализа экспериментальных данных Менеджмент Экономика Медицина Социология Геология Контроль качества Концепция Шесть сигм система управления компанией или ее подразделениями на основе интенсивного использования методов анализа разнообразных данных о деятельности компании. Если же вы хотите что-то уточнить, я с радостью помогу!
1. Некоторые из методов математико-статистического анализа позволяют вычислять так называемые элементарные математические статистики, характеризующие выборочное распределение данных, например
Беликов С. А, Карпушенко И. С. Планирование эксперимента и статистическая обработка результатов измерений — 1. doc
- p-значение – это вероятность того, что наши наблюдения являются чистой случайностью. Таким образом, если p = 0,05, существует 5%-ная вероятность того, что результат является случайным, и 95%-ная вероятность того, что это связано с условиями, которые мы создали в нашем эксперименте.
- p-значение – это вероятность того, что мы неправильно сделаем вывод о взаимосвязи между интересующими нас переменными. Таким образом, значение p, равное 0,05, означает, что на каждые 100 экспериментов, в которых мы вывели взаимосвязь, 95 из этих взаимосвязей действительно существовали, а 5 не существовали.
147 Простейший адаптивный алгоритм подстройки параметров Линейная параметризация модели: На каждой итерации, например n и n-1, параметры модели находим из условия равенства выходов модели и объекта: Каждому уравнению в пространстве параметров соответствует своя линия
Содержание
- 1 Использование описательной статистики
- 1.1 Подключение «Пакета анализа»
- 1.2 Применение инструмента «Описательная статистика»
- 1.3 Помогла ли вам эта статья?
- 1.4 Статистические процедуры Пакета анализа
- 1.5 Статистические функции библиотеки встроенных функций Excel
Пользователи Эксель знают, что данная программа имеет очень широкий набор статистических функций, по уровню которых она вполне может потягаться со специализированными приложениями. Но кроме того, у Excel имеется инструмент, с помощью которого производится обработка данных по целому ряду основных статистических показателей буквально в один клик.
Этот инструмент называется «Описательная статистика». С его помощью можно в очень короткие сроки, использовав ресурсы программы, обработать массив данных и получить о нем информацию по целому ряду статистических критериев. Давайте взглянем, как работает данный инструмент, и остановимся на некоторых нюансах работы с ним.
Использование описательной статистики
Под описательной статистикой понимают систематизацию эмпирических данных по целому ряду основных статистических критериев. Причем на основе полученного результата из этих итоговых показателей можно сформировать общие выводы об изучаемом массиве данных.
В Экселе существует отдельный инструмент, входящий в «Пакет анализа», с помощью которого можно провести данный вид обработки данных. Он так и называется «Описательная статистика». Среди критериев, которые высчитывает данный инструмент следующие показатели:
- Медиана;
- Мода;
- Дисперсия;
- Среднее;
- Стандартное отклонение;
- Стандартная ошибка;
- Асимметричность и др.
Рассмотрим, как работает данный инструмент на примере Excel 2010, хотя данный алгоритм применим также в Excel 2007 и в более поздних версиях данной программы.
Подключение «Пакета анализа»
Как уже было сказано выше, инструмент «Описательная статистика» входит в более широкий набор функций, который принято называть Пакет анализа. Но дело в том, что по умолчанию данная надстройка в Экселе отключена. Поэтому, если вы до сих пор её не включили, то для использования возможностей описательной статистики, придется это сделать.
- Переходим во вкладку «Файл». Далее производим перемещение в пункт «Параметры».
- В активировавшемся окне параметров перемещаемся в подраздел «Надстройки». В самой нижней части окна находится поле «Управление». Нужно в нем переставить переключатель в позицию «Надстройки Excel», если он находится в другом положении. Вслед за этим жмем на кнопку «Перейти…».
- Запускается окно стандартных надстроек Excel. Около наименования «Пакет анализа» ставим флажок. Затем жмем на кнопку «OK».
После вышеуказанных действий надстройка Пакет анализа будет активирована и станет доступной во вкладке «Данные» Эксель. Теперь мы сможем использовать на практике инструменты описательной статистики.
Применение инструмента «Описательная статистика»
Теперь посмотрим, как инструмент описательная статистика можно применить на практике. Для этих целей используем готовую таблицу.
- Переходим во вкладку «Данные» и выполняем щелчок по кнопке «Анализ данных», которая размещена на ленте в блоке инструментов «Анализ».
- Открывается список инструментов, представленных в Пакете анализа. Ищем наименование «Описательная статистика», выделяем его и щелкаем по кнопке «OK».
- После выполнения данных действий непосредственно запускается окно «Описательная статистика».
В поле «Входной интервал» указываем адрес диапазона, который будет подвергаться обработке этим инструментом. Причем указываем его вместе с шапкой таблицы. Для того, чтобы внести нужные нам координаты, устанавливаем курсор в указанное поле. Затем, зажав левую кнопку мыши, выделяем на листе соответствующую табличную область. Как видим, её координаты тут же отобразятся в поле. Так как мы захватили данные вместе с шапкой, то около параметра «Метки в первой строке» следует установить флажок. Тут же выбираем тип группирования, переставив переключатель в позицию «По столбцам» или «По строкам». В нашем случае подходит вариант «По столбцам», но в других случаях, возможно, придется выставить переключатель иначе.
Выше мы говорили исключительно о входных данных. Теперь переходим к разбору настроек параметров вывода, которые расположены в этом же окне формирования описательной статистики. Прежде всего, нам нужно определиться, куда именно будут выводиться обработанные данные:
- Выходной интервал;
- Новый рабочий лист;
- Новая рабочая книга.
В первом случае нужно указать конкретный диапазон на текущем листе или его верхнюю левую ячейку, куда будет выводиться обработанная информация. Во втором случае следует указать название конкретного листа данной книги, где будет отображаться результат обработки. Если листа с таким наименованием в данный момент нет, то он будет создан автоматически после того, как вы нажмете на кнопку «OK». В третьем случае никаких дополнительных параметров указывать не нужно, так как данные будут выводиться в отдельном файле Excel (книге). Мы выбираем вывод результатов на новом рабочем листе под названием «Итоги».
Далее, если вы хотите чтобы выводилась также итоговая статистика, то нужно установить флажок около соответствующего пункта. Также можно установить уровень надежности, поставив галочку около соответствующего значения. По умолчанию он будет равен 95%, но его можно изменить, внеся другие числа в поле справа.
Кроме этого, можно установить галочки в пунктах «K-ый наименьший» и «K-ый наибольший», установив значения в соответствующих полях. Но в нашем случае этот параметр так же, как и предыдущий, не является обязательным, поэтому флажки мы не ставим.
После того, как все указанные данные внесены, жмем на кнопку «OK».
- После выполнения этих действий таблица с описательной статистикой выводится на отдельном листе, который был нами назван «Итоги». Как видим, данные представлены сумбурно, поэтому их следует отредактировать, расширив соответствующие колонки для более удобного просмотра.
- После того, как данные «причесаны» можно приступать к их непосредственному анализу. Как видим, при помощи инструмента описательной статистики были рассчитаны следующие показатели:
- Асимметричность;
- Интервал;
- Минимум;
- Стандартное отклонение;
- Дисперсия выборки;
- Максимум;
- Сумма;
- Эксцесс;
- Среднее;
- Стандартная ошибка;
- Медиана;
- Мода;
- Счет.
Если какие-то из вышеуказанных данных для конкретного вида анализа не нужны, то их можно удалить, чтобы они не мешали. Далее производится анализ с учетом статистических закономерностей.
Урок: Статистические функции в Excel
Как видим, с помощью инструмента «Описательная статистика» можно сразу получить результат по целому ряду критериев, которые в ином случае рассчитывались с применением отдельно предназначенной для каждого расчета функцией, что заняло бы значительное время у пользователя. А так, все эти расчеты можно получить практически в один клик, использовав соответствующий инструмент — Пакета анализа.
Мы рады, что смогли помочь Вам в решении проблемы.
Задайте свой вопрос в комментариях, подробно расписав суть проблемы. Наши специалисты постараются ответить максимально быстро.
Помогла ли вам эта статья?
Да Нет
Сортировка данных в Excel
Таблицы Excel можно использовать для создания баз данных, т.е. совокупности определенным образом организованной информации. В таблицах хранят информацию о сотрудниках, клиентах, поставщиках различной продукции, ценах, книгах, фильмах, фотографиях и т.д. Как правило, для таких баз данных используется табличный способ организации. Они содержат большое количество данных, а с большим количеством данных не всегда просто работать. Для этого и необходима обработка данных.
- сортировку списков;
- выборку данных по определенным критериям;
- вычисление промежуточных сумм;
- вычисление средних значений;
- вычисление отклонений от определенного значения;
- построение сводных таблиц.
Как сделать фильтр в Excel
Базы данных очень удобны для хранения информации, но мы создаем их для того, чтобы получать нужную для нас справку, когда возникает подобная необходимость.
Например, нам нужно расписание железнодорожных поездов, которые отправляются в Москву в пятницу после четырех часов дня и т.п.
Поиск нужной информации осуществляется путем отбора строк, удовлетворяющих некоторому критерию. В большинстве случаев критерием отбора является равенство содержимого ячейки определенному значению.
Помимо сравнения на равенство, при отборе записей можно использовать и другие операции сравнения. Например, больше, меньше, больше или равно, меньше или равно. Использование этих операций позволяет сформулировать критерий запроса менее строго. Например, если требуется найти информацию о человеке, фамилия которого начинается с «Ку», то в качестве критерия можно использовать правило «содержимое ячейки Фамилия больше или равно Ку и содержимое ячейки Фамилия меньше Л».
Промежуточные итоги в Excel
Одним из методов обработки данных является подведение итогов. Пусть, например, есть таблица расходов. Для того чтобы узнать, сколько потрачено в каждом месяце, необходимо подвести итог за каждый месяц.
- 1. Выделить диапазон, содержащий данные и заголовки столбцов, в которых данные находятся. В рассматриваемом примере это вся таблица, на фото представлена только ее часть.
- 2. На вкладке Данные -> Структура выбрать команду Промежуточный итог.
- 3. В появившемся диалоговом окне Промежуточные итоги в поле — При каждом изменении в:, требуется задать столбец, при изменении содержимого которого будет вычислена промежуточная сумма. В данном случае это Дата. В поле Операция выбрать операцию из списка, которую нужно выполнить над обрабатываемыми данными. В нашем случае это Сумма. В поле — Добавить итоги по:, установить флажок в том столбце, в котором находятся обрабатываемые данные.
Сводные таблицы Excel 2010
Сводная таблица позволяет выполнить более тонкий анализ данных, чем простое подведение итога. Что такое сводная таблица и как ее построить, рассмотрим на примере.
Пусть есть таблица, в которой находится информация о расходах.
Основными средствами анализа статистических данных в Excel являются статистические процедуры надстройки Пакет анализа (Analysis ToolРак) и статистические функции библиотеки встроенных функций. Основные сведения обо всех этих средствах имеются в электронной справочной системе Excel.
Однако качество описаний статистических процедур и функций, приведенных в этой системе, заставляет желать лучшего. Некоторые из этих описаний не очень понятны, в них имеются неточности, а подчас и просто ошибки (это относится как к англоязычному оригиналу, так и к русскому переводу). Эти недостатки с завидным постоянством повторяются и во многих пособиях по Excel. Найти необходимые пособия в интернете можно быстро если скачать бесплатно Амиго браузер с усовершенствованным поисковым алгоритмом.
Статистические процедуры Пакета анализа
Наиболее развитыми средствами анализа данных являются статистические процедуры Пакета анализа. Они обладают большими возможностями, чем статистические функции. С их помощью можно решать более сложные задачи обработки статистических данных и выполнять более тонкий анализ этих данных.
В Пакет анализа входят следующие статистические процедуры:
- генерация случайных чисел (Random number generation);
- выборка (Sampling);
- гистограмма (Histogram);
- описательная статистика (Descriptive statistics);
- ранги персентиль (Rank and percentile);
- двухвыборочный z-тест для средних (z-Test: Two Sample for Means);
- двухвыборочный t-тест для средних с одинаковыми дисперсиями (t-Test: Two-Sample Assuming Equal Variances);
- двухвыборочный t-тест для средних с различными дисперсиями (t-Test: Two-Sample Assuming Unequal Variances);
- парный двухвыборочный t-тест для средних (t-Test: Paired Two Sample for Means);
- двухвыборочный F-тест да я дисперсий (F-Test: Two Sample for Variances);
- коварнация (Covariance);
- корреляция (Correlation);
- рецессия (Regression);
- однофакторный дисперсионный анализ (ANOVA: Single Factor);
- двухфакторный дисперсионный анализ без повторений (ANOVA: Two Factor Without Replication);
- двухфакторный дисперсионный анализ с повторениями (ANOVA: Two Factor With Replication);
- скользящее среднее (Moving Average);
- экспоненциальное сглаживание (Exponential Smoothing);
- анализ Фурье (Fourier Analysis).
Для доступа к процедурам Пакета анализа необходимо в меню Сервис (Tools) щелкнуть указателем мыши на строке Анализ данных (Data Analysis). Откроется диалоговое окно с соответствующим названием, в котором перечислены процедуры статистического анализа данных (рис. 1).
Рис.1. Диалоговое окно Анализ данных
Для того чтобы запустить в работу нужную статистическую процедуру, нужно выделить ее указателем мыши и щелкнуть на кнопке ОК. На экране появится диалоговое окно вызванной процедуры. На рис. 2 для примера показано диалоговое окно процедуры Описательная статистика (Descriptive statistics).
Рис.2. Диалоговое окно процедуры Описательная статистика
Диалоговое окно каждой процедуры содержит элементы управления: поля ввода, раскрывающиеся списки, переключатели, флажки и т. п. Эти элементы позволяют задать нужные параметры используемой процедуры. Некоторые элементы управления имеют специфический характер, присущий одной процедуре или небольшой группе процедур. Назначение таких элементов управления будет рассмотрено при описании соответствующих процедур. Другие элементы управления присутствуют в диалоговых окнах почти всех статистических процедур.
К числу общих для большинства процедур элементов управления относятся:
- поле ввода Входной интервал (Input Range). В это поле вводится ссылка на диапазон, содержащий статистические данные, подлежащие обработке. Входной диапазон может быть столбцом пли группой столбцов (строкой или группой строк);
- переключатель Группирование (Grouped By). В том случае, когда входной диапазон представляет собой столбец или группу столбцов, переключатель устанавливается в положение по столбцам (Columns). Если же входной диапазон представляет собой строку или группу строк, то переключатель устанавливается в положение по строкам (Rows). Более точным названием этого переключателя было бы название Расположение;
- флажок Метки (Labels in First Row). Флажок устанавливается в тех случаях, когда первая строка (первый столбец) входного диапазона содержит заголовки. Если такие заголовки отсутствуют, флажок Метки не устанавливают. При этом Excel автоматически создает и выводит на экран стандартные названия для данных выходного диапазона (Столбец1, Столбец2,… или Строка 1. Строка2,…);
- переключатели Выходной интервал/Новый рабочий лист/Новая книга (Output Range/New Worksheet/New Workbook). Эти переключатели определяют место вывода таблицы, содержащей результаты реализации статистической процедуры. В группе может быть выбран только одни переключатель.
При выборе переключателя Выходной интервал таблица результатов решения выводится на тот же рабочий лист, на котором находятся исходные данные. Справа от переключателя открывается поле ввода, в которое надо ввести ссылку на левую верхнюю ячейку таблицы результатов. Если возникает опасность наложения таблицы результатов на уже заполненные ячейки, на экране появляется сообщение о такой опасности. В ответ на это сообщение пользователь должен разрешить удаление старых данных и вывод на их место новых.
В положении Новый рабочий лист открывается новый лист рабочей книги. На этот лист, начиная с ячейки А1, и выводится таблица результатов решения. Справа от переключателя имеется поле ввода, в которое в случае необходимости можно ввести имя нового рабочего листа. При выборе переключателя Новая рабочая книга открывается новая рабочая книга. На первый лист этой новой книги, начиная с ячейки А1, выводится таблица результатов решения.
Следует заметить, что результаты;, получаемые с помощью статистических процедур Пакета анализа, не имеют постоянной связи с исходными данными — в случае изменения исходных данных результаты решения автоматически не изменяются. В том случае, когда необходимо получить результаты, автоматически изменяющиеся вместе с исходными данными, нужно использовать подходящие статистические функции библиотеки встроенных функций.
Эффективным и очень удобным в использовании средством парного регрессионного анализа и анализа временных рядов является процедура Добавить линию тренда (Add Trendline), входящая в комплекс графических средств Excel.
Статистические функции библиотеки встроенных функций Excel
Табличный процессор Excel имеет библиотеку встроенных функции рабочего листа (Worksheet function). Одним из разделов этой библиотеки является раздел Статистические функции. В этот раздел входят 83 функции, предназначенные для решения некоторых наиболее востребованных задач теории вероятностей и математической статистики.
Аргументы статистических функций должны быть числами или ссылками на диапазоны, которые содержат числа Если аргумент, который является массивом или ссылкой, содержит тексты, логические значения или пустые ячейки, то такие значения игнорируются, однако ячейки с нулевыми значениями учитываются.
Когда в качестве какого-либо аргумента встроенной статистической функции введен текст, функция выдает сообщение об ошибке #ЗНАЧ! (#VALUE!). Если в качестве аргумента, который по определению должен быть целым числом, введено число не целое, Excel использует в качестве аргумента целую часть этот числа. Никакие сообщения об этом «несанкционированном округлении» на экран не выводятся.
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке «Файлы работы» в формате PDF
Введение
Теоретическиеметоды исследования в науке дают возможность раскрыть качественные характеристики изучаемых явлений. Эти характеристики будут полнее и глубже, если накопленный эмпирический материал подвергнуть количественной обработке. Однако проблема количественных измерений, в частности, в рамках психолого-педагогических исследований очень сложна. Эта сложность заключается, прежде всего, в субъективно-причинном многообразии педагогической деятельности и ее результатов, в самом объекте измерения, находящемся в состоянии непрерывного движения и изменения. Вместе с тем введение в исследование количественных показателей стало сегодня необходимым и обязательным компонентом получения объективных данных о результатах труда. С этой целью при исследовании проблем психологии применяются методы математической статистики. С их помощью решаются различные задачи: обработка фактического материала, получение новых, дополнительных данных, обоснование научной организации исследования и др.
Правильное применение статистики позволяет экспериментатору:
-
строить статистические предсказания;
-
обобщать данные эксперимента;
-
находить зависимость между экспериментальными данными;
-
строго обосновывать экспериментальные планы;
-
доказывать правильность и обоснованность используемых методических приемов и методов.
Нельзя забывать, однако, что сами по себе методы статистики – это только инструментарий, помогающий экспериментатору эффективно разбираться в сложном исследуемом материале. Наиболее важным при проведении любого эксперимента является четкая постановка задачи, тщательное планирование эксперимента, построение непротиворечивых гипотез.
Методы математической статистики в руках исследователя могут и должны быть мощным инструментом, позволяющим не только успешно лавировать в море экспериментальных данных, но и, прежде всего, способствовать становлению его объективного мышления.
Актуальность данного исследования означена востребованностью статистической обработки экспериментальных данных в психолого-педагогических исследованиях.
Цель: проведение регрессионного анализа статистических данных психологического эксперимента для выявления уровня враждебности школьников в зависимости от уровней обиды и подозрительности (диагностика состояния враждебности Басса-Дарки).
Объект исследования: процесс статистической обработки данных психологического эксперимента.
Предмет исследования: зависимость уровня враждебности от таких психологических факторов личности как обида и подозрительность.
Задачи:
-
Проанализировать научную, учебную, специальную литературу по теме исследования;
-
Изучить теоретические аспекты разновидностей регрессионного анализа;
-
Выявить методы и средства статистического анализа данных психологического эксперимента;
-
Обработать статистические данные с помощью специальных функций, встроенных в табличный процессор Excel;
-
Провести аппроксимацию данных проведенного эксперимента.
Для решения поставленных задач используются следующие методы:
-
Теоретические:
-
анализ литературы;
-
систематизация изученного материала;
-
обобщение.
-
Эмпирические:
-
наблюдение;
-
анкетирование(опрос).
Глава 1. Регрессионный анализ экспериментальных данных 1.1. Первичная обработка экспериментальных данных
Современные задачи планирования, управления, прогнозирования невозможно решать, не располагая достоверными статистическими данными и не используя статистические методы обработки этих данных. Стремление объяснить настоящее и заглянуть в будущее всегда было свойственно человечеству, а для решения этих задач применялись различные методы. Статистика при описании случайных явлений использует язык науки – математику. Это значит, что реальные ситуации заменяются вероятностными схемами и анализируются методами теории вероятностей.
Любые статистические данные всегда неполны и неточны, и другими быть не могут. Задача статистики заключается в том, чтобы дать обоснованные выводы о свойствах изучаемого явления, анализируя неполные и неточные данные. Статистика доказала, что умеет справляться с подобными проблемами.
Методы первичной статистической обработки результатов эксперимента применяются при обработке материалов психологических исследований для того, чтобы извлечь из тех количественных данных, которые получены в экспериментах, при опросе и наблюдениях, как можно больше полезной информации. В частности, в обработке данных, получаемых при испытаниях по психологической диагностике, это будет информация об индивидуально-психологических особенностях испытуемых.
Методами статистической обработки результатов эксперимента называются математические приемы, формулы, способы количественных расчетов, с помощью которых показатели, получаемые в ходе эксперимента, можно обобщать, приводить в систему, выявляя скрытые в них закономерности. Речь идет о таких закономерностях статистического характера, которые существуют между изучаемыми в эксперименте переменными величинами.
Все методы математико-статистического анализа условно делятся на первичные и вторичные. Первичными называют методы, с помощью которых можно получить показатели, непосредственно отражающие результаты производимых в эксперименте измерений. Соответственно под первичными статистическими показателями имеются в виду те, которые применяются в самих психодиагностических методиках и являются итогом начальной статистической обработки результатов психодиагностики. К первичным методам статистической обработки относят, например, определение выборочной средней величины, выборочной дисперсии, выборочной моды и выборочной медианы. Вторичными называются методы статистической обработки, с помощью которых на базе первичных данных выявляют скрытые в них статистические закономерности. В число вторичных методов обычно включают корреляционный анализ, регрессионный анализ, методы сравнения первичных статистик у двух или нескольких выборок.
Выборочное среднее (среднее арифметическое) как статистический показатель представляет собой среднюю оценку изучаемого в эксперименте психологического качества. Эта оценка характеризует степень его развития в целом у той группы испытуемых, которая была подвергнута психодиагностическому обследованию. Сравнивая непосредственно средние значения двух или нескольких выборок, можно судить об относительной степени развития у людей, составляющих эти выборки, оцениваемого качества.
Выборочное среднее значение ряда из n числовых значений обозначается и подсчитывается так:
(1.1)
Здесь — это данные (набор чисел), полученные в результате регистрации значений некоторой случайной величины. Этот набор чисел называется выборкой. Величины 1,2…n являются так называемыми индексами. — принятый в математике знак суммирования тех переменных величин, которые находятся справа от этого знака. Числа, стоящие над и под знаком называются пределамисуммирования и указывают наименьшее и наибольшее значения индекса суммирования, между которыми расположены его промежуточные значения.
В том случае, если отдельные значения повторяются, то выборочное среднее вычисляют по формуле:
(1.2)
в таком случае называют взвешенной средней, где — частоты повторяющихся значений.
При вычислении величины средней по таблице чисел используется следующая формула:
(1.3)
где — значения всех переменных, полученных в эксперименте, или все элементы таблицы; при этом индекс jменяется от 1 до p, где p — число столбцов в таблице, а индекс iменяется от 1 до n, где n – число испытуемых или число строк в таблице. Тогда — общая средняя всех элементов в таблице (анализируемой совокупности экспериментальных данных) и в общем случае .
Символическое обозначение удобно для обозначения конкретного элемента таблицы. Символ (двойная сумма) означает, что вначале осуществляется суммирование всех элементов по индексу i– т.е. по строкам, затем полученные суммы по столбцам – по индексу j.
Дисперсия – это среднее арифметическое квадратов отклонений значений переменной от ее среднего значения. Иначе, дисперсия, как статистическая величина, характеризует, насколько частные значения отклоняются от средней величины в данной выборке. Чем больше дисперсия, тем больше отклонения или разброс данных.
(1.4)
где n– объем выборки, i– индекс суммирования, — выборочное среднее.
Расчет дисперсии для таблицы чисел осуществляется по формуле:
(1.5)
где — значения всех переменных, полученных в эксперименте, или все элементы таблицы; — общее среднее арифметическое всех элементов таблицы; N – общее число всех элементов таблицы.
Иногда вместо дисперсии для выявления разброса частных данных относительно средней используют производную от дисперсии величину, называемую выборочное отклонение (стандартное):
(1.6)
Медианой называется значение изучаемого признака, которое делит выборку, упорядоченную по величине данного признака, пополам. Справа и слева от медианы в упорядоченном ряду остается по одинаковому количеству признаков. Можно дать второе определение, сказав, что медиана – это величина, по отношению к которой, по крайней мере 50% выборочных значений меньше нее и по крайней мере 50% — больше.
Мода – это количественное значение исследуемого признака, наиболее часто встречающееся в выборке.
Моду находят согласно следующим правилам:
1) В том случае, когда все значения в выборке встречаются одинаково часто, принято считать, что этот выборочный ряд не имеет моды. Например: 5, 5, 6, 6, 7, 7 — в этой выборке моды нет.
2) Когда два соседних (смежных) значения имеют одинаковую частоту и их частота больше частот любых других значений, мода вычисляется как среднее арифметическое этих двух значений. Например, в выборке 1, 2, 2, 2, 5, 5, 5, 6 частоты рядом расположенных значений 2 и 5 совпадают и равняются 3. Эта частота больше, чем частота других значений 1 и 6 (у которых она равна 1). Следовательно, модой этого ряда будет величина, равная 3,5.
3) Если два несмежных (не соседних) значения в выборке имеют равные частоты, которые больше частот любого другого значения, то выделяют две моды. Например, в ряду 10, 11, 11, 11, 12, 13, 14, 14, 14, 17 модами являются значения 11 и 14. В таком случае говорят, что выборка является бимодальной.
Могут существовать и так называемые мультимодальные распределения, имеющие более двух вершин (мод).
4) Если мода оценивается по множеству сгруппированных данных, то для нахождения моды необходимо определить группу с наибольшей частотой признака. Эта группа называется модальной группой.
Иногда исходных частных первичных данных, которые подлежат статистической обработке, бывает довольно много, и они требуют проведения огромного количества элементарных арифметических операций. Для того чтобы сократить их число и вместе с тем сохранить нужную точность расчетов, иногда прибегают к замене исходной выборки частных эмпирических данных на интервалы. Интервалом называется группа упорядоченных по величине значений признака, заменяемая в процессе расчетов средним значением.
Обычно полученные в результате наблюдений результаты представляют собой набор чисел (выборку). Просматривая этот набор, как правило, трудно выявить какую-либо закономерность. Поэтому данные подвергают некоторой первичной обработке, целью которой является упрощение дальнейшего анализа.
Дальнейшие действия зависят от того, насколько много в выборке различных чисел. Если величина дискретна и случайна, то различных чисел немного; если же величина непрерывна и случайна, то, скорее всего, все числа окажутся различными.
Дискретный случай
Первый этап обработки выборки – это составление вариационного ряда. Его получают так – среди всех чисел отбирают все различные и располагают в порядке возрастания: , где
Следующий этап обработки выборки – составление дискретной таблицы частот:
… |
|||
… |
|||
… |
Здесь n – число всех измерений, — число измерений, в которых наблюдалось значение . Величины называются частотами, а величины — относительными частотами.
Графической иллюстрацией дискретной таблицы частот является столбиковая диаграмма (рис.1).
Рис.1 Столбиковая диаграмма
Непрерывный случай
Если число различных значений в выборке велико, вычислить частоту каждого их них не имеет большого смысла. Поэтому поступают следующим образом. Весь промежуток изменения значений выборки, от минимального до максимального, разбивают на интервалы. После этого подсчитывают число значений из выборки, попадающих в каждый интервал (частоты), а затем – относительные частоты. В результате получается интервальная таблица частот:
… |
|||
… |
|||
… |
Здесь n – число всех измерений, m – число интервалов, — количество чисел, приходящихся на i-й интервал, — относительная частота попадания в i-й интервал. Интервалы обычно берут одинаковой длины, хотя это и не обязательно.
Графической иллюстрацией интервальной таблицы частот является гистограмма (рис.2). Гистограмма представляет собой ступенчатую линию; основанием i-й ступеньки является интервал , а площадь этой ступеньки равна .
Рис.2 Гистограмма
Таким образом, рассмотрены методы первичной обработки результатов эксперимента, в результате которых имеющиеся «серые» результаты наблюдений преобразовываются для достижения большей наглядности.
1.2. Однофакторный регрессионный анализ
С помощью вторичных методов статистической обработки экспериментальных данных непосредственно проверяются, доказываются или опровергаются гипотезы, связанные с экспериментом. Эти методы, как правило, сложнее, чем методы первичной статистической обработки, и требуют от исследователя хорошей подготовки в области элементарной математики и статистики. Данную группу методов можно разделить на несколько подгрупп:
-
Регрессионный анализ;
-
Методы сравнения между собой двух или нескольких элементарных статистик (средних, дисперсий и т.п.), относящихся к разным выборкам;
-
Методы установления статистических взаимосвязей между переменными, например их корреляции друг с другом;
-
Методы выявления внутренней статистической структуры эмпирических данных (например, факторный анализ).
Регрессионный анализ – это метод математической статистики, позволяющий свести частные, разрозненные данные к их определенной внутренней взаимосвязи, которая по значению одной или нескольких переменных приблизительно оценивает вероятное значение другой переменной.
Регрессионный анализ устанавливает формы зависимости между случайной величиной y (зависимой) и значениями одной или нескольких переменных величин (независимых), причем значения последних считаются точно заданными. Такая зависимость определяется обычно некоторой математической моделью (уравнением регрессии), содержащей несколько неизвестных параметров. В ходе регрессионного анализа на основании выборочных данных находят оценки этих параметров, определяются статистические ошибки или границы доверительных интервалов и проверяется соответствие (адекватность) принятой математической модели экспериментальным данным.
Регрессия может быть однофакторной (парной) и многофакторной (множественной). Для простой (парной) регрессии в условиях, когда достаточно полно установлены причинно-следственные связи, можно использовать графическое изображение. При множественности причинных связей невозможно чётко разграничить одни причинные явления от других. В этом случае наиболее приемлемым способом определения зависимости (уравнения регрессии) является метод перебора различных уравнений, реализуемый с помощью компьютера.
После выбора вида регрессионной модели, используя результаты наблюдений зависимой переменной и факторов, нужно вычислить оценки (приближённые значения) параметров регрессии, а затем проверить значимость и адекватность модели результатам наблюдений.
Порядок проведения регрессионного анализа следующий:
-
выбор модели регрессии, что заключает в себе предположение о зависимости функций регрессии от факторов;
-
оценка параметров регрессии в выбранной модели методом наименьших квадратов;
-
проверка статистических гипотез о регрессии.
Графическое выражение регрессионного уравнения называют линиейрегрессии. Линия регрессии выражает наилучшие предсказания зависимой переменой (y) по независимым переменным (x,z). Эти независимые переменные, а их может быть много, носят название предикторов.
По характеру связи однофакторные уравнения регрессии подразделяются на:
а) линейные: , где x — экзогенная (независимая) переменная, y -эндогенная (зависимая, результативная) переменная, a, b параметры;
б) степенные: ;
в) показательные: и прочие.
Наиболее естественной с точки зрения единого метода оценки неизвестных параметров является модель регрессии, линейная относительно этих параметров:
(2.1)
(2.2)
где — свободные члены, — коэффициенты регрессии, или угловые коэффициенты, определяющие наклон линии регрессии по отношению к осям координат.
Линии регрессии пересекаются в точке , с координатами, соответствующими средним арифметическим значениям корреляционно связанных между собой переменных x и y.
Количественное представление связи (зависимости) между x и y (между yиx) и называется регрессионным анализом. Главная задача регрессионного анализа заключается в нахождении , и определения уровня значимости полученных аналитических выражений (2.1) и (2.2), связывающих между собой переменные x и y.
При этом коэффициенты регрессии показывают, насколько в среднем величина одной переменной изменяется при изменении на единицу меры другой. Коэффициент регрессии в уравнении (2.1) находится по формуле:
(2.3)
а коэффициент из уравнения (2.2) по формуле:
(2.4)
где — коэффициент корреляции между переменными X и Y;
— среднеквадратическое отклонение, подсчитанное для переменной x;
— среднеквадратическое отклонение, подсчитанное для переменной y.
Коэффициенты регрессии можно вычислить также без подсчета среднеквадратических отклонений по следующим формулам:
(2.5)
(2.6)
В том случае, если неизвестен коэффициент корреляции, коэффициенты регрессии можно вычислить по следующим формулам:
(2.7)
(2.8)
Сравнивая формулу для подсчета коэффициента корреляции Пирсона:
(2.9)
где — значения, принимаемые переменной x;
— значения, принимаемые переменной y;
— средняя по x;
— средняя по y.
С формулами (2.7), (2.8) видно, что в числе этих формул стоит одна и та же величина: . Последнее говорит о том, что величины и взаимосвязаны. Более того, зная две из них – всегда можно получить третью. Например, зная величины и , можно легко получить :
(2.10)
Эта формула очень важна, поскольку она позволяет по известным значениям коэффициентов регрессии и определить коэффициент корреляции, и, кроме того, сравнивая вычисления по формулам (2.9) и (2.10), можно поверить правильность расчета данного коэффициента. Как и коэффициент корреляции, коэффициенты регрессии характеризуют только линейную связь и при положительной связи имеют знак плюс, при отрицательной – знак минус.
В свою очередь свободные члены и в уравнениях регрессии вычисляются по формулам:
(2.11)
(2.12)
Вычисления по формулам (2.7), (2.8), (2.11) и (2.12) достаточно сложны, поэтому при расчетах коэффициентов регрессии используют, как правило, более простой метод. Он заключается в решении двух систем уравнений. При решении одной системы находятся величины и , и при решении другой — и .
Общий вид системы уравнений для нахождения величин и таков:
(2.13)
Общий вид системы уравнений для нахождения величин и таков:
(2.14)
В системах уравнений (2.13) и (2.14) используются следующие обозначения:
N – число элементов в переменной xили в переменной y,
— сумма всех элементов переменной x,
— сумма всех элементов переменной y,
— произведение всех элементов переменной yдруг на друга,
— произведение всех элементов переменной xдруг на друга,
— попарное произведение всех элементов переменной xна соответствующие элементы переменной y.
Для применения метода однофакторного регрессионного анализа необходимо соблюдать следующие условия:
-
Сравниваемые переменные x и yдолжны быть измерены в шкале интервалов или отношений.
-
Предполагается, что переменные x и yимеют нормальный закон распределения.
-
Число варьирующих признаков в сравниваемых переменных должно быть одинаковым.
Таким образом, можно сказать, что линейный регрессионный анализ заключается в подборе графика и его уравнения для набора наблюдений. В регрессионном анализе все признаки (переменные), входящие в уравнение, должны иметь непрерывную, а не дискретную природу.
1.3. Многофакторный регрессионный анализ
В общем случае, зависимость между несколькими переменными величинами выражают уравнением множественной регрессии (многофакторной), которая может быть как линейной, так и не линейной. В простейшем случае множественная линейная регрессия выражается уравнением с двумя независимыми переменными величинами x и z и имеет вид:
(3.1)
где y– зависимая переменная, a– свободный член, bи c– параметры уравнения (3.1).
Уравнение (3.1) может решаться относительно зависимой переменной z, тогда x и yявляются независимыми переменными, и уравнение множественной регрессии имеет следующий вид:
(3.2)
Можно решить уравнение (3.1) и относительно X, тогда Zи Yбудут независимыми переменными, и уравнение будет иметь следующий вид:
(3.3)
При проведении конкретных расчетов выбор зависимых и независимых переменных определяется планом эксперимента.
Решение уравнений (3.1), (3.2), (3.3) состоит в том, что находятся величины a, bи c на основе решения системы из трех уравнений.
Для решения уравнения (3.1) система имеет следующий вид:
(3.4)
Для решения уравнения (3.2) система будет выглядеть следующим образом:
(3.5)
Для решения уравнения (3.3) система будет иметь следующий вид:
(3.6)
В общем случае уравнение регрессии представляет собой сложный полином, описывающий зависимость сразу между несколькими переменными. Такое уравнение множественной регрессии имеет вид:
(3.7)
где и т.п. – интересующие психолога независимые переменные, а Y – зависимая переменная.
Для применения метода многофакторного регрессионного анализа необходимо соблюдать следующие условия:
-
Сравниваемые переменные должны быть измерены в шкале интервалов или отношений.
-
Предполагается, что переменные имеют нормальный закон распределения.
-
Число варьирующих признаков в сравниваемых переменных должно быть одинаковым.
Таким образом, качество полученного уравнения регрессии оценивают по степени близости между результатами наблюдений за показателем и предсказанными по уравнению регрессии значениями в заданных точках пространства параметров. Если результаты близки, то задачу регрессионного анализа можно считать решенной. В противном случае следует изменить уравнение регрессии (выбрать другую степень полинома или вообще другой тип уравнения) и повторить расчеты по оценке параметров.
Глава 2. Использование регрессионного анализа в интерпретации результатов методики изучения агрессии Басса-Дарки 2.1. Исследование уровня и рода враждебности школьников
Статистические методы раскрывают связи между изучаемыми явлениями. Однако необходимо твердо знать, что, как бы ни была высока вероятность таких связей, они не дают права исследователю признать их причинно-следственными отношениями.
Чтобы подтвердить или отвергнуть существование причинно-следственных отношений, исследователю зачастую приходится продумывать целые серии экспериментов. Если они будут правильно построены и проведены, то статистика поможет извлечь из результатов этих экспериментов информацию, которая необходима исследователю, чтобы либо обосновать и подтвердить свою гипотезу, либо признать ее недоказанной.
В работе с подростковой аудиторией педагогу и психологу всегда приходится учитывать особенности агрессии у подростков. А для выявления уровня и рода агрессии детей существуют различные методики. Одна из них – диагностика состояния агрессии (опросник Басса-Дарки). Данный опросник состоит из 75 утверждений, на которые испытуемый отвечает «да» или «нет» (Приложение 1).
Создавая свой опросник, дифференцирующий проявления агрессии и враждебности, А. Бассе и А. Дарки выделили следующие виды реакций:
-
Физическая агрессия – использование физической силы против другого лица.
-
Косвенная агрессия – агрессия, окольным путем направленная на другое лицо или ни на кого не направленная.
-
Раздражение – готовность к проявлению негативных чувств при малейшем возбуждении (вспыльчивость, грубость).
-
Негативизм – оппозиционная манера в поведении от пассивного сопротивления до активной борьбы против установившихся обычаев и законов.
-
Обида – зависть и ненависть к окружающим за действительные и вымышленные действия.
-
Подозрительность – в диапазоне от недоверия и осторожности по отношению к людям до убеждения в том, что другие люди планируют и приносят вред.
-
Вербальная агрессия – выражение негативных чувств как через форму (крик, визг), так и через содержание словесных ответов (проклятия, угрозы).
-
Чувство вины – выражает возможное убеждение субъекта в том, что он является плохим человеком, что поступает зло, а также ощущаемые им угрызения совести.
Обработка результатов: Обработка опросника Басса-Дарки производится при помощи индексов различных форм агрессивных и враждебных реакций, которые определяются суммированием полученных ответов. Физическая агрессия, косвенная агрессия, раздражение и вербальная агрессия вместе образуют суммарный индекс агрессивных реакций, а обида и подозрительность – индекс враждебности.
Данная методика была апробирована (в ходе государственной педагогической практики) 28.10.10 г. в 9а классе МАОУ СОШ № 5 г. Тобольска. В исследовании приняли участие 20 учащихся. Результаты опроса (значения параметров) представлены в сводной таблице (Приложение 2).
Для полной реализации сути опросника Басса-Дарки необходимо представить суммарный индекс агрессивных реакций и суммарный индекс враждебности (Приложение 3).
Перед началом регрессионного анализа осуществляется отбор факторов. Сначала отбираются факторы, связанные с изучаемым явлением, на основе данных теоретического исследования (психологическая теория, заключения экспериментатора и т.д.). При этом для построения множественной регрессии отбираются факторы, которые могут быть количественно измерены.
Проблему данного исследования составило рассмотрение и анализ уровня враждебности, вследствие этого регрессионный анализ экспериментальных данных методики Басса-Дарки будет проведен по индексу враждебности (зависимая переменная y), получающийся суммированием выявленных уровней обиды и подозрительности (независимые переменные xи z, соответственно).
2.2. Построение регрессионной модели
Регрессионный анализ экспериментальных данных методики Басса-Дарки будет проведен по индексу враждебности (зависимая переменная y), получающийся суммированием выявленных уровней обиды и подозрительности (независимые переменные xи z, соответственно).
Как будет варьировать индекс враждебности испытуемого, если будут изменяться уровни обиды и подозрительности? Ответ на этот вопрос психолог получит с помощью использования метода множественной регрессии. Данные для анализа представлены в таблице 3, в которой произведены предварительные вычисления.
Таблица 3. Исходные данные
№ |
Фамилия ученика |
||||||||
1 |
Бакиева |
5 |
8 |
13 |
25 |
40 |
65 |
64 |
104 |
2 |
Гатауллин |
1 |
4 |
5 |
1 |
4 |
5 |
16 |
20 |
3 |
Гатин |
2 |
2 |
4 |
4 |
4 |
8 |
4 |
8 |
4 |
Долженко |
5 |
4 |
9 |
25 |
20 |
45 |
16 |
36 |
5 |
Жарова |
4 |
7 |
11 |
16 |
28 |
44 |
49 |
77 |
6 |
Жуйкова |
6 |
3 |
9 |
36 |
18 |
54 |
9 |
27 |
7 |
Корикова |
5 |
7 |
12 |
25 |
35 |
60 |
49 |
84 |
8 |
Костерина |
7 |
7 |
14 |
49 |
49 |
98 |
49 |
98 |
9 |
Курманалиева |
4 |
7 |
11 |
16 |
28 |
44 |
49 |
77 |
10 |
Летунов |
3 |
2 |
5 |
9 |
6 |
15 |
4 |
10 |
11 |
Мороков |
4 |
5 |
9 |
16 |
20 |
36 |
25 |
45 |
12 |
Перовских В. |
4 |
9 |
13 |
16 |
36 |
52 |
81 |
117 |
13 |
Перовских М. |
4 |
7 |
11 |
16 |
28 |
44 |
49 |
77 |
14 |
Смирнова |
4 |
8 |
12 |
16 |
32 |
48 |
64 |
96 |
15 |
Солосина |
7 |
8 |
15 |
49 |
56 |
105 |
64 |
120 |
16 |
Тимирова |
1 |
2 |
3 |
1 |
2 |
3 |
4 |
6 |
17 |
Трухин |
2 |
4 |
6 |
4 |
8 |
12 |
16 |
24 |
18 |
Филиппов |
4 |
6 |
10 |
16 |
24 |
40 |
36 |
60 |
19 |
Хабисов |
6 |
3 |
9 |
36 |
18 |
54 |
9 |
27 |
20 |
Цыпанов |
0 |
2 |
2 |
0 |
0 |
0 |
4 |
4 |
Суммы: |
78 |
105 |
183 |
376 |
456 |
832 |
621 |
1117 |
С помощью решения системы уравнений (3.1) необходимо найти уравнение регрессии y на x, т.е. определить коэффициенты a, bи c, и таким образом ответить на поставленный вопрос.
Чтобы получить и решить уравнение множественной линейной регрессии (3.1), необходимо найти a, bи c. Для этого используется система уравнений (3.4). Благодаря вычислениям, приведенным в таблице 3, известны все необходимые величины сумм. Перепишем систему уравнений (3.4), учитывая N= 20, поскольку в эксперименте участвовало 20 человек, и учитывая данные таблицы 3:
(3.8)
Получили систему линейных уравнений (СЛУ) с тремя неизвестными. Решается данная система несколькими способами: по правилу Крамера, методом Гаусса и с помощью обратной матрицы.
В СЛУ (3.8) число уравнений равно числу неизвестных, поэтому целесообразно для нахождения неизвестных применить метод Крамера. Для начала составляется матрица третьего порядка:
(3.9)
Здесь последний столбец – это столбец свободных членов.
Теорема (правило Крамера). Пусть Δ – определитель матрицы СЛУ, а — определитель, полученный из определителя Δ заменой j-го столбца столбцом свободных членов. Тогда если , то система линейных уравнений имеет единственное решение, определяемое по формулам:
, где j = 1,2,…,n (3.10)
Формулы вычисления неизвестных (3.10) – решения системы линейных уравнений (3.8) – носят название формул Крамера.
Составляется и вычисляется главный определитель матрицы (3.9):
(3.11)
Так как вычисления данного определителя очень громоздкие, то целесообразно осуществлять все расчеты с помощью «Мастера функций» MS Excel. Для этого используется встроенная математическая функция МОПРЕД. Порядок вычисления следующий:
-
введите в упорядоченные ячейки электронной таблице исходные элементы определителя, сохраняя порядок следования элементов;
-
активируйте Мастер функций любым из способов:
а) в главном меню выберите команду Вставка/Функция;
б) на панели инструментов Стандартная щелкните по кнопке Вставка функции;
-
в появившемся диалоговом окне «Мастер функций – шаг 1 из 2» в поле Категории выберите Математические, в окне Функция – МОПРЕД. Щелкните по кнопке ОК;
-
в появившемся окне Аргументы функции необходимо указать диапазон ячеек от первого элемента исходного определителя до последнего (например, А1:С3);
-
щелкните по кнопке ОК.
После выполнения данного алгоритма на экране компьютера появится результат – определитель.
Как видно, полученный определитель () отличен от нуля, стало быть, СЛУ (3.8) имеет единственное решение, которое вычисляется по формулам:
, , (3.12)
Чтобы применить формулы (3.12), необходимо составить определители по правилу Крамера (3.10) и произвести их расчеты с помощью «Мастера функций» MS Excel. Все расчеты представлены ниже.
.
Теперь, когда известны все определители, можно применить формулы (3.12):
; ; (3.13)
Решив систему уравнений (3.8), получилось a = — 3,34, b = 1,82, c = 1,02. следовательно, искомое уравнение регрессии y на x (3.1) примет вид:
(3.14)
гдеy– зависимая переменная, –3,34 — свободный член, 1,82 и1,02 – параметры уравнения.
Уравнение (3.14) дает ответ на поставленный ранее вопрос: Как будет варьировать индекс враждебности испытуемого, если будут изменяться уровни обиды и подозрительности? Так, при увеличении величины уровня обиды xна 1 балл, количественная величина индекса враждебности y увеличится на 1,82, при постоянной величине уровня подозрительности z. А при постоянной величине уровня обиды и при увеличении величины уровня подозрительности на 1 балл количественная величина индекса враждебности увеличится в среднем на 1,02 балла.
Полученное уравнение многофакторной регрессии (3.14) имеет еще одно приложение. Так, подставляя в него значения переменных xи z, можно определить ожидаемую величину переменной y (уровня враждебности).
2.3. Анализ регрессионной модели
В предыдущем параграфе была вычислена модель множественной регрессии (3.14): ,
гдеy– значение зависимой переменной,
xи z– значения зависимых переменных,
–3,34 – свободный член,
1,82 и 1,02 – параметры уравнения (коэффициенты при независимых переменных).
Для многофакторной регрессионной модели имеют место следующие предпосылки:
-
Зависимые переменные – величины неслучайные;
-
Математическое ожидание случайной составляющей в любом наблюдении равно нулю: ;
-
Дисперсия случайной составляющей постоянна для всех наблюдений: ;
-
Отсутствие систематической связи между значениями случайной составляющей в любых двух наблюдениях: .
Факторы, включенные во множественную регрессию (3.14), количественно измерены и не сильно коррелируют друг с другом (корреляция– связь между собой двух и более переменных в одной или нескольких изучаемых группах). Кроме того, каждый фактор тесно связан с результатом.
Многофакторная регрессия представляет регрессию результативного признака с двумя и большим числом независимых переменных вида: .
В уравнении регрессии (3.14) случайная (зависимая) переменная yзависит не только от значений независимых переменных xи z, но и от ряда других факторов, влияющих на y, которые не могут быть проконтролированы. В связи с этим , где e – случайная величина, характеризующая отклонения результативного признака от теоретического, найденного по уравнению регрессии.
При исследовании зависимости результативного признака y в многофакторной модели необходимо решать такие же задачи, что и при однофакторной модели:
-
определение вида регрессии;
-
оценка параметров;
-
определение тесноты связи.
Однако наряду с этими задачами необходимо рассматривать и ряд задач, характерных лишь для многофакторной регрессии.
К таким задачам относится отбор факторов, существенно влияющих на фактор y, при наличии возможностей внутренней взаимосвязи между зависимыми переменными xи z. Такой отбор требует, прежде всего, глубокого теоретического и практического знания качественной стороны рассматриваемых психологических явлений.
Интерпретация результатов
До сих пор мы употребляли абстрактный математический язык. Перевод модели на язык экспериментатора называется интерпретацией модели. Задача интерпретации весьма сложна.
Устанавливается, в какой мере каждый из факторов влияет на параметр оптимизации. Величина коэффициента регрессии – количественная мера этого влияния. Чем больше коэффициент, тем сильнее влияет фактор. О характере влияния факторов говорят знаки коэффициентов. Знак плюс свидетельствует о том, что с увеличением значения фактора растет величина параметра оптимизации, а при знаке минус – убывает.
Анализируя сущность уравнения регрессии (3.14), следует отметить следующие положения. Рассмотренный подход не обеспечивает раздельной (независимой) оценки коэффициентов – изменение значения одного коэффициента влечет изменение значений других. Полученные коэффициенты не следует рассматривать как вклад соответствующего параметра в значение показателя. Уравнение регрессии является всего лишь хорошим аналитическим описанием имеющихся экспериментальных данных, а не законом, описывающим взаимосвязи параметров и показателя. Это уравнение применяют для расчета значений показателя в заданном диапазоне изменения параметров. Оно ограниченно пригодно для расчета вне этого диапазона, т.е. его можно применять для решения задач интерполяции и в ограниченной степени для экстраполяции.
В настоящее время регрессионный анализ широко используется в дифференциальной психологии и психодиагностике. С его помощью можно разрабатывать тесты, устанавливать структуру связей между отдельными психологическими характеристиками, измеряемыми набором тестов или заданиями теста.
Регрессионный анализ используется также для стандартизации тестовых методик, которая проводится на репрезентативной выборке испытуемых.
2.4. Аппроксимация экспериментальных данных
На практике часто приходится сталкиваться с задачей сглаживания экспериментальных зависимостей или задачей аппроксимации. Аппроксимацией называется процесс подбора эмпирической формулы для установленной из опыта функциональной зависимости . Эмпирические формулы служат для аналитического представления опытных данных.
Другими словами, аппроксимация, или приближение – это научный метод, состоящий в замене одних объектов другими, в том или ином смысле близкими к исходным, но более простыми. Аппроксимация позволяет исследовать числовые характеристики и качественные свойства объекта, сводя задачу к изучению более простых или более удобных объектов (например, таких, характеристики которых легко вычисляются, или свойства которых уже известны).
Одна независимая переменная
Обычно задача аппроксимации распадается на две части. Сначала устанавливают вид зависимости и, соответственно, вид эмпирической формулы, т.е. решают, является ли она линейной, квадратичной, логарифмической или какой-либо другой. После этого определяются численные значения неизвестных параметров выбранной эмпирической формулы, для которых приближение к заданной функции оказывается наилучшим. Если нет каких-либо теоретических соображений для подбора вида формулы, обычно выбирают функциональную зависимость из числа наиболее простых, сравнивая их графики с графиком заданной функции. После выбора вида формулы определяют ее параметры. Для наилучшего выбора параметров задают меру близости аппроксимации экспериментальных данных. Во многих случаях, в особенности, если функция задана графиком или таблицей (на дискретном множестве точек), для оценки степени приближения рассматривают разности для точек .
Существуют различные меры близости и, соответственно, способы решения этой задачи. Некоторые из них очень просты, быстро приводят к результату, но результат этот является сильно приближенным, другие более точными, но более сложными. Обычно определение параметров при известном виде зависимости осуществляют по методу наименьших квадратов. При этом функция считается наилучшим приближением к , если для нее сумма квадратов отклонений «теоретических» значений , найденных по эмпирической формуле, от соответствующих опытных значений ,
имеет наименьшее значение по сравнению с другими функциями, из числа которых выбирается искомое приближение.
Используя методы дифференциального исчисления, метод наименьших квадратов формулирует аналитические условия достижения суммой квадратов отклонений своего наименьшего значения.
В простейшем случае задача аппроксимации экспериментальных данных выглядит следующим образом.
Пусть экспериментальные данные, полученные практическим путем, которые можно представить парами чисел , зависимость между которыми отражает таблица.
На основе данных требуется подобрать функцию , которая наилучшим образом сглаживала бы экспериментальную зависимость между переменными и, по возможности, точно отражала общую тенденцию зависимости междуx и y, исключая погрешности измерений и случайные отклонения. Это значит, что отклонения в каком-то смысле были бы наименьшими.
Выяснить вид функции можно либо из теоретических соображений, либо анализируя расположение точек на координатной плоскости. Расположение экспериментальных точек может иметь самый различный вид, и каждому соответствует конкретный тип функции.
Построение эмпирической функции сводится к вычислению входящих в нее параметров, так чтобы их всех функций такого вида выбрать ту, которая лучше других описывает зависимость между изучаемыми величинами. То есть сумма квадратов разности между табличными значениями функции в некоторых точках и значениями, вычисленными по полученной формуле, должна быть минимальна.
Степень близости аппроксимации экспериментальных данных выбранной функцией оценивается коэффициентом детерминации (). Он показывает, какая доля дисперсии результативного признака объясняется влиянием независимых переменных. Таким образом, если есть несколько подходящих вариантов типов аппроксимации функций, можно выбрать функцию с большим коэффициентом детерминации (стремящимся к 1).
Количественная мератесноты связи |
Качественная характеристикасилы связи |
0,1-0,3 |
Слабая |
0,3-0,5 |
Умеренная |
0,5-0,7 |
Заметная |
0,7-0,9 |
Высокая |
0,9-0,99 |
Весьма высокая |
Таблица 4. Показатели тесноты связи
Таким образом, функциональная связь возникает при значении равном 1, а отсутствие связи – 0. При значениях показателей тесноты связи меньше 0,7 величина коэффициента детерминации всегда будет ниже 50%. Это означает, что на долю вариации факторных признаков приходится меньшая часть по сравнению с остальными неучтенными в модели факторами, влияющими на изменение результативного показателя. Построенные при таких условиях регрессионные модели имеют низкое практическое значение.
В MS Excel аппроксимация экспериментальных данных осуществляется путем построения графика – линии тренда (x, y – заданные величины).
Тренд – тенденция изменения показателей временного ряда. Тренды могут быть описаны различными функциями. Тип тренда устанавливают на основе данных временного ряда, путем осреднения показателей динамики ряда, на основе статистической проверки гипотезы о постоянстве параметров графика. Возможны следующие варианты функций:
-
Линейная – . Обычно применяется в простейших случаях, когда экспериментальные данные возрастают или убывают с постоянной скоростью.
-
Полиномиальная – , где до шестого порядка включительно (), — константы. Используется для описания экспериментальных данных, попеременно возрастающих и убывающих. Степень полинома определяется количеством экстремумов (максимумов и минимумов) кривой. Полином второй степени может описать только один максимум или минимум, полином третей степени может дать один или два экстремума, четвертой степени – не более трех экстремумов и т.д.
-
Логарифмическая – , где a и b– константы, lnx– функция натурального логарифма. Функция применяется для описания экспериментальных данных, которые вначале быстро растут или убывают, а затем постепенно стабилизируются.
-
Степенная – , где a и b– константы. Аппроксимация степенной функцией используется для экспериментальных данных с постоянно увеличивающейся (или убывающей) скоростью роста. Данные не должны иметь нулевых или отрицательных значений.
-
Экспоненциальная – , где a и b– константы, e– основание натурального логарифма. Применяется для описания экспериментальных данных, которые быстро растут или убывают, а затем постепенно стабилизируются. Часто ее использование вытекает из теоретических соображений.
Для осуществления аппроксимации на диаграмме экспериментальных данных необходимо щелчком правой кнопки мыши вызвать всплывающее меню и выбрать пункт Добавить линию тренда. В появившемся диалоговом окне Линия тренда на вкладке Тип выбирается вид аппроксимирующей функции, а на вкладке Параметры устанавливаются флажки в полях показывать уравнение на диаграмме и поместить на диаграмму величину достоверности аппроксимации (). После чего нужно щелкнуть по кнопке ОК. В результате получим на диаграмме аппроксимирующую кривую.
Проделав данную операцию несколько раз, можно представить линейную зависимость индексов с уравнениями линий тренда и коэффициентом детерминации – для анализа полной достоверности результатов исследуемых показателей (рис.3, рис.4).
Рис.3 Зависимость индекса враждебности от индекса обиды
Рис.4 Зависимость индекса враждебности от индекса подозрительности
Как видно, из рис.3,
Несколько независимых переменных
В тех случаях, когда аппроксимируемая переменная yзависит от нескольких независимых переменных , подход с построением линии тренда не дает решения. Здесь могут быть использованы следующие специальные функции MS Excel:
ЛИНЕЙН и ТЕНДЕНЦИЯ для аппроксимации линейных функций вида:
,
ЛГРФПРИБЛ и РОСТ для аппроксимации показательных функций вида:
Функции ЛИНЕЙН и ЛГРФПРИБЛ служат для вычисления неизвестных коэффициентов , в указанных выражениях, а также коэффициентов детерминации (). Обе функции имеют одинаковые параметры:
ЛИНЕЙН (известные значения y; известные значения x; конст; статистика);
ЛГРФПРИБЛ (известные значения y; известные значения x; конст; статистика).
Здесь:
-
известные значения y – множество наблюдаемых значений y из казанных выражений;
-
известные значения x – множество наблюдаемых значений . Причем, если массив известные значения y имеет один столбец, то каждый столбец массива известные значения x интерпретируется как отдельная переменная, а если массив известные значения y имеет одну строку, то тогда каждая строка массива известные значения xинтерпретируется как отдельная переменная;
-
конст – логическое значение, которое указывает, требуется ли, чтобы константа была равна 0 (для функции ЛИНЕЙН) или 1 (для функции ЛГРФПРИБЛ). При этом, если конст имеет значение ИСТИНА или опущено, то вычисляется обычным образом, а если конст имеет значение ЛОЖЬ, то полагается равным 0 или 1;
-
статистика – логическое значение, которое указывает, требуется ли вычислять дополнительную статистику по регрессии, если введено значение ИСТИНА, то дополнительные параметры вычисляются, если ЛОЖЬ, то – нет.
Функции ТЕНДЕНЦИЯ и РОСТ позволяют находить точки, лежащие на аппроксимирующих кривых, для значений коэффициентов , найденных функциями ЛИНЕЙН и ЛГРФПРИБЛ.
Обе функции имеют одинаковые аргументы:
ТЕНДЕНЦИЯ (известные значения y; известные значения x; новые значения x; конст);
РОСТ (известные значения y; известные значения x; новые значения x; конст).
Здесь:
-
известные значения y – множество значений y;
-
известные значения x – множество значений x;
-
новые значения x – те значений x, для которых необходимо определить соответствующие аппроксимирующие или предсказанные значения y.Новые значения x должны содержать столбец (или строку) для каждой независимой переменной, как и известные значения x. Если аргумент новые значения x опущен, то предполагается, что он совпадает с аргументом известные значения x;
-
конст – логическое значение, которое указывает, требуется ли, чтобы константа была равна 0 (для функции ТЕНДЕНЦИЯ) или 1 (для функции РОСТ). При этом, если конст имеет значение ИСТИНА или опущено, то вычисляется обычным образом, а если конст имеет значение ЛОЖЬ, то полагается равным 0 или 1.
Заключение
Тщательное, скурпулезное проведение эксперимента, несомненно, является главным условием успеха исследования. Это общее правило, и планирование эксперимента не относится к исключениям.
Однако экспериментатору не безразлично, как обработать полученные данные. Необходимо извлечь из них всю информацию и сделать соответствующие выводы. С одной стороны, не извлечь из эксперимента все, что из него следует, — значит пренебречь нелегким трудом экспериментатора. С другой стороны, сделать утверждения, не следующие из эксперимента, — значит создавать иллюзии, заниматься самообманом. Статистические методы обработки результатов эксперимента позволяют не перейти разумной меры риска.
Если данные, полученные в эксперименте, качественного характера, то правильность делаемых на основе их выводов полностью зависит от интуиции, эрудиции и профессионализма исследователя, а также от логики его рассуждений. Если же эти данные количественного типа, то сначала проводят их первичную, а затем вторичную статистическую обработку.
Вторичная статистическая обработка проводится в том случае, если для решения задач или доказательства предложенных гипотез необходимо определить статистические закономерности, скрытые в первичных экспериментальных данных. Приступая к вторичной статистической обработке, исследователь, прежде всего, должен решить, какие из различных вторичных статистик ему следует применить для обработки первичных экспериментальных данных.
Таким образом, реализована цель данной работы, т.е. разработана методика проведения регрессионного анализа статистических данных психологического эксперимента для прогнозирования исследуемых показателей. Это было достигнуто через реализацию всех поставленных задач с помощью теоретических и эмпирических методов. Таких как анализ различной литературы, систематизация полученной информации (знаний) и ее обобщение; наблюдение и анкетирование (опрос).
Математическая статистика – прикладная отрасль математики, основанная на теории вероятностей и предназначенная в самом общем плане для систематизации и анализа эмпирических (опытных) данных, получаемых при изучении повторяющихся и варьирующихся явлений.
Планирование и анализ экспериментов – это раздел математической статистики, включающий систему методов обнаружения и проверки причинных связей между переменными.
Таким образом, математическая статистика – это точная и полезная наука. Но лишь для думающего исследователя, не пренебрегающего необходимостью вникнуть в существо идей и методов теории вероятностей и математической статистики.
В целом же, статистические методы помогают исследователям описывать данные, делать выводы в отношении больших массивов данных и изучать причинные зависимости.
Список использованных источников
-
Дуброва, Т.А. Статистиские методы прогнозирования: Учебное пособие [Текст]/ Т.А. Дуброва. – М.: ЮНИТИ, 2003. – 204с.
-
Ермолаев О.Ю. Математическая статистика для психологов : Учебник [Текст]/ О.Ю. Ермолаев. – М.: Изд-во Флинта Московского психолого-социального института, 2004. – 335с.
-
Калинина, В.Н. Теория вероятностей и математическая статистика: Учебное пособие для вузов [Текст]/ В.Н. Калинина. – М.: Дрофа, 2008. – 471с.
-
Калинина, В.Н. Математическая статистика: Учебник для студентов [Текст]/ В.Н. Калинина, В.Ф. Панкин. – М.: Дрофа, 2002. – 335с.
-
Крамер, Д. Математическая обработка данных в социальных науках: современные методы: Учебное пособие для вузов [Текст]/ Дункан Крамер. – Академия, 2007. – 287с.
-
Красс, М.С. Математика для экономического бакалавриата: Учебник [Текст]/ М.С. Красс, Б.П. Чупрынов. – М.: Дело, 2005. – 574с.
-
Кричевец, А.Н. Математика для психологов: Учебник [Текст]/ А.Н. Кричевец, Е.В. Шикин, А.Г. Дьячков. – М.: Изд-во Флинта Московского психолого-социального института, 2005. – 371с.
-
Могилев, А.В, Информатика: Учебник [Текст]/ А.В. Могилев, Н.И. Пак, Е.К. Хеннер. – М.: Академия, 2003. – 809с.
-
Немов, Р.С. Психодиагностика. Введение в научное психологическое исследование с элементами математической статистики [Текст]/ Р.С. Немов. – М.: ВЛАДОС, 1998. – 632 с.
-
Палий, И.А. Прикладная статистика: Учебное пособие для вузов [Текст]/ И.А. Палий. – М.: Высшая школа, 2004. – 175с.
-
Рубинштейн, С.Л. Основы общей психологии [Текст]/ С.Л. Рубинштейн. – СПб.: Питер, 2008. – 705с.
-
Симонович, С.В. Специальная информатика: Учебное пособие [Текст]/ С.В. Симонович, Г.А. Евсеев, А.Г. Алексеев. – М., 2002. – 479с.
-
Созонова, М.С. Математические методы в психологии: Учебное пособие [Текст]/ М.С. Созонова. – Тобольск: ТГСПА им. Д.И. Менделеева, 2006. – 172с.
-
Фадеев, М.А. Элементарная обработка результатов эксперимента: Учебное пособие [Текст]/ М.А. Фадеев. – СПб, М., Краснодар: Лань, 2008. – 117с.
Приложение 1
Инструкция: опросник Басса-Дарки состоит из 75 утверждений, на которые испытуемый отвечает «да» или «нет».
-
Временами я не могу справиться с желанием причинить вред другим.
-
Иногда я сплетничаю о людях, которых не люблю.
-
Я легко раздражаюсь, но быстро успокаиваюсь.
-
Если меня не попросят по-хорошему, я не выполню просьбы.
-
Я не всегда получаю то, что мне положено.
-
Я знаю, что люди говорят обо мне за моей спиной.
-
Если я не одобряю поведения друзей, то даю им это почувствовать.
-
Если мне случалось обмануть кого-нибудь, я испытывал мучительные угрызения совести.
-
Мне кажется, что я не способен ударить человека.
-
Я никогда не раздражаюсь настолько, чтобы кидаться предметами.
-
Я всегда снисходителен к чужим недостаткам.
-
Если мне не нравится установленное правило, мне хочется нарушить его.
-
Другие умеют (лучше, чем я) почти всегда пользоваться благоприятными обстоятельствами.
-
Я держусь настороженно с людьми, которые относятся ко мне несколько более дружественно, чем я ожидал.
-
Я часто бываю не согласен с людьми.
-
Иногда мне на ум приходят мысли, которых я стыжусь.
-
Если кто-нибудь первым ударит меня, я не отвечу ему.
-
Когда я раздражаюсь, я хлопаю дверьми.
-
Я гораздо более раздражителен, чем кажется окружающим.
-
Если кто-нибудь корчит из себя начальника, я всегда поступаю ему наперекор.
-
Меня немного огорчает моя судьба.
-
Я думаю, что многие люди не любят меня.
-
Я не могу удержаться от спора, если люди не согласны со мной.
-
Люди, увиливающие от работы, должны испытывать чувство вины.
-
Тот, кто оскорбляет меня или мою семью, напрашивается на драку.
-
Я не способен на грубые шутки.
-
Меня охватывает ярость, когда надо мной насмехаются.
-
Когда люди строят из себя начальников, я делаю всё, чтобы они не зазнавались.
-
Почти каждую неделю я вижу кого-нибудь, кто мне не нравится.
-
Довольно многие люди завидуют мне.
-
Я требую, чтобы люди уважали мои права.
-
Меня угнетает то, что я мало делаю для своих родителей.
-
Люди, которые постоянно изводят Вас, стоят того, чтобы их щёлкнули по носу.
-
От злости я иногда бываю мрачен.
-
Если ко мне относятся хуже, чем я того заслуживаю, я не расстраиваюсь.
-
Если кто-то выводит меня из себя, я не обращаю на него внимания.
-
Хотя я и не показываю этого, иногда меня гложет зависть.
-
Иногда мне кажется, что надо мной смеются.
-
Даже если я злюсь, я не прибегаю к «сильным» выражениям.
-
Мне хочется, чтобы мои ошибки были прощены.
-
Я редко даю сдачи, даже если кто-нибудь ударит меня.
-
Когда получается не по-моему, я всегда обижаюсь.
-
Иногда люди раздражают меня просто своим присутствием.
-
Нет людей, которых бы я по-настоящему ненавидел.
-
Мой принцип: «Никогда не доверяй чужакам».
-
Если кто-нибудь раздражает меня, я готов сказать всё, что о нём думаю.
-
Я делаю много такого, о чём впоследствии сожалею.
-
Если я разозлюсь, я могу ударить кого-нибудь.
-
С десяти лет я никогда не проявлял вспышек гнева.
-
Я часто чувствую себя, как пороховая бочка, готовая взорваться.
-
Если бы все знали, что я чувствую, меня бы считали человеком, с которым нелегко ладить.
-
Я всегда думаю о том, какие тайные причины заставляют людей делать что-то приятное для меня.
-
Когда на меня кричат, я начинаю кричать в ответ.
-
Неудачи огорчают меня.
-
Я дерусь не реже и не чаще, чем другие.
-
Я могу вспомнить случай, когда я был настолько зол, что хватал попавшуюся мне под руку вещь и ломал её.
-
Иногда я чувствую, что готов первым начать драку.
-
Иногда я чувствую, что жизнь поступает со мной несправедливо.
-
Раньше я думал, что большинство людей говорит правду, но теперь я в это не верю.
-
Я ругаюсь только от злости.
-
Иногда я поступаю неправильно, меня мучает совесть.
-
Если для защиты своих прав мне надо применять физическую силу, я применяю её.
-
Иногда я выражаю свой гнев тем, что стучупо столу кулаком.
-
Я бываю грубоват по отношению к людям, которые мне не нравятся.
-
У меня нет врагов, которые хотели бы мне навредить.
-
Я не умею поставить человека на место, даже если он того заслуживает.
-
Я часто думаю, что жил неправильно.
-
Я знаю людей, которые способны довести меня до драки.
-
Я не раздражаюсь из-за мелочей.
-
Мне редко приходит в голову, что люди пытаются разозлить или оскорбить меня.
-
Я часто просто угрожаю людям, хотя и не собираюсь приводить угрозы в исполнение.
-
В последнее время я стал занудой.
-
В споре я часто повышаю голос.
-
Обычно я стараюсь скрывать плохое отношение к людям.
-
Я лучше соглашусь с чем-либо, чем стану спорить.
Обработка результатов: Обработка опросника производится при помощи индексов различных форм агрессивных и враждебных реакций, которые определяются суммированием полученных ответов.
1. Физическая агрессия:
Ответы «да» в вопросах №№ 1, 25, 33, 48, 55, 62, 68
Ответы «нет» в вопросах №№ 9, 17, 41 10
2. Косвенная агрессия:
Ответы «да» в вопросах №№ 2, 18, 34, 42, 56, 63
Ответы «нет» в вопросах №№ 10, 26, 49 9
3. Раздражение:
Ответы «да» в вопросах №№ 3, 19, 27, 43, 50, 57, 64, 72
Ответы «нет» в вопросах №№ 11, 35, 69 11
4. Негативизм:
Ответы «да» в вопросах №№ 4, 12, 20, 23, 36 5
5. Обида:
Ответы «да» в вопросах №№ 5, 13, 21, 29, 37, 51, 58
Ответы «нет» — № 44 8
6. Подозрительность:
Ответы «да» в вопросах №№ 6, 14, 22, 30, 38, 45, 52, 59
Ответы «нет» в вопросах — № 65, 70 10
7. Вербальная агрессия:
Ответы «да» в вопросах №№ 7, 15, 23, 31, 46, 53, 60, 71, 73
Ответы «нет» в вопросах №№ 39, 66, 74, 75 13
8. Угрызения совести, чувство вины:
Ответы «да» в вопросах №№ 8, 16, 24, 32, 40, 47, 54, 61, 67 9
Физическая агрессия, косвенная агрессия, раздражение и вербальная агрессия вместе образуют суммарный индекс агрессивных реакций, а обида и подозрительность – индекс враждебности.
Приложение 2
Таблица 1. Набранные индексы по видам реакций, их сумма.
№ |
Фамилия ученика |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
Сумма |
1 |
Бакиева |
9 |
7 |
6 |
4 |
5 |
8 |
10 |
7 |
56 |
2 |
Гатауллин |
8 |
6 |
3 |
2 |
1 |
4 |
10 |
5 |
34 |
3 |
Гатин |
7 |
2 |
3 |
2 |
2 |
2 |
7 |
6 |
31 |
4 |
Долженко |
6 |
2 |
8 |
0 |
5 |
4 |
9 |
5 |
39 |
5 |
Жарова |
9 |
4 |
7 |
3 |
4 |
7 |
9 |
5 |
48 |
6 |
Жуйкова |
5 |
5 |
7 |
4 |
6 |
3 |
3 |
8 |
41 |
7 |
Корикова |
9 |
4 |
3 |
4 |
5 |
7 |
7 |
8 |
47 |
8 |
Костерина |
10 |
9 |
8 |
4 |
7 |
7 |
11 |
9 |
65 |
9 |
Курманалиева |
10 |
7 |
7 |
4 |
4 |
7 |
13 |
8 |
60 |
10 |
Летунов |
8 |
6 |
6 |
4 |
3 |
2 |
10 |
7 |
46 |
11 |
Мороков |
9 |
7 |
9 |
4 |
4 |
5 |
10 |
7 |
55 |
12 |
Перовских В. |
10 |
8 |
8 |
4 |
4 |
9 |
11 |
7 |
61 |
13 |
Перовских М. |
8 |
2 |
5 |
2 |
4 |
7 |
9 |
8 |
45 |
14 |
Смирнова |
5 |
5 |
9 |
5 |
4 |
8 |
10 |
7 |
53 |
15 |
Солосина |
4 |
7 |
7 |
1 |
7 |
8 |
9 |
7 |
50 |
16 |
Тимирова |
9 |
6 |
4 |
3 |
1 |
2 |
11 |
6 |
42 |
17 |
Трухин |
7 |
6 |
3 |
4 |
2 |
4 |
12 |
2 |
40 |
18 |
Филиппов |
8 |
3 |
5 |
4 |
4 |
6 |
10 |
8 |
48 |
19 |
Хабисов |
8 |
3 |
6 |
3 |
6 |
3 |
9 |
5 |
43 |
20 |
Цыпанов |
6 |
0 |
0 |
2 |
0 |
2 |
3 |
3 |
16 |
Максимальный набор индексов |
10 |
9 |
11 |
5 |
8 |
10 |
13 |
9 |
75 |
1 — физическая агрессия
2 — косвенная агрессия
3 — раздражение
4 — негативизм
5 — обида
6 — подозрительность
7 — вербальная агрессия
8 — угрызение совести, чувство вины
Приложение 3
Таблица 2. Индексы.
№ |
Фамилия ученика |
Индекс агрессии |
Индекс враждебности |
1 |
Бакиева |
32 |
13 |
2 |
Гатауллин |
27 |
5 |
3 |
Гатин |
19 |
4 |
4 |
Долженко |
25 |
9 |
5 |
Жарова |
29 |
11 |
6 |
Жуйкова |
20 |
9 |
7 |
Корикова |
23 |
12 |
8 |
Костерина |
38 |
14 |
9 |
Курманалиева |
37 |
11 |
10 |
Летунов |
30 |
5 |
11 |
Мороков |
35 |
9 |
12 |
Перовских В. |
37 |
13 |
13 |
Перовских М. |
24 |
11 |
14 |
Смирнова |
29 |
12 |
15 |
Солосина |
27 |
15 |
16 |
Тимирова |
30 |
3 |
17 |
Трухин |
28 |
6 |
18 |
Филиппов |
26 |
10 |
19 |
Хабисов |
26 |
9 |
20 |
Цыпанов |
9 |
2 |
Максимальный набор индексов |
43 |
18 |