Единое окно доступа к образовательным ресурсам

Теория статистического вывода: Учебное пособие для вузов

Голосов: 1

Учебное пособие подготовлено на кафедре общей и социальной психологии факультета философии и психологии Воронежского государственного университета. Рекомендовано для студентов 2-го курса очной и 4 курса очно-заочной форм обучения отделения психологии факультета философии и психологии ВГУ. Пособие включает пять разделов: Основные понятия теории статистического вывода; Критерий для отбрасывания резко выделяющихся результатов; Критерии сравнения характеристик рассеяния; Критерии сравнения характеристик центральной тенденции; Критерий сравнения частот.

Приведенный ниже текст получен путем автоматического извлечения из оригинального PDF-документа и предназначен для предварительного просмотра.
Изображения (картинки, формулы, графики) отсутствуют.
       ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ
ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ
  ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
«ВОРОНЕЖСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ»




                   М.А. Харченко




ТЕОРИЯ СТАТИСТИЧЕСКОГО ВЫВОДА
             Учебное пособие для вузов




         Издательско-полиграфический центр
     Воронежского государственного университета
                        2008


Утверждено научно-методическим советом факультета философии и пси-
хологии 25 марта 2008 г., протокол № 1400-03




Рецензент Н.И. Вьюнова




Учебное пособие подготовлено на кафедре общей и социальной психоло-
гии факультета философии и психологии Воронежского государственного
университета.

Рекомендовано для студентов 2-го курса очной и 4 курса очно-заочной
форм обучения отделения психологии факультета философии и психоло-
гии ВГУ.




Для специальности: 030301 – Психология
ОПД.Ф.11

                                    2


                                          СОДЕРЖАНИЕ


I. ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ СТАТИСТИЧЕСКОГО
ВЫВОДА ........................................................................................................... 4
     § 1. Генеральные и выборочные характеристики ................................. 4
     § 2. Точечное оценивание ........................................................................ 6
     § 3. Интервальное оценивание ............................................................... 11
     § 4. Точность результатов измерений ................................................... 14
     § 5. Статистическая проверка гипотез ................................................... 15
II. КРИТЕРИЙ ДЛЯ ОТБРАСЫВАНИЯ РЕЗКО ВЫДЕЛЯЮЩИХСЯ
РЕЗУЛЬТАТОВ ............................................................................................... 21
     § 6. Критерий Смирнова ......................................................................... 21
III. КРИТЕРИИ СРАВНЕНИЯ ХАРАКТЕРИСТИК РАССЕЯНИЯ ..........                                                      23
      § 7. Критерий Фишера .............................................................................        23
      § 8. Критерий Сиджела–Тьюки ..............................................................                25
      § 9. Критерий Бартлета ...........................................................................        28
      § 10. Критерий Хартлея ..........................................................................         30
      § 11. Критерий Кочрена ..........................................................................         32
IV. КРИТЕРИИ СРАВНЕНИЯ ХАРАКТЕРИСТИК ЦЕНТРАЛЬНОЙ
ТЕНДЕНЦИИ ..................................................................................................    34
     § 12. Критерий Стьюдента ......................................................................            34
     § 13. Критерий Манна–Уитни ................................................................                37
     § 14. Критерий знаков МакНемара ........................................................                   41
     § 15. Однофакторный дисперсионный анализ ......................................                            43
     § 16. Критерий Краскела–Уоллиса ........................................................                   51
V. КРИТЕРИЙ СРАВНЕНИЯ ЧАСТОТ ....................................................... 55
    § 17. Биномиальный критерий ............................................................... 55
ЗАКЛЮЧЕНИЕ ............................................................................................... 57
СТАТИСТИЧЕСКИЕ ТАБЛИЦЫ ................................................................. 59




                                                             3


I. ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ
СТАТИСТИЧЕСКОГО ВЫВОДА

     Основными понятиями теории статистического вывода являются:
популяция, выборка, генеральная и выборочная совокупности, параметры
распределений случайной величины и их статистические оценки (стати-
стики), точечное и интервальное оценивание, статистическая проверка
гипотез, статистический критерий.

     § 1. Генеральные и выборочные характеристики
      Всякая большая (конечная или бесконечная) совокупность испытуе-
мых (например, совокупность всех студентов-психологов 2 курса) называ-
ется популяцией, а совокупность их результатов – генеральной совокупно-
стью. Психологические характеристики обычно изучают путем обследо-
вания выборки – ограниченного числа испытуемых, результаты которых
образуют выборочную совокупность. Таким образом, выборка – это часть
(подмножество) популяции, а выборочная совокупность – подмножество
генеральной совокупности.
      Число элементов популяции / выборки / генеральной, выборочной
совокупности называется объемом.
      Генеральные числовые характеристики, вычисляемые на основании
изучения популяции, характеризуют всю популяцию в целом и являются
детерминированными величинами (при многократном измерении их зна-
чения остаются постоянными в пределах точности измерения); они пред-
ставляют собой параметры θ совокупности. Для выборок те же числовые
характеристики – статистические оценки параметров θ* (статистики) –
являются случайными величинами. Они всегда в большей или меньшей
степени отличаются от генеральных характеристик – значений параметров
по причинам, связанным с неоднородностью выборок и индивидуальными
различиями испытуемых.
      Так как значения параметров в реальном исследовании получить не-
возможно (для этого необходимо многократно исследовать всю популя-
цию), в теории статистического вывода прибегают к методам оценивания.
Его суть заключается в приблизительной оценке параметров генеральной
совокупности по статистикам выборки.
      Имеется два метода оценивания: точечное и интервальное, соответ-
ственно выделяют точечные и интервальные оценки параметров. Метод
                                     4


интервального оценивания был разработан американским математиком
Ю. фон Нейманом, исходя из идей английского математика Р. Фишера.
      Точечной называется оценка параметра, которая определяется одним
числом (то есть ее можно представить в виде точки на числовой оси). Ин-
тервальной называется оценка параметра, которая определяется интерва-
лом на числовой оси, в пределах которого с определенной вероятностью P
лежит значение оцениваемого параметра θ:
                              θ*min < θ < θ*max.
      Интервал (θ*min; θ*max), который с вероятностью P содержит в себе
оцениваемый параметр, называется доверительным интервалом, а соот-
ветствующая вероятность P – доверительной вероятностью. Границы до-
верительного интервала, как и точечные оценки, являются случайными ве-
личинами: от выборки к выборке они могут меняться. В силу этого следует
говорить не о «вероятности попадания параметра в доверительный интер-
вал», а о «вероятности того, что доверительный интервал накроет пара-
метр θ».
      Статистические оценки (как точечные, так и интервальные) характе-
ризуются точностью, надежностью и валидностью. Точность статисти-
ческой оценки отражает степень ее близости к истинному значению изме-
ряемого параметра. Надежность оценки – это характеристика устойчивости
результатов измерения; она показывает, как сильно могут отличаться ре-
зультаты исследования при его повторении в сопоставимых условиях (на-
пример, психологический тест как измерительный инструмент обладает
высокой надежностью, если при повторном тестировании вызывает у ис-
пытуемых реакцию, аналогичную первой; эксперимент с высокой надеж-
ностью дает близкие результаты при его повторном проведении в тех же
условиях, с тем же материалом, но на других выборках). Валидность отра-
жает степень достоверности и адекватности оценивания: валидной оценкой
математического ожидания является среднее арифметическое, но не сред-
нее квадратическое отклонение.
      Оценкой точности интервальных оценок служит величина довери-
тельного интервала: чем он шире, тем точность оценки ниже. Точность то-
чечных оценок определяется абсолютной и относительной погрешностя-
ми (ошибками). Абсолютной погрешностью δ называется абсолютная ве-
личина (модуль) отклонения оценки от истинного значения параметра:
                                 δ = |θ* – θ|.
Чем меньше значение абсолютной ошибки δ, тем выше точность, то есть
статистическая оценка θ* точнее определяет параметр θ. Относительной
погрешностью (ошибкой) Е называется отношение абсолютной погрешно-
сти δ к оценке параметра θ*:
                                      θ * −θ
                                 E=           .
                                        θ*

                                     5


      Надежность точечной оценки рассчитывается с помощью средней
квадратической ошибки параметра sθ – усредненного квадрата ошибки δ:
                                         1 n 2
                            sθ = δ 2 =     ∑δ ,
                                         n i =1
где δ – ошибка параметра, n – объем выборки. Средняя квадратичная
ошибка параметра sθ служит мерой надежности в том смысле, что чем она
меньше, тем надежность статистической оценки больше, и наоборот.
      Надежность интервальной оценки – доверительная вероятность Р –
вероятность того, что доверительный интервал заключает в себе оценивае-
мый параметр. Чем она больше, тем выше надежность оценки, характери-
зующая лучшую воспроизводимость результатов, и наоборот. Надежность
Р задается перед проведением исследования, причем в качестве довери-
тельной вероятности берется число, близкое к единице (или 100 %). В пси-
хологических исследованиях уровни доверительной вероятности прини-
маются равными 0,95 или 0,99.
      Точность и надежность связаны друг с другом: чем шире довери-
тельный интервал, тем больше надежность и меньше точность оценки, и
наоборот. Стопроцентной надежности соответствует доверительная веро-
ятность Р = 1, которой в свою очередь соответствует доверительный ин-
тервал (−∞; + ∞) : только в этом случае имеем достоверное событие, веро-
ятность которого равна единице. Отсюда следует, что:
      1) провести исследование со стопроцентной надежностью невоз-
можно в принципе;
      2) психолог должен «позволить» себе совершать ошибку в каждом
исследовании!
      Вероятность ошибки α = 1 – P называется уровнем значимости α и
всегда указывается в статистическом выводе психологического исследова-
ния. Доверительным вероятностям 0,95 и 0,99 соответствуют уровни зна-
чимости α = 0,05 (5 %) и 0,01 (1 %), которые показывают, что только в пяти
случаях из ста (или одном случае из ста) возможна ошибка.

       § 2. Точечное оценивание
       Точечное оценивание позволяет приблизительно оценить параметры
генеральной совокупности по статистикам (статистическим оценкам) вы-
борки. К точечным оценкам параметров предъявляются требования со-
стоятельности, эффективности и несмещенности.
       Состоятельной называется статистическая оценка, если она с увели-
чением объема выборки приближается к оцениваемому параметру:
lim θ * = θ . Точечная оценка является эффективной, если она обладает ми-
n →∞
нимальной дисперсией по сравнению с другими оценками. Наконец, то-
чечная оценка является несмещенной, если ее математическое ожидание

                                       6


равно оцениваемому параметру при любом объеме выборки: М(θ*) = θ.
Используемые в математической статистике оценки не всегда удовлетво-
ряют одновременно всем этим требованиям, что необходимо корректиро-
вать, вводя специальные поправки.
      Статистической оценкой вероятности события является среднее
значение относительной частоты:
                              1          1   k
                          w = ∑ wi = ∑ i .
                              N i        N i n
Здесь: N – количество экспериментов, ki – число появлений события в i-м
эксперименте; n – количество опытов в каждом из N экспериментов,
ki
   = wi – относительная частота появления события в i-м эксперименте.
 n
      Статистическими оценками математического ожидания являются
выборочное среднее арифметическое x
                                  1 n
                               x = ∑ x i ni
                                  n i =1
и выборочное среднее геометрическое xG
                                      n
                            xG = n   ∏x
                                     i =1
                                            ni
                                            i    = n x1n1 ⋅ x2 2 ⋅ … ⋅ xn n .
                                                             n          n



Здесь n – объем выборки, xi – измеряемые значения, ni – их частоты.
      Среднее геометрическое значение удобнее находить путем логариф-
мирования xG по любому основанию a > 0 (a ≠ 1):
                           1
                    ⎛ n      ⎞n 1        n
                                               1 n            1 n
   log a xG = log a ⎜ ∏ xini ⎟ = log a ∏ xini = ∑ log a xini = ∑ (ni ⋅ log a xi ) .
                    ⎝ i=1    ⎠  n      i =1    n i=1          n i=1
Значение xG получается путем потенцирования последнего выражения
                                                  1 n
                                                     ∑ ( ni ⋅log a xi )
                                       xG = a   . n i =1


      В случае большого объема выборки (n > 50) необходимо предвари-
тельно систематизировать эмпирические данные, представив результаты в
виде вариационного ряда
                        x1 ≤ x 2 ≤ ... ≤ xi ≤ ... ≤ x n .
Далее следует произвести группировку результатов, для чего размах варь-
ирования изучаемой характеристики R = xmax – xmin необходимо разбить на
целое число m равных интервалов, определяемое по формуле Стерджеса:
                            m = 1 + 3,32 lg n,
где n – объем выборки. Выборочное среднее значение вычисляется по
формуле
                                   1 m
                              x = ∑ xjnj ,
                                    n j =1
                                                            7


где n – объем выборки, xj – значение характеристики в середине j-го интер-
вала, nj – частота: число наблюдений, заключенное в j-м интервале, m –
число интервалов. Группировка данных приводит к некоторой неточности
расчета выборочного среднего, однако получаемой при этом погрешно-
стью при большом объеме выборки можно пренебречь.
       Выборочная медиана х0,5 является статистической оценкой медианы.
Она делит выборку на две равные части по количеству полученных значе-
ний. Для ее вычисления эмпирические данные необходимо представить в
виде вариационного ряда. При нечетном объеме выборки выборочная ме-
диана равна среднему члену вариационного ряда, при четном объеме вы-
борки – среднему арифметическому двух членов вариационного ряда, на-
ходящихся в его середине. Середина вариационного ряда находится по
           n +1
формуле          , где n – объем выборки.
             2
       Статистическая оценка моды – выборочная мода х0. Она определяет-
ся как значение показателя, имеющего наибольшую частоту. Распределе-
ния с двумя модами называются бимодальными, с несколькими модами –
полимодальными. Имеются соглашения об использовании моды:
       1. Если все значения в выборке встречаются одинаково часто, то в
этом случае считается, что моды нет. Например, нет моды в распределении
5, 5, 16, 16, 29, 29.
       2. Когда два соседних значения имеют одинаковую частоту, которая
больше частоты любого другого значения, мода есть среднее этих двух
значений: в распределении 1, 1, 2, 2, 2, 3, 3, 3, 4 мода равна 2,5.
       3. Если два несмежных значения имеют равные частоты, которые
больше частоты любого другого значения, то распределение является би-
модальным: распределение 10, 11, 11, 11, 12, 13, 14, 14, 14, 15 является би-
модальным с модами, равными 11 и 14.
       Статистической оценкой дисперсии является выборочная дисперсия
 2
s , которая вычисляется по формулам
                                  SS       1 n
                                              ∑ (xi − x ) ⋅ ni
                                                          2
                            s2 =       =
                                  df n − 1 i=1
или
                                1 ⎡ n                         ⎞ ⎤
                                                               2

                        s =
                         2
                                 (     )
                              n − 1 ⎢ i =1
                                            2    1⎛ n
                                    ⎢ ∑ x i ni − ⎜ ∑ x i ni ⎟ ⎥ ,
                                                 n ⎝ i =1
                                    ⎣                         ⎠ ⎥⎦
где SS – сумма квадратов, df = n – 1– число степеней свободы, n – объем
выборки, xi – значения изучаемой характеристики, x – выборочное сред-
нее, ni – частоты.
       В случае большого объема выборки (n > 50) эмпирические данные
предварительно систематизируются в виде вариационного ряда и группи-
руются. Выборочная дисперсия вычисляется по формулам
                                           8


                                                   ⎡m                                2
                                                                                         ⎤
                1 m
                         (x j − x )2 ⋅ n j = n 1 1 ⎢∑ (x 2j n j )− 1 ⎛ ∑ x j n j ⎞
                                                                        m
          s =
            2
                   ∑
              n − 1 j =1                       − ⎢ j =1
                                                                     ⎜
                                                                   n ⎜ j =1
                                                                     ⎝
                                                                                 ⎟
                                                                                 ⎟
                                                                                 ⎠
                                                                                         ⎥,
                                                                                         ⎥
                                                   ⎣                                     ⎦
где xj – значение характеристики в середине j-го интервала, nj – частота,
или число наблюдений в j-м интервале, m – число интервалов, n – объем
выборки. Группировка данных приводит к некоторой неточности расчета
дисперсии, однако получаемой при этом погрешностью при большом объ-
еме выборки можно пренебречь.
      Эффективной, состоятельной и несмещенной оценкой среднего
квадратического (стандартного) отклонения является «исправленное»
выборочное среднее квадратическое отклонение:
                              s ′ = cn ⋅ s 2 ,
где сn – поправочный коэффициент, зависящий от объема выборки n; при
n > 60 можно принять сn = 1 (табл. 1). Квадратный корень из выборочной
дисперсии s 2 без поправочного коэффициента в случае малого объема
выборки является эффективной, состоятельной, но смещенной оценкой
среднего квадратического отклонения.
                                                                                              Таблица 1
                   Значения поправочных коэффициентов cn и βn
   n         cn          βn            n               cn          βn          n                  cn
    1        –            –            11            1,025       0,9300        25               1,010
    2      1,253       0,5642          12            1,023       0,9359        30               1,008
    3      1,128       0,7236          13            1,021       0,9410        35               1,007
    4      1,085       0,7979          14            1,019       0,9453        40               1,006
    5      1,064       0,8407          15            1,018       0,9490        45               1,006
    6      1,051       0,8686          16            1,017       0,9523        50               1,005
    7      1,042       0,8882          17            1,016       0,9551        55               1,004
    8      1,036       0,9027          18            1,015       0,9576        60               1,004
    9      1,032       0,9139          19            1,014       0,9599       > 60                1
   10      1,028       0,9227          20            1,013       0,9619

     Оценка среднего квадратического отклонения по результатам обсле-
дования нескольких выборок одинакового объема производится по форму-
ле
                                               m

                                              ∑s
                                              j =1
                                                     j

                                    s=                       ,
                                                       n
                                         m⋅ βn
                                                     n −1
где m – количество выборок, n – объем каждой выборки, s j = c n ⋅ s 2 –
                                                                    j

выборочные средние квадратические отклонения, βn – коэффициент, за-
висящий от объема выборки; при n > 20 можно принять βn = 1 (табл. 1).

                                                     9


      Для сравнения рассеяния разноименных случайных величин в от-
дельных случаях применяются безразмерные меры рассеяния. Одной из
                                                      s
них служит выборочный коэффициент вариации v = , представляющий
                                                      x
собой отношение среднего квадратического отклонения к выборочному
среднему значению. Часто коэффициент вариации выражают в процентах.
      Статистической оценкой асимметрии – меры «скошенности» рас-
пределения – является выборочный показатель асимметрии:
                                1 n
                          A = 3 ∑ (x i − x ) ⋅ ni ,
                                            3

                               ns i =1
где n – объем выборки, xi – значения характеристик, ni – их частоты, x –
выборочное среднее, s – выборочное среднее квадратическое отклонение.
В случае большого объема выборки (n > 50) выборочный показатель асим-
метрии удобнее вычислять по формуле
                          A = 3 ∑ (x j − x ) ⋅ n j .
                                1 m         3

                              ns j =1
Здесь xj – значение характеристики в середине j-го интервала, nj – частота,
или число наблюдений в j-м интервале, m – число интервалов.
      Показатель асимметрии изменяется от –∞ до +∞. При А = 0 распре-
деление считается симметричным, при А > 0 распределение имеет «ско-
шенность» влево (длинный хвост распределения справа) и при А < 0 рас-
пределение «скошено» вправо (длинный хвост слева) (рис. 1). Для асим-
метричных распределений характерен сдвиг частот от средних значений:
вправо (А > 0) или влево (А < 0).

   а                                          б




       Рис. 1. Асимметрия распределения: положительная (а) и отрицательная (б)



     Статистической оценкой эксцесса распределения – меры выпуклости
или пологости верхней части кривой распределения – является выбороч-
ный показатель эксцесса (рис. 2). Для эксцессивных кривых характерно
чрезмерное накапливание частот в центральных классах (положительный
эксцесс) или, наоборот, снижение (отрицательный эксцесс).
                                      10



    
Яндекс цитирования Яндекс.Метрика