Статистико-маркетинговое исследование
признака, т.е. те границы, в пределах которых с заданной доверительной вероятностью будет находиться теоретическое значение у. Поскольку параметры уравнения регрессии определяются по выборочным данным, являясь функцией наблюденных значений, оценки параметров a и b содержат некоторую погрешность. Дисперсия значения зависимой переменной, определяемой по уравнению линейной зависимости, будет складываться из дисперсии параметра а и дисперсии параметра b.
Зная дисперсию показателя y~ и задаваясь уравнением доверительной вероятности, можно определить доверительные границы результативного признака при
значении факторного признака x0 следующим образом:
где t определяется в соответствии с уровнем значимости по t-распределению Стьюдента.
Величина множителя будет вычисляться для каждого значения x0. С удалением значения факторного признака от своего среднего арифметического значения величина CX0 будет возрастать.
Поскольку параметры уравнения регрессии определяются по выборочным данным, являясь функцией наблюденных значений, оценки параметров а и b содержат некоторую погрешность. Поэтому, как и во всех случаях оценки параметров генеральной совокупности по выборочным данным, возникает задача проверки гипотезы о величине коэффициента регрессии.
4.3 Перенесение среднего потребления на район № 35
Построим сложную группировку по признакам, у которых связь с потреблением существенна (род занятий и образование) (табл. 4.12). Найдем среднее потребление в каждой группе и перенесем его в соответствующую группу во второй район. Коэффициент доверия в группе надо находить по таблице Стьюдента, так как каждая группа представляет собой малую выборку. После этого необходимо найти предельную ошибку в каждой группе потребителей
xj= tjSx,
где Sx средняя ошибка средней из первого района, t=1,96
и рассчитать предельную ошибку средней для всего района в целом (как взвешенную среднюю, у которой вес количество человек в группе):
.
Тогда среднее потребление во втором районе находится в интервале:
0,3927-0,0698 0,3927+0,0698;
0,3229 0,4625.
Если каждый из каждую границу доверительного интервала среднего потребления умножить на количество человек в районе (100000 чел.), то получим границы доверительного интервала емкости рынка по данной продукции (в кг):
32290 Е 46250
5 Расчет доли потребителей с доходом до 1000 руб./мес.В районе № 40
Доля потребителей с доходом до 1000 руб./мес в районе №40:
Доверительные пределы генеральной доли выглядят так:
.
Величина доверительного интервала для генеральной доли зависит от величины предельной ошибки выборки p. Чем больше величина предельной ошибки выборки, тем больше величина доверительного интервала и тем, следовательно, ниже точность оценки.
Поскольку величина предельной ошибки выборки равна t, точность оценки параметров генеральной совокупности будет зависеть от принятого уровня доверительной вероятности и от величины стандартной ошибки выборки.
Средняя ошибка доли для бесповторной выборки:
(или 4,2 %)
С вероятностью F =0,95 можем утверждать, что предельная ошибка доли потребителей с доходом до 1000 руб./мес. в первом районе не превысит 0,0823 (р = 1,96Sp) и доля этих потребителей в генеральной совокупности будет находиться в интервале: 0,1817 0,3463.
6 ПРОВЕРКА ГИПОТЕЗЫ О НОРМАЛЬНОМ ЗАКОНЕ РАСПРЕДЕЛЕНИЯ ПОКАЗАТЕЛЯ «СРЕДНЕМЕСЯЧНЫЙ ДОХОД» В РАЙОНЕ № 40
Степень расхождения теоретических и эмпирических частот оценивается с помощью особых показателей критериев согласия, с помощью которых проверяется гипотеза о законе распределения. Критерии согласия основаны на использовании различных мер расстояний между анализируемым эмпирическим распределением и функцией распределения признака в генеральной совокупности.
Одним из наиболее часто употребляемых критериев согласия является критерий «хи-квадрат» (2), предложенный К. Пирсоном,
где fj и f`j соответственно частоты эмпирического и теоретического распределений в j-том интервале.
Чем больше разность между наблюдаемыми и теоретическими частотами, тем больше величина критерия Пирсона. Чтобы отличить существенные значения 2 от значений, которые могут возникнуть в результате случайностей выборки, рассчитанное значение критерия сравнивается с табличным значением 2табл при соответствующем числе степеней свободы и заданном уровне значимости. Уровень значимости выбираем таким образом, что Р (2расч.> 2табл.) = (величина принимается равный 0,05 или 0,01).
Определив значение критерия Пирсона по данным конкретной выборки, можно встретиться с такими вариантами:
1) 2расч.> 2табл. , т.е. 2 попадает в критическую область. Это означает, что расхождение между эмпирическими и теоретическими частотами существенно и его нельзя объяснить случайными колебаниями выборочных данных. В таком случае гипотеза о близости эмпирического распределения к нормальному отвергается.
2) 2расч. 2табл. , т.е. рассчитанный критерий не превышает максимально возможную величину расхождений эмпирических и теоретических частот, которая может возникнуть в силу случайных колебаний выборочных данных. В этом случае гипотеза о близости эмпирического распределения к нормальному не отвергается.
Табличное значение критерия Пирсона определяется при фиксированном уровне значимости и соответствующем числе степеней свободы.
Число степеней свободы равно k-l-1, где l число условий, которые предполагаются выполненными при вычислении теоретических частот, k число групп.
Так как при вычислении теоретических частот нормального распределения в качестве оценок генеральной средней и дисперсии используются соответствующие выборочные характеристики, то для проверки гипотезы о нормальности распределения число степеней свободы равно (k-3).
При расчете критерия Пирсона нужно соблюдать следующие условия:
1) число наблюдений должно быть достаточно велико, во всяком случае n50;
2) 2) если теоретические частоты в некоторых интервалах меньше 5, то такие интервалы объединяют так, чтобы частоты были более 5.
Расчеты по вычислению 2 приведены в таблицах 6.1 и 6.2.
Таблица 6.1
ДоходfjМенее 960605261573044639038,34-1,008470,239914960-16701315344471012252243,06-0,462020,3586221670-238020252346575276784,070,084430,3975242380-309027359246156047172,810,630870,3270203090-3800344562067014039892,541,177320,1995123800-4510415541662020065024,361,723770,090364510-5220486541946034802920,362,270220,03032Более 5220557542230053573616,362,816670,00760Итого110210680185696691,90где xj середина интервала;
fj количество человек в группе;
t нормативное отклонение;
f(t) нормированная функция,
f теоретическая чистота.
Средний доход: ;
СКО:;
Объединив интервалы 6-8, получаем следующие данные:
Таблица 6.2
Номер интервалаЭмпирическиечастотыТеоретическиечастоты126149,300235227,189323240,03449205,77456122,99361282,000Итого27,284
Критерий Пирсона (фактический):
Критерий Пирсона (табличный): (d.f.= 6-3 =3).
Так как , то не подтверждается гипотеза о нормальном распределении показателя «среднемесячный доход потребителя» в районе № 40.
ЗАКЛЮЧЕНИЕ
При определении
скачать реферат
1 2 3 4 5 6 7 ... последняя