Статистические методы для анализа закономерностей в эмпирических данных
СТАТИСТИЧЕСКИЕ МЕТОДЫ ДЛЯ АНАЛИЗА ЗАКОНОМЕРНОСТЕЙ В ЭМПИРИЧЕСКИХ ДАННЫХ
Введение
ЗАДАНИЕ:
Анализ продуктов питания
Лаборатория производит анализ продуктов, которые обрабатываются при определенной температуре X 1 (t, °С), и в которые добавляются для увеличения срока годности определенные консерванты Х 2 (мг). В готовом продукте может содержаться некоторое количество нежелательных веществ Y (в долях к общей массе). Х 1 и Х 2 даны в относительных единицах (абсолютные значения t О (60; 80); консервант Х 2 О (0,5; 1)), Y - в абсолютных
Необходимо определить зависимость Y = f(Х 1 ,Х 2 ) и установить значения Х 1 и Х 2 , которые обеспечивают номинал Y ном. =0,009; 0,010; 0,011; 0,01 г. Определить ошибку e , которая соответствует установленному номиналу Y ном
Исходные данные, соответствующие конкретному варианту:
№ | X 1i | Х 2i | Y i |
1. | 3 | 6 | 0,016 |
2. | 3 | 6 | 0,015 |
3. | 3 | 6 | 0,014 |
4. | 6 | 4 | 0,014 |
5. | 4 | 7 | 0,013 |
6. | 4 | 7 | 0,013 |
7. | 9 | 1 | 0,011 |
8. | 9 | 1 | 0,012 |
9. | 1 | 10 | 0,012 |
10. | 1 | 10 | 0,017 |
11. | 1 | 10 | 0,015 |
12. | 9 | 2 | 0,009 |
13. | 9 | 2 | 0,010 |
14. | 2 | 9 | 0,014 |
15. | 2 | 9 | 0,018 |
Описание задачи статистического анализа .
выборочное среднее:
выборочная дисперсия:
среднеквадратичное отклонение:
мат. ожидание произведения для вычисления коэф. ковариации:
Оценка параметров регрессии fr(x)=a+b*x
Уравнение линейной регрессии:
коэффициент корреляции:
отклонения фактических значений от теоретических (ошибка):
Расчетная часть
Вычисленные характеристики заданных факторов:
Фактор | N | Mxy | Mx | Dx | s x | a | b, 10 -4 | rxy |
X1 | 15 | 0.054 | 4.4 | 9.307 | 3.051 | 0.016 | -6.032 | -0.761 |
X2 | 15 | 0.086 | 6 | 10.267 | 3.204 | 0.01 | 5.13 | 0.68 |
Выявление линейной связи Y от X1 и Y от Х2 Фактор Х1:
Фактор Х2:
Вывод: вариационный ряд случайной ошибки: видно, что нормальный закон распределения искажен, что свидетельствует о неадекватности выявленной зависимости
Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитаем t-критерии Стьюдента и доверительный интервал каждого из показателей. Оценка значимости коэффициентов регрессии и корреляции с помощью критерия Стьюдента проводится путем сопоставления их значений с величиной случайной ошибки:
tb=b/mb; ta=a/ma; trxy=rxy/mrxy; где mb,ma,mrxy - величины случайной ошибки
Выдвигаем гипотезу H0 о статистически незначимом отличии параметров линейной регрессии от нуля: a=b=rxy = 0.
Определяем tтабл - это квантиль уровня 1-a/2 распределения Стьюдента с параметром n-m-1, где m - число параметров функции регресии при x
Определяем случайные ошибки
Фактичекие t-статистики
Фактор | Soct, 10 -3 | Ma, 10 -4 | mb, 10 -4 | Mrxy | ta | tb | trxy | rxy 2 |
Х1 | 1.686 | 7.64 | 1.427 | 0.18 | 21.189 | 4.227 | 4.227 | 0.579 |
Х2 | 1.906 | 1.04 | 1.536 | 0.203 | 10.01 | 3.341 | 3.341 | 0.462 |
Коэффициент детерминации: rxy 2
Так как фактические t-статистики превосходят tтабл = 2.16 , то гипотеза H0 отклоняется, т.е. a,b,rxy неслучайно отличаются от нуля и статистически значимы на уровне a =0.05
( фактор Х1)
В среднем расчетные значения функции регрессии отклоняются от фактических на 9.6%. Качество построенной модели оценивается как хорошее(менее 10%)
(фактор Х2)
В среднем расчетные значения функции регрессии отклоняются от фактических на 11.5%. Качество построенной модели оценивается как плохое(более 8%)
Проверим гипотезу о статистической незначимости уравнения регрессии показателя тесноты связи (критерий Фишера).
Выдвигаем гипотезу H0 о статистической незначимости уравнения регрессии показателя тесноты связи
Критериальная статистика: Ffakt=(n-m-1)*((rxy)2/(1-(rxy)2)
Критическая область: Ftabl Фактор Ffakt Ftabl Х1 17.869 4.667 Х2 11.16 4.667 Вывод: так как < , то это указывает на необходимость отклонить принятие гипотезы H0 о случайной природе выявленной зависимости и статистической незначимости при a=0.05 уравнения регрессии и показателя тесноты связи Расчет доверительного интервала для a,b. Для этого определим предельную ошибку для каждого параметра функции регрессии. Доверительные интервалы параметров функции регрессии Фактор D a,10 -3 D b,10 -3 amin(amax) bmin(bmax) 10 -4 Х1 1.65 3.083 0.015(0.018) -9.114(-2.949) Х2 2.256 3.317 0.0082(0.013) 1.812(8.447) Анализ верхней и нижней границ доверительных интервалов приводят к выводу о том, что с вероятностью P = 1-a =0.95 параметры ,находясь в указанных границах, не принимают нулевых значений, т.е. не является статистически незначимыми и существенно отличаются от нуля Фактор Х1 Фактор Х2 Полученные оценки уравнения регрессии позволяют использовать его для прогноза прогнозное значение фактора прогнозное значение результата Ошибка прогноза составит: Предельная ошибка прогноза, которая в 95% случаев не будет превышена, составит: Доверительный интервал прогноза: Выборка xp yp myp, 10 -3 D yp, 10 -3 ypmin(ypmax), 10 -3 Х1 4.62 0.013 1.741 3.762 9.638(17) Х2 6.3 0.014 1.969 4.253 9.434(18) Анализ полученных результатов. По полученным данным можно сделать вывод, что две величины X1,X2 влияют на Y, т.к. на данном уровне значимости коэффициенты корреляции не равны нулю, что подтверждает гипотеза о параметрах a,b,rxy. Про зависимость Y от Х1 можно сказать, что Y зависит от X1 линейно. Этот факт подтверждается значениями признаков: приемлемой ошибкой аппроксимации , близким к нулю значением коэффициента при х в функции регрессии и отношением величины этого коэффициента к величины его доверительного интервала. Этот же вывод можно сделать по графическим представлениям зависимостей. Что касается зависимости Y от Х2, то можно сказать, что Y зависит от X2 линейно. Этот факт подтверждается значениями тех же признаков, что и для описанных выше зависимостей Из-за допущенной отрицательной ошибки D нет значений X1 и X2, которые удовлетворяют заданному номиналу 0.009
Категории:
- Астрономии
- Банковскому делу
- ОБЖ
- Биологии
- Бухучету и аудиту
- Военному делу
- Географии
- Праву
- Гражданскому праву
- Иностранным языкам
- Истории
- Коммуникации и связи
- Информатике
- Культурологии
- Литературе
- Маркетингу
- Математике
- Медицине
- Международным отношениям
- Менеджменту
- Педагогике
- Политологии
- Психологии
- Радиоэлектронике
- Религии и мифологии
- Сельскому хозяйству
- Социологии
- Строительству
- Технике
- Транспорту
- Туризму
- Физике
- Физкультуре
- Философии
- Химии
- Экологии
- Экономике
- Кулинарии
Подобное:
- Стратегический бомбардировщик ТУ-95 и его модификации
СТРАТЕГИЧЕСКИЙ БОМБАРДИРОВЩИК ТУ-95 И ЕГО МОДИФИКАЦИИОписание Ту-95 Восьмиместный цельнометаллический свободнонесущий высокоплан с чет
- Стратоплан для космолета
СТРАТОПЛАН ДЛЯ КОСМОЛЕТА Во второй половине 50-х годов было принято говорить и писать о соревновании в космосе между Советским Союзом и
- Судостроение в России
СУДОСТРОЕНИЕ В РОССИИ В России в народном хозяйстве судостроительная промышленность занимает не последнее, а скорей одно из ведущих м
- Схемотехническое и функциональное проектирование вакуумной коммутационной аппаратуры
СХЕМОТЕХНИЧЕСКОЕ И ФУНКЦИОНАЛЬНОЕ ПРОЕКТИРОВАНИЕ ВАКУУМНОЙ КОММУТАЦИОННОЙ АППАРАТУРЫСодержание ВВЕДЕНИЕ АЛГОРИТМ СХЕМОТЕХНИЧЕСКОЕ
- Тактильные датчики
ТАКТИЛЬНЫЕ ДАТЧИКИПоявление тактильных датчиков, предназначенных для геометрического распознавания предметов окружающего пространс
- Танки армий капиталистических стран
ТАНКИ АРМИЙ КАПИТАЛИСТИЧЕСКИХ СТРАН Первые проекты боевой бронированной техники появились в России в 1911 - 1915 годах (инженеры В. Менделе
- Тепловые двигатели
ТЕПЛОВЫЕ ДВИГАТЕЛИДВИГАТЕЛЬ ВНУТРЕННЕГО СГОРАНИЯ Один из самых распространенных тепловых двигателей - двигатель внутреннего сгорания