Исходные данные



Дата28.02.2018
Размер1.13 Mb.
Название файластатистика.DOC


Задание:

В ниже следующей табл. собраны сведения о производительности труда рабочего очистного забоя для струговых установок на антрацитовых шахтах. Обозначения: Х – скорость подвигания забоя м/мес.У – средняя производительность за месяц ,т/вых.


Таблица 1 – Исходные данные

х

30

29

34,7

44

58,4

46

38

47

60

28

у

7,8

8,4

7,6

7,2

8,25

7,05

10,7

11,5

14,1

9,55

х

36

42

45,5

18,9

19,4

30,4

38

43,8

49,1

31,1

у

9,2

10,7

12,5

8,1

3,7

5,6

6,8

6,9

7,1

6,1

х

32,2

21,7

26,1

20

12,2

15

18

10

38,7

48

у

5,8

6,4

3,4

8,2

6,5

6,2

4,9

6,4

6,1

5,6

х

53

45,5

38,7

32,5

26,5

21,7

32,3

23,8

38,2

32

у

6,4

6,8

6

5,5

4,8

3,5

10,1

6,2

3,22

7,88

х

35,6

15

23,5

38



















у

4,13

5,24

8,6

8,8


















В пункте 4 взять а=0,05 и проверить на нормальность закона распределения признака Х.

В пункте 10 сделать прогноз при Х=55 м/мес.

Найти:


1. Провести первичную обработку статистических данных. Результаты представить в виде таблиц. Построить вариационные ряды для каждого признака.

2. Построить гистограмму и полигон частот (или относительных частот) по каждому признаку.

3. Используя метод «условного нуля», определить числовые характеристики выборок по каждому признаку: выборочное среднее; выборочную дисперсию; исправленную выборочную дисперсию; исправленное выборочное среднее квадратическое отклонение. Дать объяснение полученным результатам.

4. При уровне значимости а=0,05 проверить гипотезы о нормальных законах распределения генеральных совокупностей по признаку Х.

5. Для признаков Х и У построить корреляционное поле и дать предварительный анализ зависимости между признаками.

6. Определить параметры уравнения линейной регрессии.

7. Определить коэффициент корреляции и проверить его значимость. Найти коэффициент детерминации. Сделать вывод о наличии связи между признаками, используя шкалу Чеддока.

8. Построить полученную линию регрессии.

9. Определить абсолютную и относительную среднеквадратическую погрешность уравнения линейной регрессии.

10. Используя полученное уравнение регрессии, дать точечный прогноз по признаку У при заданном значении признака Х=55 м/мес.


Решение
1. А) Для признака Х определим наибольшее и наименьшее значение признака: Хмин = 10, Хмакс = 60, объем выборки n=44.

Число интервалов разбиения определим по формуле Стэрджесса:

К=1+3,3322*lg n = 1 +3,3322*lg44 = 7.

Найдем шаг разбиения h=(60-10)/7=7,14. Примем h=7,14.

Произведем группировку данных для признака Х. Для этого подсчитаем, сколько значений признака Х попадает в каждый из интервалов разбиения. Причем, при совпадении значения признака с одной из границ интервала, включаем это значение в левый интервал. Результаты группировки заносим в табл. 2, которая представляет вариационный ряд по признаку Х.
Таблица 2 - Группировка данных для признака Х


Интервал

10-17,14

17,14-24,29

24,29-31,43

31,43-38,57

38,57-45,71

45,71-52,86

52,86-60,00

Сред.интерв. Хі

13,57

20,71

27,86

35,00

42,14

49,29

56,43

частота ni

4

8

7

11

7

4

3

Проверка осуществляется по формуле: 

У нас: 54+8+7+11+7+4+3=44. Верно.
Б) Для признака У определим наибольшее и наименьшее значение признака: Умин = 3,22, Умакс = 14,1, объем выборки n=44.

Число интервалов разбиения определим по формуле Стэрджесса:

К=1+3,3322*lg n = 1 +3,3322*lg44 = 7.

Найдем шаг разбиения h=(14,1-3,22)/7=1,55. Примем h=1,55.

Произведем группировку данных для признака У. Для этого подсчитаем, сколько значений признака У попадает в каждый из интервалов разбиения. Причем, при совпадении значения признака с одной из границ интервала, включаем это значение в левый интервал. Результаты группировки заносим в табл. 3, которая представляет вариационный ряд по признаку У.
Таблица 3 - Группировка данных для признака У


Интервал

3,22-4,77

4,77-6,33

6,33-7,88

7,88-9,43

9,43-10,99

10,99-12,55

12,55-14,10

Сред.интерв. Уі

4,00

5,55

7,11

8,66

10,21

11,77

13,32

частота ni

5

12

13

7

4

2

1

Проверка осуществляется по формуле: 

У нас: 5+12+13+7+4+2+1=44. Верно.

2. А) Построим полигон и гистограмму частот по признаку Х.

При построении гистограммы на оси абсцисс откладывают интервалы разбиения признака Х, при построении полигона – середины интервалов разбиения признака хі. По оси ординат в каждом случае откладывают частоты ni. Полученную ступенчатую фигуру называют гистограммой, ломаную линию – полигоном.

Рисунок 1 – Полигон частот среднего интервального для Х

Рисунок 2 – Гистограмма среднего интервального для Х

Б) Построим полигон и гистограмму частот по признаку У



Рисунок 3 - Полигон частот среднего интервального для У

Рисунок 4 - Гистограмма среднего интервального для У
3. А) Определим числовые характеристики выборки по признаку Х. Используем метод «условного нуля». Выберем условный нуль из вариационного ряда признака Х (табл. 2). Обычно в качестве условного нуля берут середину вариационного ряда: С=35,00

Переходим к условным вариантам по формуле: ui=(xi-C)/h, где h=7,1429.


Таблица 4 – Вспомогательная таблица для определения числовых характеристик выборки по признаку Х

j

интервалы

xi

ni

ui

ni*ui

ni*ui^2

ni*(ui+1)^2

1

10

17,143

13,57

4

-3

-12

36

16

2

17,143

24,286

20,71

8

-2

-16

32

8

3

24,286

31,429

27,86

7

-1

-7

7

0

4

31,429

38,571

35,00

11

0

0

0

11

5

38,571

45,714

42,14

7

1

7

7

28

6

45,71

52,86

49,29

4

2

8

16

36

7

52,86

60,00

56,43

3

3

9

27

48

Итого







44




-11

125

147

Для проверки правильности вычислений используем тождество:



Подставляя из таблицы значения сумм



=147,

=125,

=-11,

 = 44,

получим верное равенство: 147=125+2*(-11)+44

147=147 – верно.

Из таблицы находим условные моменты:

М1=/ = -11/44=-0,25

М2=/ =125/44=2,84

Выборочная средняя равна: хв=М1*h+C= -0,25*7,14+35=33,21

Выборочная дисперсия равна:



=(2,84-(-0,25)^2*7,14^2=141,756

Выборочное среднее квадратическое отклонение равно:



 = =11,906

Вычислим исправленную выборочную дисперсию:



=44/43*141,756=145,05

Вычислим исправленное выборочное среднее квадратическое отклонение



=12,044. Обозначим результат 12,044.

Полученные результаты позволяют сделать следующие выводы.

Средняя скорость подвигания забоя по выборке равна 33,21 м/мес. Средний разброс скорости подвигания забоя вокруг среднего по выборке равен 12,044 м/мес.

Б) Аналогично определяем числовые характеристики выборки по признаку У. Выберем условный нуль С=8,66, h=1,55.


Таблица 5 – Вспомогательная таблица для определения числовых характеристик выборки по признаку У

j

интервалы

уi

ni

ui

ni*ui

ni*ui^2

ni*(ui+1)^2

1

3,22

4,7743

4,00

5

-3

-15

45

20

2

4,7743

6,3286

5,55

12

-2

-24

48

12

3

6,3286

7,8829

7,11

13

-1

-13

13

0

4

7,8829

9,4371

8,66

7

0

0

0

7

5

9,4371

10,991

10,21

4

1

4

4

16

6

10,99

12,55

11,77

2

2

4

8

18

7

12,55

14,10

13,32

1

3

3

9

16

Итого







44




-41

127

89

Для проверки правильности вычислений используем тождество:



Подставляя из таблицы значения сумм



=89,

=127,

=-41,

 = 44,

получим верное равенство: 89=127+2*(-41)+44

89=89 – верно.

Из таблицы находим условные моменты:

М1=/ = -41/44=-0,93

М2=/ =127/44=2,89

Выборочная средняя равна: yв=М1*h+C= -0,93*1,55+8,66=7,21

Выборочная дисперсия равна:



=(2,89-(-0,93)^2*1,55^2=4,87

Выборочное среднее квадратическое отклонение равно:



 = =2,21

Вычислим исправленную выборочную дисперсию:



=44/43*4,87=4,98

Вычислим исправленное выборочное среднее квадратическое отклонение



=2,23. Обозначим результат 2,23.

Полученные результаты позволяют сделать следующие выводы.

Средняя производительность за месяц по выборке равна 7,21 т/вых. Средний разброс производительности за месяц вокруг среднего по выборке равен 2,23 т/вых.
4. Проверим гипотезу о нормальном распределении признака Х. Используем критерий Пирсона. Для этого заполним таблицу по формулам: , 

При этом крайнюю левую точку заменяем на -, крайнюю правую точку заменяем на +.



Теоретические частоты найдем по формуле: , где функция  вычисляется по таблице. При этом учитываем, что =, =-0,5, =0,5.
Таблица 6 – Данные для проверки гипотезы о нормальном распределении признака Х

Хi

Хi+1

ni

zi

zi+1

Ф(zi)

Ф(zi+1)

ni'

N'

N

Bi

Vi

10,00

17,14

4,00



-1,33

-0,50

-0,41

4,04

10,11

12,00

0,35

14,25

17,14

24,29

8,00

-1,33

-0,74

-0,41

-0,27

6,07

9,27

7,00

0,56

5,29

24,29

31,43

7,00

-0,74

-0,15

-0,27

-0,06

9,27

10,10

11,00

0,08

11,98

31,43

38,57

11,00

-0,15

0,44

-0,06

0,17

10,10

7,96

7,00

0,11

6,16

38,57

45,71

7,00

0,44

1,04

0,17

0,35

7,96

6,56

7,00

0,03

7,46

45,71

52,86

4,00

1,04

1,63

0,35

0,45

4,29

 

 

 

 

52,86

60,00

3,00

1,63

+

0,45

0,50

2,27

 

 

 

 

Итого

 

44

 

 

 

 

44

 

44,00

1,13

45,13

После заполнения 8-го столбца отмечаем, что один первый элемент и два последних элемента в этом столбце меньше пяти. Поскольку в критерии Пирсона требуется, чтобы в каждом интервале было не меньше пяти единиц, то объединим частоты двух первых интервалов и двух последних Ni’ – для 8-го столбца, Ni – для 3-го столбца.

11-ый столбец заполняем по формуле Bi=(Ni’-Ni)^2/Ni’.

12-ый столбец – контрольный. Он вычисляется по формуле: Vi=Ni2/Ni’.

Сделаем проверку: 44+1,13=45,13. Верно.

Заметим, что в результате проверки значения правой и левой частей могут отличается незначительным образом.

Запишем наблюдаемое значение критерия: хнабв2=10,94.

Выберем уровень значимости ошибки а=0,1.

Число степеней свободы равно k=l-3, где l – число интервалов после объединения. В нашем случае число интервалов после объединения l=5. Тогда число степеней свободы равно k=5-3=2. По таблице критических точек х2 находим хкр2(0,05;2)=6.

Сравниваем: хнабв2< хкр2.

Следовательно, нет оснований отвергнуть гипотезу о нормальном законе распределения признака Х.
5. Для признаков Х и Y построим корреляционное поле в системе координат ХОУ, используя исходную таблицу (условие).

Корреляционное поле на данном рисунке характеризуется набором из сорока четырех точек, причем можно заметить, что с увеличением Х признак У в среднем также растет.



Рисунок 5 – Корреляционное поле
Анализ полученного поля рассеяния позволяет предполагать наличие прямой корреляционной зависимости между признаками Х и У.
6. Уравнение линейной регрессии имеет вид: у=кх+b, где параметры к и bопределяются по методу наименьших квадратов из условия минимального отклонения исходных отклонения исходных точек корреляционного поля по прямой регрессии. Параметры к и b вычисляются по формулам:
; , где ;

Вместо параметров ;;, в дальнейшем,  можно взять оценки параметров, найденные ранее в пункте 3: хв, ув, ,.

Другой способ вычисления этих параметров основывается на форумах:

, , , .

Этот способ дает более точные результаты, но требует большее времени.

Делаем расчет по значения, найденным ранее:

хв=33,21, ув=7,21, =145,05,  =4,99.

Вычислим среднее произведения ху:

=251,13.

Следовательно, параметры уравнения регрессии равны:



(251,13-33,21*7,21)/145,05= 0,0799,

7,21-(0,0799)* 33,21=4,56.

Окончательно, уравнение линейной регрессии имеет вид:

у=0,0799х+4,56.
7. Определим выборочный коэффициент корреляции по формуле

. Поскольку=12,04, =2,233, то получим -0,0799*12,04/2,23=0,43.

Проверим коэффициент корреляции на значимость.

Основная гипотеза Но:rr=0

Конкурирующая гипотеза Н:rr≠0.

Для проверки гипотезы Но вычислим наблюдаемое значение критерия:

= 3,097

По таблице критических точек распределения Стьюдента найдем критическое значение критерия при уровне значимости ошибки а=0,05 и числе степеней свободы =-2=44-2=42.

tкр=tкр(0,05;42) = 2,02.

Сравниваем: tнабв>tкр.

Следовательно, нулевую гипотезу следует отвергнуть. Это значит, что коэффициент корреляции значимо отличается от нуля и признаки Х и У коррелированы.

Найдем коэффициент детерминации, который для случая линейного регрессии равен квадрату коэффициента корреляции: R=r2. В данной задаче получим следующий коэффициент детерминации: R=0,432=0,1859. Он говорит о том, что 18,59% вариации (дисперсии) скорости подвигания забоя объясняется вариацией средней производительностью за месяц. Для определения типа связи между признаками используем шкалу Чеддока. Для нашего случая r=0,43. Поэтому на основании шкалы Чеддока делаем вывод о том, что между скоростью подвигания забоя и средней производительностью за месяц существует умеренная связь.


8. По уравнению регрессии у=0,08х+4,556 построим прямую в той же системе координат, что и корреляционное поле. С этой целью рассчитаем координаты двух точек: х1=9, у1 = 0,08*9+4,556=5,28; х2=62, у2 = 0,08*62+4,556=9,51.

Построим точки на графике и соединим и прямой. Получим линию регрессии (рис. 6).



Рисунок 6 – График построения линии регрессии
9. Вычислим погрешности уравнения регресии.

а) абсолютная погрешность уравнения равна:



=2,02

б) Относительная погрешность уравнения равна:



=2,02/7,21=0,28

Отсюда видно, что среднеквадратическая ошибка вычислений по полученному уравнению регрессии составляет 28%.


10. Используем полученное уравнение регрессии для точечного прогноза У при Х=55 м/мес.

Упрогноз = 0,08*55+4,556=8,95



Следовательно, при 55 м/мес скорости подвигания забоя средняя производительность за месяц прогнозируется равной 8,95 т/вых . Ошибка прогноза составляет не более 28%



Поделитесь с Вашими друзьями:


База данных защищена авторским правом ©nashuch.ru 2017
обратиться к администрации

    Главная страница
Контрольная работа
Курсовая работа
Лабораторная работа
Пояснительная записка
Методические указания
Рабочая программа
Методические рекомендации
Теоретические основы
Учебное пособие
Практическая работа
Общие сведения
Федеральное государственное
Общая характеристика
Дипломная работа
Теоретические аспекты
Самостоятельная работа
Общая часть
Физическая культура
Методическое пособие
государственное бюджетное
История развития
квалификационная работа
Направление подготовки
Выпускная квалификационная
Техническое задание
Технологическая карта
Краткая характеристика
Понятие предмет
Общие положения
Теоретическая часть
Металлические конструкции
Методическая разработка
прохождении производственной
Сравнительная характеристика
Технология производства
Технические характеристики
Электрические машины
Исследовательская работа
Правовое регулирование
Математическое моделирование
Гражданское право
Общие требования
Описание технологического
История возникновения
Основная часть
Организация работы
бюджетное учреждение
Организация производства
Техническое обслуживание
Примерная программа
учреждение высшего