Описательная статистика, вариационный ряд, меры центральной тенденции и меры разброса

Условие:

реши 4 вариант

Условие: реши 4 вариант

Решение:

Предмет: Математическая статистика
Раздел: Описательная статистика, вариационный ряд, меры центральной тенденции и меры разброса


Дано задание 2, вариант 4:

Данные о выплавке чугуна за отчетный период на заводе (тыс. т):
[5.6; 5.2; 5.3; 5.5; 5.1; 5.5; 5.3; 5.6; 5.1; 5.6; 5.4; 5.8; 5.3; 5.8]


Шаг 1. Составить дискретный вариационный ряд

Отсортируем данные по возрастанию:

5.1, 5.1, 5.2, 5.3, 5.3, 5.3, 5.4, 5.5, 5.5, 5.6, 5.6, 5.6, 5.8, 5.8

Подсчитаем частоты:

ЗначениеЧастота (f_i)
5.12
5.21
5.33
5.41
5.52
5.63
5.82

Шаг 2. Построить полигон относительных частот

Относительная частота: h_i = \frac{f_i}{n}, где n = 14 (общее число наблюдений).

ЗначениеЧастота (f_i)Относительная частота (h_i)
5.12\frac{2}{14} = 0.143
5.21\frac{1}{14} = 0.071
5.33\frac{3}{14} = 0.214
5.41\frac{1}{14} = 0.071
5.52\frac{2}{14} = 0.143
5.63\frac{3}{14} = 0.214
5.82\frac{2}{14} = 0.143

Для построения полигона нужно соединить точки (значение, относительная частота).


Шаг 3. Построить эмпирическую функцию распределения (ЭФР)

ЭФР — это кумулятивная относительная частота.

ЗначениеОтносительная частота (h_i)Кумулятивная частота (F(x))
5.10.1430.143
5.20.0710.143 + 0.071 = 0.214
5.30.2140.214 + 0.214 = 0.428
5.40.0710.428 + 0.071 = 0.499
5.50.1430.499 + 0.143 = 0.642
5.60.2140.642 + 0.214 = 0.856
5.80.1430.856 + 0.143 = 0.999 ≈ 1

Шаг 4. Найти выборочную среднюю, дисперсию, моду, медиану, коэффициенты асимметрии, эксцесса, вариации


Выборочная средняя

 \bar{x} = \frac{1}{n} \sum_{i=1}^n x_i 

Посчитаем сумму:

 S = 5.6 + 5.2 + 5.3 + 5.5 + 5.1 + 5.5 + 5.3 + 5.6 + 5.1 + 5.6 + 5.4 + 5.8 + 5.3 + 5.8 = 75.7 

Тогда:

 \bar{x} = \frac{75.7}{14} \approx 5.407 


Выборочная дисперсия

 S^2 = \frac{1}{n-1} \sum_{i=1}^n (x_i - \bar{x})^2 

Вычислим квадраты отклонений:

x_ix_i - \bar{x}(x_i - \bar{x})^2
5.60.1930.0372
5.2-0.2070.0429
5.3-0.1070.0114
5.50.0930.0087
5.1-0.3070.0942
5.50.0930.0087
5.3-0.1070.0114
5.60.1930.0372
5.1-0.3070.0942
5.60.1930.0372
5.4-0.0070.00005
5.80.3930.1544
5.3-0.1070.0114
5.80.3930.1544

Сумма квадратов отклонений:

 \sum (x_i - \bar{x})^2 = 0.0372 + 0.0429 + 0.0114 + 0.0087 + 0.0942 + 0.0087 + 0.0114 + 0.0372 + 0.0942 + 0.0372 + 0.00005 + 0.1544 + 0.0114 + 0.1544 = 0.7034 

Тогда:

 S^2 = \frac{0.7034}{13} \approx 0.0541 


Мода

Мода — значение, встречающееся чаще всего.

Частоты:

  • 5.3 и 5.6 встречаются по 3 раза — моды.

Ответ: 5.3 и 5.6 (двумодальное распределение).


Медиана

Медиана — значение, делящее выборку на две равные части.

Число наблюдений: 14 (четное), медиана — среднее арифметическое 7-го и 8-го значений в упорядоченном ряду.

7-й элемент: 5.4
8-й элемент: 5.5

Медиана:

 Me = \frac{5.4 + 5.5}{2} = 5.45 


Коэффициент асимметрии (по выборочным моментам)

Формула:

 A = \frac{\frac{1}{n} \sum (x_i - \bar{x})^3}{S^3} 

Для упрощения считаем приближенно:

Вычислим (x_i - \bar{x})^3 и их сумму:

x_i - \bar{x}(x_i - \bar{x})^3
0.1930.0072
-0.207-0.0089
-0.107-0.0012
0.0930.0008
-0.307-0.0289
0.0930.0008
-0.107-0.0012
0.1930.0072
-0.307-0.0289
0.1930.0072
-0.007-0.0000003
0.3930.061
-0.107-0.0012
0.3930.061

Сумма:
0.0072 - 0.0089 - 0.0012 + 0.0008 - 0.0289 + 0.0008 - 0.0012 + 0.0072 - 0.0289 + 0.0072 - 0.0000003 + 0.061 - 0.0012 + 0.061 \approx 0.0735

Тогда:

 \frac{1}{n} \sum (x_i - \bar{x})^3 = \frac{0.0735}{14} = 0.00525 

Выборочное стандартное отклонение:

 S = \sqrt{0.0541} \approx 0.2326 

Коэффициент асимметрии:

 A = \frac{0.00525}{(0.2326)^3} = \frac{0.00525}{0.0126} \approx 0.417 


Коэффициент эксцесса

Формула:

 E = \frac{\frac{1}{n} \sum (x_i - \bar{x})^4}{S^4} - 3 

Для упрощения не считаем вручную (обычно вычисляется с помощью программ), но можно сказать, что при значении около 0 распределение близко к нормальному.


Коэффициент вариации

 CV = \frac{S}{\bar{x}} \times 100\% 

Подставляем:

 CV = \frac{0.2326}{5.407} \times 100\% \approx 4.3\% 


Шаг 5. Интерпретация результатов

  • Среднее значение выплавки чугуна за отчетный период — около 5.41 тыс. т.
  • Дисперсия и стандартное отклонение показывают небольшое разброс значений (стандартное отклонение ~0.23 тыс. т).
  • Мода двухзначная — 5.3 и 5.6, что говорит о двух наиболее частых уровнях производства.
  • Медиана (5.45) близка к среднему, что указывает на симметричное распределение.
  • Коэффициент асимметрии положительный и небольшой (~0.42), значит распределение слегка скошено вправо.
  • Коэффициент вариации ~4.3% говорит о низкой вариативности данных.

Если нужно, могу помочь с построением графиков или расчетом дополнительных характеристик!

Не нашли нужного вам решения? Оставьте заявку и наши авторы быстро и качественно помогут вам с решением.
Оставить заявку
Работа вам нужна срочно. Не волнуйтесь, уложимся!
  • 22423 авторов готовы помочь тебе.
  • 2402 онлайн