Построить модель зависимости и вычислить коэффициент детерминации

Условие:

решить задачу и посчитать коэффициент детерминации

Условие: решить задачу и посчитать коэффициент детерминации

Решение:

Предмет: Математика
Раздел: Статистика, регрессионный анализ


Дана задача исследования зависимости стоимости загородного дома от расстояния до центра. Необходимо построить модель зависимости и вычислить коэффициент детерминации.


Данные:

Расстояние до центра, км (x)1020304050
Стоимость дома, млн.руб. (y)42211

Шаг 1. Найдем параметры линейной регрессии вида:

y = a + bx

где a — свободный член, b — коэффициент наклона.


Шаг 2. Найдем средние значения \bar{x} и \bar{y}:

 \bar{x} = \frac{10 + 20 + 30 + 40 + 50}{5} = \frac{150}{5} = 30 

 \bar{y} = \frac{4 + 2 + 2 + 1 + 1}{5} = \frac{10}{5} = 2 


Шаг 3. Найдем коэффициент наклона b:

 b = \frac{\sum (x_i - \bar{x})(y_i - \bar{y})}{\sum (x_i - \bar{x})^2} 

Посчитаем числитель:

x_iy_ix_i - \bar{x}y_i - \bar{y}(x_i - \bar{x})(y_i - \bar{y})
10410 - 30 = -204 - 2 = 2-20 * 2 = -40
20220 - 30 = -102 - 2 = 0-10 * 0 = 0
30230 - 30 = 02 - 2 = 00 * 0 = 0
40140 - 30 = 101 - 2 = -110 * (-1) = -10
50150 - 30 = 201 - 2 = -120 * (-1) = -20

Сумма числителя:

 \sum (x_i - \bar{x})(y_i - \bar{y}) = -40 + 0 + 0 - 10 - 20 = -70 

Посчитаем знаменатель:

x_ix_i - \bar{x}(x_i - \bar{x})^2
10-20400
20-10100
3000
4010100
5020400

Сумма знаменателя:

 \sum (x_i - \bar{x})^2 = 400 + 100 + 0 + 100 + 400 = 1000 


Шаг 4. Вычислим b:

 b = \frac{-70}{1000} = -0.07 


Шаг 5. Найдем a по формуле:

 a = \bar{y} - b \bar{x} = 2 - (-0.07) \times 30 = 2 + 2.1 = 4.1 


Итоговое уравнение регрессии:

 \hat{y} = 4.1 - 0.07x 


Шаг 6. Посчитаем коэффициент детерминации R^2.

Для этого нужно вычислить:

  • Общее отклонение (сумму квадратов отклонений наблюдаемых значений от среднего):

 SS_{tot} = \sum (y_i - \bar{y})^2 

  • Остаточную сумму квадратов (сумму квадратов отклонений наблюдаемых значений от предсказанных):

 SS_{res} = \sum (y_i - \hat{y}_i)^2 


Посчитаем SS_{tot}:

y_iy_i - \bar{y}(y_i - \bar{y})^2
44 - 2 = 24
22 - 2 = 00
22 - 2 = 00
11 - 2 = -11
11 - 2 = -11

Сумма:

 SS_{tot} = 4 + 0 + 0 + 1 + 1 = 6 


Посчитаем предсказанные значения \hat{y}_i:

x_i\hat{y}_i = 4.1 - 0.07 x_i
104.1 - 0.07*10 = 4.1 - 0.7 = 3.4
204.1 - 0.07*20 = 4.1 - 1.4 = 2.7
304.1 - 0.07*30 = 4.1 - 2.1 = 2.0
404.1 - 0.07*40 = 4.1 - 2.8 = 1.3
504.1 - 0.07*50 = 4.1 - 3.5 = 0.6

Посчитаем SS_{res}:

y_i\hat{y}_iy_i - \hat{y}_i(y_i - \hat{y}_i)^2
43.44 - 3.4 = 0.60.36
22.72 - 2.7 = -0.70.49
22.02 - 2.0 = 00
11.31 - 1.3 = -0.30.09
10.61 - 0.6 = 0.40.16

Сумма:

 SS_{res} = 0.36 + 0.49 + 0 + 0.09 + 0.16 = 1.1 


Шаг 7. Вычислим коэффициент детерминации:

 R^2 = 1 - \frac{SS_{res}}{SS_{tot}} = 1 - \frac{1.1}{6} = 1 - 0.1833 = 0.8167 


Ответ:

  • Уравнение регрессии:
     \hat{y} = 4.1 - 0.07x 

  • Коэффициент детерминации:
     R^2 \approx 0.82 

Это означает, что около 82% вариации стоимости дома объясняется изменением расстояния до центра.

Если нужна дополнительная помощь — обращайтесь!

Не нашли нужного вам решения? Оставьте заявку и наши авторы быстро и качественно помогут вам с решением.
Оставить заявку
Работа вам нужна срочно. Не волнуйтесь, уложимся!
  • 22423 авторов готовы помочь тебе.
  • 2402 онлайн