Работа вам нужна срочно. Не волнуйтесь, уложимся!
- 22423 авторов готовы помочь тебе.
- 2402 онлайн
решить задачу и посчитать коэффициент детерминации

Предмет: Математика
Раздел: Статистика, регрессионный анализ
Дана задача исследования зависимости стоимости загородного дома от расстояния до центра. Необходимо построить модель зависимости и вычислить коэффициент детерминации.
| Расстояние до центра, км (x) | 10 | 20 | 30 | 40 | 50 |
|---|---|---|---|---|---|
| Стоимость дома, млн.руб. (y) | 4 | 2 | 2 | 1 | 1 |
y = a + bx
где a — свободный член, b — коэффициент наклона.
\bar{x} = \frac{10 + 20 + 30 + 40 + 50}{5} = \frac{150}{5} = 30
\bar{y} = \frac{4 + 2 + 2 + 1 + 1}{5} = \frac{10}{5} = 2
b = \frac{\sum (x_i - \bar{x})(y_i - \bar{y})}{\sum (x_i - \bar{x})^2}
Посчитаем числитель:
| x_i | y_i | x_i - \bar{x} | y_i - \bar{y} | (x_i - \bar{x})(y_i - \bar{y}) |
|---|---|---|---|---|
| 10 | 4 | 10 - 30 = -20 | 4 - 2 = 2 | -20 * 2 = -40 |
| 20 | 2 | 20 - 30 = -10 | 2 - 2 = 0 | -10 * 0 = 0 |
| 30 | 2 | 30 - 30 = 0 | 2 - 2 = 0 | 0 * 0 = 0 |
| 40 | 1 | 40 - 30 = 10 | 1 - 2 = -1 | 10 * (-1) = -10 |
| 50 | 1 | 50 - 30 = 20 | 1 - 2 = -1 | 20 * (-1) = -20 |
Сумма числителя:
\sum (x_i - \bar{x})(y_i - \bar{y}) = -40 + 0 + 0 - 10 - 20 = -70
Посчитаем знаменатель:
| x_i | x_i - \bar{x} | (x_i - \bar{x})^2 |
|---|---|---|
| 10 | -20 | 400 |
| 20 | -10 | 100 |
| 30 | 0 | 0 |
| 40 | 10 | 100 |
| 50 | 20 | 400 |
Сумма знаменателя:
\sum (x_i - \bar{x})^2 = 400 + 100 + 0 + 100 + 400 = 1000
b = \frac{-70}{1000} = -0.07
a = \bar{y} - b \bar{x} = 2 - (-0.07) \times 30 = 2 + 2.1 = 4.1
\hat{y} = 4.1 - 0.07x
Для этого нужно вычислить:
SS_{tot} = \sum (y_i - \bar{y})^2
SS_{res} = \sum (y_i - \hat{y}_i)^2
Посчитаем SS_{tot}:
| y_i | y_i - \bar{y} | (y_i - \bar{y})^2 |
|---|---|---|
| 4 | 4 - 2 = 2 | 4 |
| 2 | 2 - 2 = 0 | 0 |
| 2 | 2 - 2 = 0 | 0 |
| 1 | 1 - 2 = -1 | 1 |
| 1 | 1 - 2 = -1 | 1 |
Сумма:
SS_{tot} = 4 + 0 + 0 + 1 + 1 = 6
Посчитаем предсказанные значения \hat{y}_i:
| x_i | \hat{y}_i = 4.1 - 0.07 x_i |
|---|---|
| 10 | 4.1 - 0.07*10 = 4.1 - 0.7 = 3.4 |
| 20 | 4.1 - 0.07*20 = 4.1 - 1.4 = 2.7 |
| 30 | 4.1 - 0.07*30 = 4.1 - 2.1 = 2.0 |
| 40 | 4.1 - 0.07*40 = 4.1 - 2.8 = 1.3 |
| 50 | 4.1 - 0.07*50 = 4.1 - 3.5 = 0.6 |
Посчитаем SS_{res}:
| y_i | \hat{y}_i | y_i - \hat{y}_i | (y_i - \hat{y}_i)^2 |
|---|---|---|---|
| 4 | 3.4 | 4 - 3.4 = 0.6 | 0.36 |
| 2 | 2.7 | 2 - 2.7 = -0.7 | 0.49 |
| 2 | 2.0 | 2 - 2.0 = 0 | 0 |
| 1 | 1.3 | 1 - 1.3 = -0.3 | 0.09 |
| 1 | 0.6 | 1 - 0.6 = 0.4 | 0.16 |
Сумма:
SS_{res} = 0.36 + 0.49 + 0 + 0.09 + 0.16 = 1.1
R^2 = 1 - \frac{SS_{res}}{SS_{tot}} = 1 - \frac{1.1}{6} = 1 - 0.1833 = 0.8167
Уравнение регрессии:
\hat{y} = 4.1 - 0.07x
Коэффициент детерминации:
R^2 \approx 0.82
Это означает, что около 82% вариации стоимости дома объясняется изменением расстояния до центра.
Если нужна дополнительная помощь — обращайтесь!