Работа вам нужна срочно. Не волнуйтесь, уложимся!
- 22423 авторов готовы помочь тебе.
- 2402 онлайн
решай задачу по фотографии
Предмет: Машинное обучение
Раздел: Оптимизация, методы градиентного спуска
Задание: Сопоставить формулы модификаций градиентного спуска с их названиями. Ниже приведены формулы для каждого из указанных методов:
Добавляет "инерцию" к движению градиента:
v_t = \beta v_{t-1} + (1 - \beta) \nabla J(\theta)
\theta = \theta - \alpha v_t
Где:
Использует скользящее среднее квадратов градиентов:
E[g^2]_t = \gamma E[g^2]_{t-1} + (1 - \gamma) g_t^2
\theta = \theta - \frac{\alpha}{\sqrt{E[g^2]_t + \epsilon}} g_t
Где:
Модификация RMSprop, которая не требует явной скорости обучения:
E[g^2]_t = \rho E[g^2]_{t-1} + (1 - \rho) g_t^2
\Delta \theta_t = - \frac{\sqrt{E[\Delta \theta^2]_{t-1} + \epsilon}}{\sqrt{E[g^2]_t + \epsilon}} g_t
E[\Delta \theta^2]_t = \rho E[\Delta \theta^2]_{t-1} + (1 - \rho)(\Delta \theta_t)^2
Комбинирует идеи Momentum и RMSprop:
m_t = \beta_1 m_{t-1} + (1 - \beta_1) g_t
v_t = \beta_2 v_{t-1} + (1 - \beta_2) g_t^2
\hat{m}_t = \frac{m_t}{1 - \beta_1^t}, \quad \hat{v}_t = \frac{v_t}{1 - \beta_2^t}
\theta = \theta - \alpha \frac{\hat{m}_t}{\sqrt{\hat{v}_t} + \epsilon}
Название | Формула |
---|---|
AdaDelta | Формулы с E[g^2]_t, \Delta \theta_t, E[\Delta \theta^2]_t |
RMSprop | Формулы с E[g^2]_t и делением градиента на корень |
SGDMomentum | Формулы с v_t и \theta = \theta - \alpha v_t |
Adam | Формулы с m_t, v_t, \hat{m}_t, \hat{v}_t |
Если есть формулы, которые нужно распознать из изображения, пожалуйста, приложите изображение с формулами — я помогу их сопоставить.