Google використовує різні методи та алгоритм машинного навчання для навчання та прогнозування. Стратегії широкомасштабного контрольованого навчання: 1. Підвибірка 2. Смутно паралелізувати деякі алгоритми 3. Розподілений градієнтний спад 4. Голос більшості 5. Суміш параметрів 6. Ітеративна суміш параметрів
Вони повинні тренувати та прогнозувати модель за допомогою різних технік машинного навчання та за допомогою алгоритму вирішувати найкращу модель та прогноз для повернення.
- Субпроб забезпечує нижчу продуктивність
- Параметри суміші покращуються, але не так добре, як усі дані
- Розподілені алгоритми швидше повертають кращі класифікатори
- Ітеративна суміш параметрів досягає такої ж якості, як і всі дані
Але, звичайно, це не зовсім зрозуміло в документації API.