Що стоїть за API прогнозування Google?


28

API Google Prediction - це хмарний сервіс, в якому користувач може надіслати деякі навчальні дані для тренувань таємничого класифікатора, а пізніше попросити його класифікувати вхідні дані, наприклад, застосувати фільтри спаму або передбачити налаштування користувачів.

Але що за лаштунками?


2
Я підозрюю, що вони сподіваються зберегти цю комерційну конфіденційність!
onestop

Це може бути правдою, але відео (з літа 2010 року) говорить про те, що вони до цього часу ще експериментували; тому я опублікував цей Q, сподіваючись, що з тих пір з'явилися деякі витоки.

6
Існує "кілька" алгоритмів, які API API передбачення може вибрати, коли навчатись / прогнозувати ваші дані. Двигун вибирає той, який вважає найкращим. Деякі користувачі вимагають трохи більше контролю над цим виділенням goo.gl/mod/5EoA , навіть якщо алгоритм невідомий. Redditors міркували про кишки тут, reddit.com/r/MachineLearning/comments/evdxb/… , але статична розмова на мене втрачена.
гіперслуга

2
@hyperslug Опублікуйте це як відповідь, це дуже корисно, тому я хотів би прийняти його.

Відповіді:


11

Google використовує різні методи та алгоритм машинного навчання для навчання та прогнозування. Стратегії широкомасштабного контрольованого навчання: 1. Підвибірка 2. Смутно паралелізувати деякі алгоритми 3. Розподілений градієнтний спад 4. Голос більшості 5. Суміш параметрів 6. Ітеративна суміш параметрів

Вони повинні тренувати та прогнозувати модель за допомогою різних технік машинного навчання та за допомогою алгоритму вирішувати найкращу модель та прогноз для повернення.

  1. Субпроб забезпечує нижчу продуктивність
  2. Параметри суміші покращуються, але не так добре, як усі дані
  3. Розподілені алгоритми швидше повертають кращі класифікатори
  4. Ітеративна суміш параметрів досягає такої ж якості, як і всі дані

Але, звичайно, це не зовсім зрозуміло в документації API.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.