Я помітив, що в попередніх відповідях відсутні деякі загальні міркування щодо HPC.
Перш за все, жоден із цих пакетів не дозволить вам запускати один SVM паралельно. Отже, що ви можете пришвидшити, це оптимізація параметрів або перехресне підтвердження, все-таки для цього потрібно написати власні функції. Або, звичайно, ви можете виконувати завдання для різних наборів даних паралельно, якщо це так.
Друге питання - пам’ять; якщо ви хочете поширити обчислення на кілька фізичних комп'ютерів, немає безкоштовного обіду, і ви повинні скопіювати дані - тут ви повинні врахувати, чи є сенс передбачити копію даних на комп’ютерах, щоб зберегти деякий зв’язок. З іншого боку, якщо ви хочете використовувати декілька ядер на одному комп’ютері, то багатоядерність особливо доречна, оскільки вона дозволяє всім дочірнім процесам отримати доступ до пам'яті батьківського процесу, так що ви можете заощадити деякий час і багато місця в пам'яті.