так чи є чогось, чого я повинен боятися?
Не має резервного копіювання. Як і будь-який запам'ятовуючий пристрій, він може загинути. Зберігайте резервні копії.
Якщо завантаження даних займе віки, я б створив резервну копію даних, доступних лише для читання, як тільки я виконав завантаження даних, зупинивши їх і скопіювавши їх. Таким чином, якщо щось пішло не так, було б простіше створити їх згодом.
Чи можу я поставити всю БД на SSD або просто індекси?
Якщо вона підходить, зберігайте всю БД.
Якщо цього не відбувається, покладіть на SSD простір таблиць і використовуйте його для зберігання індексів і стільки запитуваних таблиць, скільки підходить.
Чи потрібна певна порада / посібник для настройки PostgreSQL для SSD?
Більшість переваг SSD є для завантаження OLTP записом. Основна перевага для завантаження лише для читання - це швидке прагнення, і slardiere покрив це.
Ви можете встановити effective_io_concurrency = 5
або щось відобразити той факт, що SSD можуть робити швидкі, сильно конвеєрні випадкові зчитування ..., але це впливає лише на сканування індексованих растрових карт, і на практиці це random_page_cost
вже включає.
Для завантаження лише для читання це не суттєво відрізняється.
Початкове завантаження даних див.
Зауважте, що у мене гарна робоча станція з i7 та 32Gb оперативної пам’яті, тому, можливо, ви можете також порадити там.
Встановіть велике maintenance_work_mem
для завантаження даних. Я б принаймні користувався 8GB
.
Встановіть велику кількість work_mem
для запиту. Відповідний розмір трохи залежить від складності запиту. Почніть з 500MB
і підйміть звідти.
Збільшити checkpoint_segments
(масово) за початкове завантаження даних.
Не забудьте вимкнути перезарядку VM! (див. посібник з PostgreSQL: http://www.postgresql.org/docs/current/static/kernel-resources.html )