На моєму ядро Dell i7 - 16 ГБ оперативної пам’яті - 4 ГБ 960 м графічного процесора, я працюю над проектом, щоб класифікувати зображення легких КТ за допомогою 3D-CNN. Я використовую версію процесора tensorflow. Зображення готуються у вигляді масивного масиву (25,50,50).
У моїй моделі CNN було 2 шари конвеєра, два макспул-шару, один шар FC і вихідний шар. Завдяки цій архітектурі я міг би навчити модель приблизно (від 5000 до 6000) зразків. Після додавання більше шарів у моєї моделі тепер є 6 шарів conv, 3 максимум шару пулу, FC та вихідний шар. Моя проблема полягає в тому, що після зміни архітектури з більш ніж 1000 зразками моя пам'ять заповнюється, і я отримую помилку пам'яті. Я намагався робити менші партії, але щоразу отримував однакові помилки. У мене є два питання:
Чому додаючи більше шарів, моделі потрібно більше пам’яті?
Чи є спосіб вирішити цю проблему?