Я роблю попередню обробку даних і після цього збираюся створювати конвонети на своїх даних.
Моє запитання: Скажіть, у мене є загальний набір даних зі 100 зображеннями, я обчислював середнє значення для кожного з 100 зображень, а потім віднімав його з кожного з зображень, потім розділяв це на набір поїздів і перевірки, і я роблю те саме кроки для обробки заданого тестового набору, але здається, що це не правильний спосіб зробити це за цим посиланням: http://cs231n.github.io/neural-networks-2/#datapre
" Загальна помилка . Важливий момент, який слід зробити про попередню обробку, полягає в тому, що будь-яка статистика попередньої обробки (наприклад, середні дані) повинна бути обчислена лише на навчальних даних, а потім застосована до даних перевірки / тестування. Наприклад, обчислення середнього значення та віднімання його від кожне зображення в усьому наборі даних, а потім розділення даних на розбивки поїздів / вал / тестів було б помилкою, натомість середнє значення повинно обчислюватися лише за навчальними даними, а потім віднімати однаково від усіх розщеплень (поїзд / вал / тест). "
Я здогадуюсь, що говорить автор, це те, що не обчислюйте середнє значення і не віднімайте його у кожному зображенні, а обчислюйте середнє значення загального набору зображень (тобто (image1 + ... + image100) / 100) і віднімайте середнє значення на кожен із зображень.
Я не зовсім розумію, може хтось пояснить? а також, можливо, поясніть, чому те, що я робив, є неправильним (якщо воно дійсно неправильне).