Відповіді насправді немає. Це десь між 1 і N.
Однак ви можете думати про це з точки зору прибутку.
Наприклад, в маркетингу використовується сегментація, що дуже схоже на кластеризацію.
Повідомлення (реклама або лист, скажімо), що розроблено для кожної людини, матиме найвищу швидкість відповіді. Загальне повідомлення з урахуванням середнього значення матиме найнижчу швидкість відповіді. Скажімо, три повідомлення, пристосовані до трьох сегментів, будуть десь посередині. Це сторона доходу.
Повідомлення, пристосоване до кожної людини, матиме найвищу вартість. Загальне повідомлення з урахуванням середнього значення матиме найменші витрати. Три повідомлення, пристосовані до трьох сегментів, будуть десь посередині.
Скажімо, оплата автору написання користувальницького повідомлення коштує 1000, два коштує 2000 і так далі.
Скажімо, використовуючи одне повідомлення, ваш дохід становитиме 5000. Якщо ви сегментували своїх клієнтів на 2 сегменти та писали спеціально розроблені повідомлення до кожного сегменту, швидкість відповіді буде вище. Скажімо, зараз дохід становить 7500. З трьома сегментами дещо вищий рівень відповідей, а ваші доходи - 9000. Ще один сегмент, і ви на 9500.
Для отримання максимального прибутку продовжуйте сегментувати, поки граничний дохід від сегментації не дорівнює граничній вартості сегментації. У цьому прикладі ви б використали три сегменти для отримання максимального прибутку.
Segments Revenue Cost Profit
1 5000 1000 4000
2 7500 2000 5500
3 9000 3000 6000
4 9500 4000 5500
hopack
(та інші), які можуть оцінити кількість кластерів, але це не відповідає на ваше запитання.