позначає евклідову відстань між вхідною точкою та центральною точкою . Кожна точка присвоює собі найближчий центр кластера, групуючи вершини в різних кластерів.
Проблема відома як (дискретна) проблема кластеризації, і вона -тверда. Це може бути показано зменшенням від -повної домінуючої заданої задачі, що якщо існує алгоритм апроксимації для задачі з то .
Оптимальний алгоритм апроксимації дуже простий та інтуїтивний. Один перший вибирає точку довільно і поміщає його в безлічі кластерних центрів. Потім вибирають наступний центр кластера таким, який знаходиться якнайдалі від усіх інших центрів кластерів. Тож поки , ми неодноразово знаходимо точку , для яких відстань максимізує і додати його в . Раз ми закінчили.
Не важко помітити, що оптимальний жадібний алгоритм працює в час. Це викликає питання: чи можемо ми досягти часу? Наскільки краще ми можемо зробити?