R поставляється з великою кількістю наборів даних, і, схоже, не було б великою справою відтворити більшість прикладів, які ви цитували, за допомогою кількох рядків коду. Також вам може бути корисний пакет mlbench , зокрема синтетичні набори даних, починаючи з mlbench.*
. Деякі ілюстрації наведені нижче.

Ви знайдете додаткові приклади, переглянувши перегляд завдань кластера на CRAN. Наприклад, пакет fpc має вбудований генератор для кластеризованих наборів даних у формі обличчя ("обличчя" rFace
).

Аналогічні міркування стосуються і Python, де ви знайдете цікаві еталонні тести та набори даних для кластеризації з scikit-learn .
У сховищі машинного навчання UCI також розміщено безліч наборів даних , але вам краще самостійно моделювати дані мовою на ваш вибір.