Нещодавно симулятор V-REP з відкритим джерелом може відповідати вашим потребам. Я вважав його більш доступним, ніж Gazebo, і він може працювати в Windows, OSX та Linux. Їх навчальні посібники досить прямо вперед. Існує безліч різних способів взаємодії з ним програмно (в тому числі з ROS). Схоже, є навіть підручник для виготовлення шестигранника , який ви, мабуть, могли використовувати як вихідну точку, якщо у них уже немає чотирискладного прикладу. На жаль, я вважаю, що тренажер пов'язаний безпосередньо з візуалізацією інтерфейсу, що, на мою думку, не обов'язково має місце з Gazebo.
Отже, вашій програмі доведеться використовувати один із багатьох способів взаємодії з V-REP, а потім подавати продуктивність певної ходи, визначеної від якогось датчика в V-REP, в алгоритм машинного навчання (можливо, щось із OpenCV як @WildCrustacean згадується). Тоді вам доведеться придумати переклад з опису ходи, який використовує модельований робот, на щось, що використовується для управління фактичними двигунами на вашому Arduino.
З іншого боку, ви можете зробити власний тренажер, використовуючи існуючий двигун фізики, надаючи його за допомогою графічної бібліотеки. Bullet і OGRE, відповідно, можуть використовуватися для цієї мети, якщо вам подобається C ++. Існує багато інших для інших мов програмування.
Я також хотів би розглянути, як дослідники, які працюють над генерацією ходи, роблять свої симуляції. Можливо, існує існуючий проект з відкритим кодом, присвячений цьому.