Інструмент для генерації великих наборів даних тестових даних [закрито]


25

Багато разів, намагаючись придумати ефективний дизайн бази даних, найкращим способом дій є створення двох зразкових баз даних, заповнення їх даними та запуску запитів проти них, щоб побачити, яка з них працює краще.

Чи є інструмент, який генерує (в ідеалі прямо в базі даних) великі (~ 10000 записів) набори тестових даних порівняно швидко? Я шукаю щось, що принаймні працює з MySQL.

Відповіді:


12

Найкращий інструмент (якщо ви зможете його знайти) - це DataFactory. (На жаль, не надруковано). Я створив із них абсолютно чудові (і досить автентичні) набори даних.

Generatedata.com є ... прийнятним, але не дуже масштабним.

DataGenerator - це щось, на що слідкувати.

І хоча DTM Generator даних незграбний і поганий замінник DataFactory, він існує і продається, і я використовував його для отримання слабо прийнятних даних.



4

Я, як правило, генерую свої власні, використовуючи якісь відомі дані як вхідні дані - якщо це занадто випадково, це не завжди хороший тест; Мені потрібні дані, які будуть розподілятися аналогічно моєму кінцевому продукту.

Усі більші бази даних, які мені доведеться налаштувати, мають наукову природу, тому я зазвичай можу взяти якесь інше дослідження як вхідне, і змінити його масштаб і додати тремтіння. (наприклад, взяття даних, які були в 5 хв каденції з точністю до мілісекунди, і перетворення їх на 10 секунд каденції з точністю до мілісекунди, але +/- 100 мс тремтіння до часу)

...

Але, як інша альтернатива, якщо ви не хочете писати свої власні, - це переглянути деякі інструменти бенчмаркінгу - оскільки вони можуть повторювати речі знову і знову на основі навчального набору, ви можете використовувати їх для вставки лотів записів (а потім просто ігноруйте звіти про те, наскільки швидко це було зроблено) ... і тоді ви можете використовувати той самий інструмент для тестування того, наскільки швидко працює база даних після її заповнення.





1

Найефективніший спосіб - це, мабуть, використання відкритого джерела чи комерційного генератора даних. Я раніше це робив.

Зараз, у свої золоті роки, я розглядаю кожну потребу в тестових даних як мандат вивчати іншу мову сценаріїв.


1

Для тих, хто шукає іншого рішення цієї проблеми ... Я написав проект тестового генератора даних для студії синхронізації даних. Він може генерувати великий набір даних у межах від 1 до 100 мільйонів рядків реалістичних тестових дат. Ось допис у блозі про це. http://www.simego.com/Blog/2012/02/Test-Data-Generator-Download-for-Data-Sync Безкоштовно користуватися протягом 15 днів (коли ви отримаєте свої тестові дані, у вас є)

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.