Мене трохи роздратувала відсутність орієнтирів для цього в Інтернеті, тому я сам пройшов тест.
Зауважте, що я не роблю це регулярно, тому, будь ласка, перевірте мої налаштування та дії, щоб виявити будь-які фактори, які могли б ненавмисно вплинути на результати, та залиште свої занепокоєння у коментарях.
Установка була такою:
- Процесор Intel® Core ™ i7-7500U при 2,70 ГГц × 4
- 15,6 Гб оперативної пам’яті, з яких я гарантував, що близько 8 ГБ було вільним під час тесту.
- SSD накопичувач 148,6 ГБ, з великою кількістю вільного місця.
- 64-розрядний Ubuntu 16.04
- MySQL Ver 14.14 Distrib 5.7.20, для Linux (x86_64)
Таблиці:
create table jan_int (data1 varchar(255), data2 int(10), myindex tinyint(4)) ENGINE=InnoDB;
create table jan_int_index (data1 varchar(255), data2 int(10), myindex tinyint(4), INDEX (myindex)) ENGINE=InnoDB;
create table jan_char (data1 varchar(255), data2 int(10), myindex char(6)) ENGINE=InnoDB;
create table jan_char_index (data1 varchar(255), data2 int(10), myindex char(6), INDEX (myindex)) ENGINE=InnoDB;
create table jan_varchar (data1 varchar(255), data2 int(10), myindex varchar(63)) ENGINE=InnoDB;
create table jan_varchar_index (data1 varchar(255), data2 int(10), myindex varchar(63), INDEX (myindex)) ENGINE=InnoDB;
Потім я заповнив 10 мільйонів рядків у кожній таблиці сценарієм PHP, суть якого така:
$pdo = get_pdo();
$keys = [ 'alabam', 'massac', 'newyor', 'newham', 'delawa', 'califo', 'nevada', 'texas_', 'florid', 'ohio__' ];
for ($k = 0; $k < 10; $k++) {
for ($j = 0; $j < 1000; $j++) {
$val = '';
for ($i = 0; $i < 1000; $i++) {
$val .= '("' . generate_random_string() . '", ' . rand (0, 10000) . ', "' . ($keys[rand(0, 9)]) . '"),';
}
$val = rtrim($val, ',');
$pdo->query('INSERT INTO jan_char VALUES ' . $val);
}
echo "\n" . ($k + 1) . ' millon(s) rows inserted.';
}
Для int
таблиць біт ($keys[rand(0, 9)])
було замінено на просто rand(0, 9)
, а для varchar
таблиць я використав повні імена штатів США, не розрізаючи і не поширюючи їх на 6 символів. generate_random_string()
генерує 10-символьну випадкову рядок.
Потім я побіг у MySQL:
SET SESSION query_cache_type=0;
- Для
jan_int
столу:
SELECT count(*) FROM jan_int WHERE myindex = 5;
SELECT BENCHMARK(1000000000, (SELECT count(*) FROM jan_int WHERE myindex = 5));
- Для інших таблиць, як і вище,
myindex = 'califo'
для char
таблиць і myindex = 'california'
для varchar
таблиць.
Часи BENCHMARK
запиту в кожній таблиці:
- січень: 21.30 сек
- jan_int_index: 18,79 сек
- січень: 21,70 сек
- jan_char_index: 18,85 сек
- січень: 21,76 сек
- jan_varchar_index: 18,86 сек
Що стосується розмірів таблиць та індексів, то тут виводиться результат show table status from janperformancetest;
(без декількох стовпців не показано):
|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| Name | Engine | Version | Row_format | Rows | Avg_row_length | Data_length | Max_data_length | Index_length | Data_free | Auto_increment | Collation |
|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| jan_int | InnoDB | 10 | Dynamic | 9739094 | 43 | 422510592 | 0 | 0 | 4194304 | NULL | utf8mb4_unicode_520_ci |
| jan_int_index | InnoDB | 10 | Dynamic | 9740329 | 43 | 420413440 | 0 | 132857856 | 7340032 | NULL | utf8mb4_unicode_520_ci |
| jan_char | InnoDB | 10 | Dynamic | 9726613 | 51 | 500170752 | 0 | 0 | 5242880 | NULL | utf8mb4_unicode_520_ci |
| jan_char_index | InnoDB | 10 | Dynamic | 9719059 | 52 | 513802240 | 0 | 202342400 | 5242880 | NULL | utf8mb4_unicode_520_ci |
| jan_varchar | InnoDB | 10 | Dynamic | 9722049 | 53 | 521142272 | 0 | 0 | 7340032 | NULL | utf8mb4_unicode_520_ci |
| jan_varchar_index | InnoDB | 10 | Dynamic | 9738381 | 49 | 486539264 | 0 | 202375168 | 7340032 | NULL | utf8mb4_unicode_520_ci |
|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
Мій висновок полягає в тому, що для цього конкретного випадку використання немає різниці в продуктивності.