Я намагався вирішити наступну проблему протягом приблизно однієї години зараз, і все ще не впорався з цим.
Гаразд, у мене є таблиця (MyISAM):
+---------+-------------+------+-----+-------------------+----------------+
| Field | Type | Null | Key | Default | Extra |
+---------+-------------+------+-----+-------------------+----------------+
| id | int(11) | NO | PRI | NULL | auto_increment |
| http | smallint(3) | YES | MUL | 200 | |
| elapsed | float(6,3) | NO | | NULL | |
| cached | tinyint(1) | YES | | NULL | |
| ip | int(11) | NO | | NULL | |
| date | timestamp | NO | MUL | CURRENT_TIMESTAMP | |
+---------+-------------+------+-----+-------------------+----------------+
Будь ласка, не заважайте індексам, я розгулював, намагаючись знайти рішення. Тепер ось мій запит.
SELECT http,
COUNT( http ) AS count
FROM reqs
WHERE DATE(date) >= cast(date_sub(date(NOW()),interval 24 hour) as datetime)
GROUP BY http
ORDER BY count;
таблиця зберігає інформацію про вхідні веб-запити, тому це досить велика база даних.
+-----------+
| count(id) |
+-----------+
| 782412 |
+-----------+
зауважте, що немає кращого способу встановлення первинного ключа, оскільки стовпець id буде єдиним унікальним ідентифікатором, який у мене є. Наведений вище запит займає приблизно 0,6-1,6 секунди.
Який індекс був би розумним? Я подумав, що дата індексації дасть мені «погану» кардинальність, і, отже, MySQL не використовуватиме її. http також є поганим вибором, оскільки існує лише близько 20 різних можливих значень.
Дякую за допомогу!
Оновлення 1 Я додав індекс на (http, дата), як запропонував ypercube:
mysql> CREATE INDEX httpDate ON reqs (http, date);
і використовував його запит, але він виконував однаково погано. Доданий індекс:
+-------+------------+----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+
| Table | Non_unique | Key_name | Seq_in_index | Column_name | Collation | Cardinality | Sub_part | Packed | Null | Index_type | Comment |
+-------+------------+----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+
| reqs | 0 | PRIMARY | 1 | id | A | 798869 | NULL | NULL | | BTREE | |
| reqs | 1 | httpDate | 1 | http | A | 19 | NULL | NULL | YES | BTREE | |
| reqs | 1 | httpDate | 2 | date | A | 99858 | NULL | NULL | | BTREE | |
+-------+------------+----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+
і ПОЯСНЕННЯ
+----+--------------------+-------+-------+---------------+----------+---------+------+-------+-----------------------------------------------------------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+----+--------------------+-------+-------+---------------+----------+---------+------+-------+-----------------------------------------------------------+
| 1 | PRIMARY | r | range | NULL | httpDate | 3 | NULL | 20 | Using index for group-by; Using temporary; Using filesort |
| 2 | DEPENDENT SUBQUERY | ri | ref | httpDate | httpDate | 3 | func | 41768 | Using where; Using index |
+----+--------------------+-------+-------+---------------+----------+---------+------+-------+-----------------------------------------------------------+
Версія сервера MySQL:
mysql> SHOW VARIABLES LIKE "%version%";
+-------------------------+---------------------+
| Variable_name | Value |
+-------------------------+---------------------+
| protocol_version | 10 |
| version | 5.1.73 |
| version_comment | Source distribution |
| version_compile_machine | x86_64 |
| version_compile_os | redhat-linux-gnu |
+-------------------------+---------------------+
5 rows in set (0.00 sec)
http
стовпчик буде нульовим. Я завтра розслідую, якщо знайду час.
http NOT NULL
) та скопіювавши в неї всі дані (крім рядків з http NULL, звичайно.)