У жовтні 2014 р. Доктор Марк Рідл опублікував підхід до тестування інтелекту ІС, який отримав назву "Lovelace Test 2.0" , після натхнення оригінальним тестом Lovelace (опублікований у 2001 р.). Марк вважав, що оригінальний тест Lovelace неможливо пройти, а тому запропонував слабший і практичніший варіант.
Тест Lovelace 2.0 припускає, що для того, щоб AI був розумним, він повинен проявляти творчість. З самого паперу:
Тест Lovelace 2.0 полягає в наступному: штучний агент a оскаржується наступним чином:
a повинен створити артефакт o типу t;
o повинні відповідати набору обмежень C, де ci ∈ C - будь-який критерій, виражений природною мовою;
людський оцінювач h, вибравши t і C, впевнений, що o є дійсним екземпляром t і відповідає C; і
людський арбітр r визначає, що комбінація t і C не є нереальною для пересічної людини.
Оскільки людині-оцінювачу можна створити деякі досить легкі обмеження для перемоги ІІ, то, як очікується, людський оцінювач продовжує створювати все більш складні обмеження для ШІ, поки ШІ не завершиться. Суть Lovelace Test 2.0 полягає в тому, щоб порівнювати творчість різних ШІ, а не встановлювати чітку межу між "інтелектом" та "неінтелектуальністю", як це робив би тест Тьюрінга.
Однак мені цікаво, чи справді цей тест використовувався в академічній обстановці, чи він зараз розглядається лише як мислений експеримент. Тест Ловеласа здається простим у застосуванні в академічних умовах (потрібно лише розробити деякі вимірювані обмеження, які можна використовувати для тестування штучного агента), але він також може бути занадто суб'єктивним (люди можуть не погодитися з суті певних обмежень, і чи творчий артефакт, створений AI, фактично відповідає кінцевому результату).