Чи є Тест Тьюрінга чи будь-який з його варіантів надійним тестом штучного інтелекту?


35

Тест Тьюринга був першим випробуванням штучного інтелекту і зараз трохи застарів. Тест Total Turing має на меті бути більш сучасним тестом, який вимагає значно складнішої системи. Які методи можна використати для ідентифікації штучного інтелекту (слабкий ШІ) та штучного загального інтелекту (сильний ШІ)?


6
Безумовно, необхідний статистичний підхід з кількістю учасників. Я зустрічаю людей, які не пройшли б тест Тюрінга.
СФ.

1
Це залежить від того, що ви визначаєте як інтелект.
baranskistad

Відповіді:


16

Риторичний момент Тесту Тьюрінга полягає в тому, що він ставить «випробування» на «людство» у спостережуваних результатах , а не у внутрішніх компонентах . Якщо ви поводилися б так само, взаємодіючи з ШІ, як і з людиною, як би ви могли знати різницю між ними?

Але це не означає, що це надійно, оскільки інтелект має багато різних компонентів і існує безліч інтелектуальних завдань. Тест Тьюрінга, в деякому відношенні, стосується реакції людей на поведінку, яка зовсім не є надійною - пам’ятайте, що багато людей думали, що ELIZA , дуже простий чат, був чудовим слухачем і дуже швидко емоційно задіявся. Це закликає пам’ятати рекламу Ikea про викидання лампи , де емоційна прихильність виходить від глядача людини (і музики), а не від лампи.

Тести Тьюрінга для конкретних видів економічної діяльності набагато цікавіше - якщо можна написати AI, який замінить драйвер Uber, наприклад, те, що буде означати, набагато зрозуміліше, ніж якщо хтось може створити розмовний чат.


10

Проблема Тесту Тьюрінга полягає в тому, що він перевіряє здатність машин схожих на людей. Не обов'язково кожна форма ШІ повинна нагадувати людину. Це робить Тест Тюрінга менш надійним. Однак він все ще корисний, оскільки є фактичним випробуванням. Примітно також, що є приз за проходження чи найближче наближення до проходження тесту Тьюрінга, премію Льоббера .

Визначення інтелектуального агента інтелекту визначає, що агент є розумним, якщо він діє так, щоб досягти максимальної очікуваної вартості показника ефективності на основі минулого досвіду та знань. (перефразоване з Вікіпедії ). Це визначення використовується частіше і не залежить від здатності нагадувати людей. Однак перевірити це важче.


7

Класичний тест Тьюрінга, безумовно, має свої обмеження. Оскільки я ще не бачу цього згадуваного, я пропоную вам прочитати про «Китайську кімнату» , яка є однією з найбільш часто цитованих причин, чому тест Тьюрінга дійсно не відповідає визначенню справжньої «свідомості». Однак я також зазначив, що сам Тьюрінг, в оригінальному документі, який запропонував тест Тьюрінга , чітко визнав себе, що тест не був тестом для виявлення свідомості :

Я пропоную розглянути питання "Чи можуть машини думати?" Почати слід з визначення значень термінів «машина» та «думати». Визначення можуть бути сформульовані таким чином, щоб настільки, наскільки це було можливо, відображати нормальне вживання слів, але таке ставлення небезпечно, якщо значення слів "машина" та "думай" слід дізнатися, вивчивши, як вони зазвичай використовуються важко уникнути висновку, що сенс і відповідь на питання "Чи можуть машини думати?" слід шукати в статистичному опитуванні, наприклад, опитування Gallup. Але це абсурд. Замість спроби такого визначення я заміню питання на інше, яке з ним тісно пов'язане і виражене відносно однозначними словами.

Нова форма проблеми може бути описана в грі, яку ми називаємо «імітаційною грою».

Ця імітаційна гра - це тест, про який ми знаємо сьогодні (а також натхнення для імені недавнього художнього фільму в головних ролях Бенедикта Камбербетча та Кейри Найтли).


1
Чудова відповідь. Я також поділяю думку, що перехід від "Імітаційної гри" до "Тесту Тюрінга" призвів до глибоких помилок щодо наслідків. (Порноботи весь час проходять тест Тюрінга;)
DukeZhou

5

Існує багато визначень штучного інтелекту в дикій природі. Усі ці визначення є частиною однієї (або більше) областей. Існує чотири основні домени, і малюнок нижче пролиє трохи світла на це.

введіть тут опис зображення



Тест Тьюрінга обертається навколо лівої сторони кардинальності, яка в основному стосується того, як люди думають чи діють. Але ми знаємо, що це просто не все. Тест Тьюрінга не може запропонувати багато що стосується того, що AI є в загальному сенсі.
Тест Тьюрінга, як стверджується у Вікіпедії, був створений для тестування машин, що демонструють поведінку, еквівалентну або невідмінну від поведінки людини. Штучний інтелект - це набагато більше, ніж те, що люди можуть робити або як вони діють. Є багато людських вчинків, які вважаються нерозумними, а часом і нелюдськими.
Китайський аргумент кімнати зосереджується на чомусь дуже важливому, коли мова йде про "Свідомість v / s моделювання свідомості". Джон Сірл стверджував, що машина (або людина) може слідувати величезній кількості заздалегідь визначених правил (алгоритму) для того, щоб виконати завдання, не думаючи і не володіючи розумом. Слабкі ШІ добре імітують здатність розуміти, але насправді не розуміють, що вони роблять. Вони не демонструють «самосвідомості» і не формують уявлення про себе. "Я хочу, щоб v / s Я знаю, що хочу" це дві різні речі.

Як свідчить Теорія розуму, хороший ШІ повинен формувати не лише представлення про світ, над яким він працює, а й про інших агентів і сутностей у світі. Ці дві концепції самосвідомості та теорії розуму проводять тонку межу між слабким та сильним ШІ.

Якщо мова йде про тест Тьюрінга, то він провалюється з багатьох причин, і це робить тест Total Turing, який додає ще один шар до тесту. Більшість дослідників вважають, що Тест Тьюрінга - це лише відволікання від головної мети, що заважає їм плідно працювати. Розглянемо це, припустимо, ви задаєте складну арифметичну задачу, щоб розрізняти людину та машину. Якщо машина хоче зробити вигляд, що вона людина, то вона буде брехати. Це не те, що ми хочемо. Перехід до тесту Тьюрінга встановлює верхню межу AI, яку можна створити. Також змушувати AI діяти та поводитись як люди - це не дуже гарна ідея. Люди не дуже добре приймають правильні рішення постійно. Це причини, чому ми читаємо про війни в наших підручниках з історії. Рішення, які ми приймаємо, часто упереджені, мають егоїстичне походження тощо.

Я не думаю, що існує один тест для тестування на ШІ. Це тому, що AI має багато визначень, багато типів. Незалежно від того, чи AI слабкий чи сильний, можна помітити, шукаючи відповіді на запитання на кшталт "Я хочу, щоб в / с я знаю, що хочу цього", "Хто я та що саме роблю (з точки зору машини)", плюс деякі інші питання, про які я згадував вище.


3

Це залежить від того, як дається тест. Наприклад, коли люди заявляли, що машина кілька років тому успішно пройшла тест Тюрінга, критерії були досить слабкими. Потрібно було лише обдурити 30% людей за 5 хвилин. Це не дуже тест. Для цього, напевно, ви б не виявили шизофренію, аутизм, інвалідність навчання або деменцію за цими критеріями.

Незважаючи на ажіотаж, поточні ШІ можна виявити 100% часу, використовуючи досить прості запитання.


Влучне зауваження. "З огляду на достатню кількість питань ..." (Звичайно, тест Войт-Кампфа здається досить ефективним з обмеженою кількістю питань;)
DukeZhou

2

Чи є Тест Тьюрінга чи будь-який з його варіантів надійним тестом штучного інтелекту?

Міопія

Так, якщо хтось визначає термін Штучний інтелект з точки зору Імітаційної гри Алана Тьюрінга або одного з його варіантів. Підхід може бути водночас і дійсним, і дуже обмеженим, як визначення інтелекту, оскільки люди інтерпретували це слово ще до появи ШІ.

Доведений інтелект

Отже, існує велика кількість альтернативних підходів до вимірювання інтелекту, штучного чи іншого.

  • Стати шаховим великим майстром
  • Автор виграшної шахової програми
  • Отримавши високоселективну міжнародну нагороду
  • Створення стратегії, яка виграє війну чи мир
  • Подолання тисяч раундів усунення в бізнесі чи політиці, щоб стати президентом
  • Автор геніальних статей, робіт, сценаріїв, лекцій, виступів, книг чи віршів, які породжують значні зрушення парадигми людини
  • Показано результати геніального рівня в тесті Менса
  • Ставши одним із найзаможніших людей у ​​світі

Нормальне вимірювання нормальної інтелекту

Але це якісь вимірювання виняткового інтелекту, здебільшого тому, що лідери в цих областях надійно застосовували інтелект у кількох областях такими способами, що призвели до неабиякого успіху за допомогою декількох сценаріїв реального життя. Надійність - це атрибут людини, що володіє інтелектом, а не тест самого інтелекту.

Це більш мирські, але можливо більш достовірні та надійні заходи розвідки.

  • Виховання здорових і люблячих дітей як перевірених шляхом ретельного інтерв'ю друзів та однодумців членів сім'ї
  • Неодноразовий і успішний виправлення багатьох умов різних типів, які колись були ідентифіковані як порушені якимось відчутним та вимірюваним способом та були визнані коригуваними в результаті застосування інтелекту, розуміння, аналізу та виправних дій
  • Розмовна розвідка як мірна через учасників бесіди, приписуючи власний успіх ідеям та прикладам, поданим розмовником

Які справді бажані кінцеві цілі?

Можливо, головна характеристика тесту Тьюрінга полягає в тому, що він є штучним. Якщо штучний інтелект - те, чого ми хочемо від програмного забезпечення AI, то саме це ми отримаємо. Однак, ймовірно, ми хочемо чогось або значно більше, або значно менше.

Ми хочемо більше, щоб було б непогано, щоб деякі комп’ютери могли бути нашим другом, нашим наставником та неоплаченим працівником з винятковими здібностями, що ведуть до нашого особистого успіху щодо доходу, впливу, популярності чи спадщини.

Ми хочемо менше, тому що ми хочемо, щоб деякі комп’ютери виконували завдання, що стосуються домену, і залишалися настільки повноцінними інструментами, можливо, з певною особистістю і теплотою, як корабель чи якийсь інший складний пристрій, який ми даємо людські імена, але без непередбачуваності далекосяжних можливостей людського інтелекту.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.