Які конкретні вимоги тесту Тьюрінга?

10

Які вимоги, якщо такі повинні бути виконані оцінювачем, щоб мати право на тест?
Чи повинні завжди бути двоє учасників розмови (один чоловік і один комп’ютер) чи може бути більше?
Чи допускаються чи заохочуються тести на плацебо (де насправді комп'ютер не задіяний)?
Чи може бути кілька оцінювачів? Якщо так, чи потрібно рішення бути одностайним серед усіх оцінювачів, щоб машина пройшла тест?

— Лука
джерело

9

"Тест Тюрінга", як правило, означає оновлену версію Імітаційної гри Алана Тьюрінга, запропоновану в його однойменному документі 1951 року. Рання версія мала людину (чоловіка чи жінку) та комп’ютер, і суддя повинен був вирішити, хто це, і якої статі вони, якщо людина. Якщо вони були правильні менше 50%, комп'ютер вважали "розумним".

Поточна загальноприйнята версія вимагає лише одного учасника та судді, щоб вирішити, чи це людина, чи машина. Так так, іноді це буде ефективно плацебо, якщо ми вважаємо людину плацебо.

Ваше перше і четверте питання пов'язані - і немає чітких вказівок. Якщо комп’ютер може обдурити більшу кількість суддів, то, звичайно, це буде вважатися кращим AI.

Університет Торонто має в цьому документі розділ про валідність Тюрінга , який містить посилання на коментар Джейсона Хатченса про те, чому тест Тьюрінга може бути невідповідним (люди можуть його також провалити) та премію Льоббера , формальне підтвердження Тьюрінга Тест.

— Рорі також
джерело

2

Тут справді є два питання. Одне - "які були конкретні вимоги оригінального тесту Тьюрінга, як це заявив сам Тьюрінг?" Інший - "Якими повинні бути конкретні вимоги сучасного тесту Тьюрінга?" З часів Тьюрінга все значно просунулося, і я думаю, що нам розумно розглянути можливість продовження / модифікації його тесту, щоб відобразити наше сучасне розуміння.

Відповідь на перше питання досить проста, щоб шукати, тому я думаю, що цікавим є друге. Яким повинен бути тест для визначення інтелекту? Зважаючи на це, я думаю, що відповідь на всі чотири питання, поставлені ОП, - це "це залежить". Я не думаю, що існує загальний консенсус щодо того, як побудувати ідеальний тест Тьюрінга, тому даний експериментатор дійсно вільний встановлювати речі, як би він не хотів.

Це, звичайно, ґрунтується на припущенні, що тест Тьюрінга або тест, подібний до тесту Тьюрінга, насправді є цінним. Це не обов'язково дано. Вважайте, що певною мірою ми говоримо про те, щоб розробити AI з винятковою здатністю до обману! Тобто, якщо припустити, що запитуючий може просто запитати "ти людина", то ми маємо припустити, що ШІ повинен брехати, якщо він хоче пройти тест. Тож можна справедливо запитати, чи спроектувати систему, щоб вона справді гарна брехня, цінний підхід до ШІ?

— розум злочину
джерело

0

Якщо ви хочете зрозуміти відносність, читайте Ейнштейна ^1,2 , а не книгу про відносність за авторством професора, який думає, що він його здобув. Якщо ви хочете зрозуміти тест Алана Тьюрінга на інтелект у контексті людського діалогу, прочитайте Тьюрінга. ³ Інтерпретації можуть бути гіршими, ніж нікчемні. Вони часто вводять в оману. Якщо принципи здаються занадто товстими, прочитайте їх ще раз, поки не отримаєте.

У випадку тесту Тьюрінга на інтелект у контексті людського діалогу, щоб зрозуміти його повністю, тоді, коли Тьюрінг писав, припускається наступний фон, який, якщо прочитати його статтю 1950 року, стане очевидним.

Як теорема про повноту Тьюрінга відповідає на другу теорему про незавершеність Курта Геделя
Стратегія контрольованого тесту
Різниця між (а) слухом і мовленням і (б) слуханням і дотепним реагуванням - Це особливо актуально сьогодні, оскільки чат-боти роблять (а) і можуть бути від 5 до 500 років від занять (б). Щоб досягти (в) глибокого осмислення та відповіді натхнення, дослідники ШІ повинні вийти за межі моделювання людського розуму та підійти до виклику моделювання розуму таких людей, як Гедель, Ейнштейн та Тьюрінг. Чи станеться це колись, поки що не розкриється.

Конкретні вимоги гри «Імітація», підзаголовка Алана Тьюрінга вище опису його мислячого експерименту, є справою речей.

Конкретні вимоги [Витяг із фактичної статті]

[Імітаційна гра] грається з трьома людьми, чоловіком (А), жінкою (В) та допитувачем (С), які можуть бути різної статі. Допитуваний перебуває в кімнаті, яка знаходиться навпроти інших двох. Мета гри для допитуваного - визначити, хто з двох інших є чоловіком, а хто жінка. Він знає їх за мітками X і Y, і наприкінці гри він говорить або "X є A, і Y є B", або "X є B і Y є A." Допитуваному дозволяється ставити запитання на А і В таким чином:

C: Чи скажіть мені, будь ласка, X довжину його волосся?

Тепер припустимо, що Х насправді є А, тоді А повинен відповісти. Об'єкт A в грі намагається змусити C зробити неправильну ідентифікацію. Тому його відповідь може бути:

"Моє волосся зачесане, а найдовші пасма - близько дев'яти дюймів".

Для того, щоб тони голосу не допомагали допитуваному, відповіді повинні бути написані, а ще краще - машинописними. Ідеальною умовою є створення телепринтеру, що спілкується між двома кімнатами. Альтернативно, запитання та відповіді можуть бути повторені посередником. Мета гри для третього гравця (В) - допомогти допитуваному.

Найкраща стратегія для неї - це, мабуть, дати правдиві відповіді. Вона може додати такі речі, як "Я жінка, не слухайте його!" на її відповіді, але це нічого не допоможе, оскільки чоловік може зробити подібні зауваження.

Тепер ми задаємо питання: "Що станеться, коли машина прийме участь A у цій грі?" Чи буде допитуваний вирішувати неправильно так часто, коли грається так, як це робиться, коли гра відбувається між чоловіком і жінкою? Ці питання замінюють наше оригінальне "Чи можуть машини думати?"

Існували тисячі критик щодо відносності Ейнштейна і тесту Тьюрінга, жодна з яких не надає великої цінності. Вивчіть мислення великих дописувачів за допомогою власних слів, і вся відмова, що випливає, буде цікавою насамперед через її відсутність.

Вторинні запитання в цій темі

Які вимоги, якщо такі повинні бути виконані оцінювачем, щоб мати право на тест?

Допитуваний (C) не є оцінювачем. Оцінка була б спробою бути об'єктивною, однак передумовою душевного експерименту Тьюрінга є те, що допитуючий надає їй або його суб'єктивне судження. З точки зору статистики, допитуваного слід вибирати випадковим чином у населення світу, яке ділиться розмовною мовою з (A) та (B).

Чи повинні завжди бути двоє учасників розмови (один чоловік і один комп’ютер) чи може бути більше?

Повинно бути два, щоб відповідати сценарію, описаному Аланом Тьюрінгом. (Детальніше див. Нижче).

Чи допускаються чи заохочуються тести на плацебо (де насправді комп'ютер не задіяний)?

Можна було б перевірити всілякі речі, але дослідники роблять це, однак, поза межами мисливського експерименту Тьюрінга. ⁴

Чи може бути кілька оцінювачів? Якщо так, чи потрібно рішення бути одностайним серед усіх оцінювачів, щоб машина пройшла тест?

Що б виявило найбільше інформації для тих, хто спонсорує фактичну Імітаційну гру, це подвійний сліпий повністю рандомізований тест, де (A), (B) і (C) витягується з випадкової вибірки тих чоловіків, жінок чи програмного забезпечення системи випробуваного типу, які можуть спілкуватися загальною мовою, і тест виконувався б багато разів із випадковими виділеннями з вибірки.

Одностайність, оцінка, додаткова складність та інше спілкування, ніж те, що було визначено тестом, лише зірвало б причину, якщо дотримуватися оригінального наміру Тьюрінга щодо питання "Чи можуть комп'ютери думати?"

Інші погляди інтелекту

Тьюрінг, як і Рене Декарт, який заявив, що машини ніколи не пройдуть менш керованої версії Імітації гри Тьюрінга, розглядав інтелект через об'єктив діалогу. Інші розглянули інші види діалогу та інші контексти, ніж діалог. Я вирішив це в іншому запитанні:

Чи може мозок бути розумним без тіла?

Посилання та виноски

[1] Відносність: спеціальна та загальна теорія Альберта Ейнштейна, 1916 рік

[2] Принцип відносності Альберта Ейнштейна та Френсіса А. Девіса, 1923 рік

[3] А.М. Тьюрінг (1950). Обчислювальні машини та інтелект. Розум 49: 433-460. https://www.csee.umbc.edu/courses/471/papers/turing.pdf

[4] Стаття 1950 року Тьюрінга не рекомендувала втілювати його мислительний експеримент і використовувати його для комерційної перевірки майбутніх систем ШІ. Однак Алан Тьюрінг займався практичними обчисленнями в один конкретний момент своєї кар'єри. Це було тоді, коли гітлерівці завалили Францію, очищали його батьківщину з повітря і висипали значну частину англійського флоту знизу за допомогою криптографії Enigma.

— Дуглас Дазееко
джерело