Як можна виміряти EQ програми AI?

Чи може програма AI мати EQ (Емоційний інтелект або емоційний коефіцієнт)?

Іншими словами, чи можна виміряти EQ програми AI?

Якщо вимірювання еквалайзера є більш проблематичним для вимірювання, ніж IQ (принаймні, зі стандартним додатком як для людей, так і для програм ШІ), чому це так?

emotional-intelligence intelligence-testing

— 1010101 Стиль життя
джерело

Які випробування EQ ви знаєте для людей? Що може стати перешкодою для застосування їх до ШІ?

— NietzscheanAI

Відповідь на ваше запитання - "В принципі, так" - в загальному вигляді тестування EQ - це лише конкретний випадок тесту Тьюрінга ("Як би ви ставились до ...?").

Щоб зрозуміти, чому значущих тестів на EQ може бути важко досягти, розгляньте наступні два можливі тести:

На крайній складності, фільм «Бігун клинка» демонструє тест на розрізнення між людиною та андроїдом на основі відповідей на емоційно заряджені питання.

Якщо ви спробували задати ці питання (або навіть набагато простіші) сучасному чатові, ви, швидше за все, швидко зробите висновок, що не розмовляєте з людиною.

Проблема з оцінкою EQ полягає в тому, що чим більш емоційно витончений тест, тим загальнішою повинна бути система ШІ, щоб перетворити вхід на змістовне уявлення.

З іншого боку, припустімо, що тест на EQ був сформульований надзвичайно структуровано, із структурованим вкладом, який надає людина. У такому випадку успіх на «тесті на еквалайзер» насправді не обґрунтований у реальному світі.

У нарисі «Незнищенний ефект Елізи та його небезпеки» Дуглас Хофштадтер наводить такий приклад, у якому програма ACME вимагає (а не від Hofstadter) «розуміти» аналогію.

Тут комп’ютер дізнається про того, хто по імені Слугго проводить дружину Джейн та свого доброго приятеля Бака до бару, де справи йдуть своїм природним ходом, і Джейн закінчує вагітність Баком. У неї є дитина, але вона цього не хоче, і тому, допомагаючи чоловікові, вона топить дитину в річці, таким чином "акуратно вирішуючи" проблему "Бамбі.

Ця історія представлена ACME у такій формі:

ql: (neglectful-husband (Sluggo))
q2: (lonely-and-sex-starved-wife (Jane-Doe))
q3: (macho-ladykiller (Buck-Stag))
q4: (poor-innocent-little-fetus (Bambi))
q5: (takes-out-to-local-bar (Sluggo Jane-Doe Buck-Stag))
...
q11: (neatly-solves-the-problem-of (Jane-Doe Bambi))
q12: (cause (ql0 q11))

Припустимо, програму слід було запитати, чи поведінка Джейн Доу моральна. Складні складні емоційні поняття, такі як "зневажливий", "самотній" та "невинний", тут просто предикати, не доступні ШІ для більш глибокого самоаналізу. Вони так само легко можуть бути замінені етикетками, такими як 'bling-blang-blong15657'.

Отже, в одному сенсі відсутність успіху в тесті на еквалайзер з будь-якою глибиною свідчить про загальну проблему, яка зараз стоїть перед ШІ: неможливість визначити (або іншим чином дізнатися) змістовні уявлення про тонкі складності людського світу, що набагато більше складніше, ніж вміти розпізнавати відео про котів.

— НіцшеанськийАІ
джерело