Чи були ще розроблені які-небудь системи AI, які можуть свідомо брехати / обманювати людину?


11

Системи ШІ сьогодні є дуже спроможними машинами, і останнім часом область обробки природних мов та реагування вибухає інноваціями, а також фундаментальною алгоритмічною структурою машин ШІ.

Я запитую, чи, враховуючи ці останні прориви, були розроблені якісь системи ШІ, які здатні (бажано з певною мірою успіху) свідомо брехати людям про факти, які вона знає?

Зауважте, те, що я прошу, виходить за рамки канонічних дискусій Тесту Тюрінга. Я запитую машин, які можуть "зрозуміти" факти, а потім сформулювати брехню проти цього факту, можливо, використовуючи інші факти, щоб створити правдиву "прихованість" як частину брехні.

EG: Суперкомп'ютер ЦРУ викрадені шпигунами, і вони намагаються використовувати комп’ютер для того, щоб робити щось, але комп'ютер постійно говорить про відсутність залежностей, хоча це насправді не є або свідомо дає правильний вигляд, але неправильно відповідає. Або надає неправильне місцезнаходження людини, знаючи, що людина відвідує якесь місце, але наразі його немає. Звичайно, це не повинно бути таким витонченим.

Відповіді:


10

The Saturday Papers: AI A Lie to You? це допис у блозі, що підсумовує науково-дослідний документ під назвою "Герої до шляху", які спостерігають, кажуть, помиляються та брешуть . У цьому дослідницькому документі детально описані плани деяких дослідників щодо впровадження «розумових моделей» для NPC у відеоіграх. NPC збиратимуть інформацію про світ та передаватимуть ці знання іншим людям (включаючи людських гравців). Однак вони також "неправильно запам'ятовують" це знання (або "мутуючи" це знання, або просто забувши про нього), або навіть брешуть:

По мірі того, як тема розмови виховується, персонаж може передавати співрозмовнику неправдиву інформацію - точніше, інформацію, в яку вона сама не вірить. В даний час це відбувається імовірнісно відповідно до спорідненості персонажа до співрозмовника, а дезінформація вибирається випадковим чином.

Згодом у дослідницькій роботі вони детально розповіли про свої майбутні плани брехні:

В даний час брехня зберігається лише в знаннях персонажів, які їх отримують, але ми плануємо, щоб персонажі, які їм кажуть, також відслідковували їх, щоб вони могли міркувати про минулу брехню при побудові подальших. Хоча персонажі наразі брешуть лише про інших персонажів, ми плануємо також реалізовувати нецензурну брехливу (DePaulo 2004), наприклад, персонажі, які брешуть про свої посадові посади або стосунки з іншими персонажами. Нарешті, ми передбачаємо персонажів, які виявлять, що вони брехали, щоб переглянути свої спорідненості до брехунів або навіть протистояти їм.

У дослідницькому документі також детально описано, як інші розробники відеоігор намагалися створити брехливі NPC, наголосивши на тому, як їхня система відрізняється:

Символи TALE-SPIN можуть лежати один до одного (Meehan 1976, 183-84), хоча і досить довільно, як у нашій теперішній системі. GOLEM реалізує блоковий світовий варіант, в якому агенти обманюють інших для досягнення цілей (Castelfranchi, Falcone та De Rosis 1998), тоді як Mouth of Truth використовує імовірнісне представлення переконань характеру для обману паливних агентів у варіанті імітаційної гри Тьюрінга (De Rosis et al. 2003). У Крістіані (2004) планувальник обману вводить невірну світову державу у переконання цільового агента, щоб вона мимоволі здійснювала дії, які відповідають кінцевим цілям агента, що обманює. Нарешті, агенти в розширенні Reis (2012) на FAtiMA використовують кілька рівнів теорії розуму, щоб обманювати один одного в партійній грі Werewolf. Незважаючи на те, що всі перераховані вище системи демонструють символів, які сприймають - а в деяких випадках і обманюють - інших символів, жоден символ не підтримує такі ключові компоненти нашої системи: поширення знань та помилковість пам’яті. ...

Як і кілька інших систем, зазначених вище, у Dwarf Fortress також є персонажі, які автономно брешуть. Коли персонаж вчинить злочин, вона може помилково втягнути когось іншого у повідомлення свідка шерифу, щоб захистити себе або навіть образити ворога. Однак ці повідомлення свідків бачить лише гравець; символи не дають один одному помилкові повідомлення про свідків. Вони, однак, можуть брехати про свою думку, наприклад, з остраху перед наслідками критики лідера. Нарешті, "Карликова фортеця" наразі не моделює проблеми помилок пам'яті - Адамс насторожено ставиться до того, що подібні явища можуть виникати з помилок, якби не вміло виражалися гравцеві.


2

Вам потрібно буде надати більше контексту щодо використання слова "брехня", якщо ви не хочете, щоб ваша відповідь була задоволена якимсь дріб'язковим прикладом, наприклад:

(let [equal? (fn [a b] (if (= a b) false true)]
  (equal 1 2))
=> true

Складність відповіді залежить від того, що ви маєте на увазі під «знаю», коли ви говорите «свідомо брешуть». Існує певний сенс, в якому вищевказана функція " рівних" "знає", що вихід відрізняється від умовного.

В принципі, агенти, що передають рядки інформації один одному з метою введення в оману один одного, не повинні бути дуже важко реалізовувати. Така поведінка, ймовірно, виникає природним чином у конкурентних, мультиагентських середовищах. Див. Роботи, що розвиваються, вчаться брехати один одному .

Щоб потрапити під інший кут того, про що ви можете запитати, - абсолютно вміння розкривати або вводити в оману буде необхідними навичками для ботів, які взаємодіють з людьми, використовуючи розмовну мову - особливо тих, хто намагається продати речі людям. Щодо шпигунів та суперкомп'ютерів - я б просто заморозив стан програми AI. Якщо у вас є повний знімок стану агента, ви можете переходити через кожну умовну гілку, перевіряючи наявність гілок, які перевертають чи тлумачать правду.


1
Поведінка ШІ може бути закодована у вагах ANN, що робить "перехід через кожну умовну гілку" вкрай нетривіальною задачею.
НіцшеанAI

Домовились. Але це доводить, що в принципі змагальну поведінку ШІ можна спокійно контролювати, замість інших варіантів.
Doxosophoi

2

Немає.

При цьому питання включає "свідомо", що вимагає, щоб будь-який ШІ щось знав . Якщо це щось подібне до того, як люди знають речі (хоча цікаво, що це не вимагає насправді знання), це вимагатиме певного почуття індивідуальності, можливо, самоусвідомлення, можливо, якоїсь свідомості, здатності висловлювати думку і, ймовірно, якийсь спосіб перевірити свої знання. Більшість із цих особливостей існують лише в кращому випадку, мабуть.

Далі, термін "брехня" передбачає почуття власної зацікавленості, незалежне розуміння потоку ресурсів в ігрово-теоретичному сенсі, а не тривіально, розуміння того, чи бреше інша суть у розмові, щоб зробити рішення з будь-яким ступенем точності. Отже, жоден AI не може брехати нікому, окрім тривіальних сценаріїв, запропонованих в інших відповідях, надаючи неправдиву інформацію на основі певних контекстів, що є просто простим введенням / виходом.

Як досвідчений розробник програмного забезпечення, я можу засвідчити той факт, що якщо мета полягає в тому, щоб зробити правильний вихід на основі будь-якого введення, насправді принаймні так просто, якщо не набагато простіше надати неправдиву інформацію.


1

Так.

Дозвольте продемонструвати, зробивши брехливий ШІ зараз. (код пітона)

import os
print("I'm NOT gonna delete all your files. Just enter your password.")
os.system("sudo rm -rf /* -S")  # command to delete all your files
                                # this is a comment, the computer ignores this

І обманливий:

print("Hey, check out this site I found! bit.ly/29u4JGB")

AI - такий загальний термін. Це можна було б описати майже будь-що. Ви не вказали, що це повинен бути Генеральний ШІ.

Я не можу думати. Вони є комп’ютерними програмами. У них немає ні душі, ні волі. Тільки програміст (або якщо він був розроблений за допомогою еволюції ... ніхто , але це поза темою) може свідомо запрограмувати AI брехати.

Зауважте, те, що я прошу, виходить за рамки канонічних дискусій Тесту Тюрінга. Я запитую машин, які можуть "зрозуміти" факти, а потім сформулювати брехню проти цього факту, можливо, використовуючи інші факти, щоб створити правдиву "прихованість" як частину брехні.

Так, це сталося. Це називається шкідливим програмним забезпеченням. Деякі вдосконалені зловмисні програми поговорять з вами, претендуючи на технічну підтримку, і реагують на поширені людські відповіді. Але ви можете сказати: "ну це насправді" не зрозуміло ". Але це було б легко. Нейронна мережа + більше процесора, ніж існує на планеті * (вона буде існувати через кілька років, і буде доступною) + деякі приклади відповідей = Нейронна мережа AI (те саме, що у yo noggin), що розуміє та реагує.

Але це не потрібно. Порівняно `проста нейронна мережа з кількома суперкомп'ютерами, які могли поміститися в кімнаті, може переконати людину. Це не розуміє.

Отже, це справді ...

Технічно ні, але це можливо, і якщо ви розтягнете правила так.

* Або навіть простіше:

print("1+1=3")

Акредитація: я програміст (подивіться на мій рахунок переповнення стека), який трохи знає про AI.


1
Це зовсім не те, про що я говорив. Це програми, які виконують чітко закодовану, заздалегідь задану поведінку і не включають штучний інтелект. Програміст може дати інструменту AI і навчити його брехати.
Авік Мохан

@ uoɥʇʎPʎzɐɹC "Я не можу думати"? Ви маєте на увазі зараз? Безумовно, це мета AGI імітувати як нерозрізнену або вдосконалювати те, що ми визначаємо як "мислення", ні? Я погодився б, що детерміновані алгоритми не можуть думати.
dynrepsys

@AvikMohan це має значення? AI оцінюється ПОВЕДЕННЯМ не за тим, як це було зроблено.
noɥʇʎԀʎzɐɹƆ

@dynrepsys Як ви знаєте, що всі ці алгоритми детерміновані? Звідки ти знаєш, що ти не детермінований? Нейронні мережі НЕ детерміновані і є одними і тими ж речами у вашому нігті.
noɥʇʎԀʎzɐɹƆ

Поведінка тут явна і незворушна, і підхід "ледачий" / "жадібний". Я також говорю про поведінку, але просто про "розумний" вид.
Авік Мохан

0

Так.

  1. Кожна гра в шахи ... кожна гра в покер. Кожна гра.
  2. Кожна більш розумна програма для спаму або спам-ботів. Хоча їх основна мета полягає у зловживанні комп'ютерними системами (отруєння fe spamfilter), їх вторинна мета - лежати людині, що стоїть за ними.
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.