Чи AlphaZero є прикладом AGI?

11

З дослідницької роботи DeepMind на arxiv.org:

У цій роботі ми застосовуємо аналогічний, але повністю загальний алгоритм, який ми називаємо AlphaZero , до ігор у шахи та шогі, а також Go, без будь-яких додаткових знань домену, крім правил гри, демонструючи, що загальне цілеспрямоване навчання алгоритм може досягти, табула-раса, нелюдська ефективність у багатьох складних областях.

Чи означає це, що AlphaZero є прикладом AGI (Artificial General Intelligence)?

— Сіддхартха
джерело

11

Гарне питання!

AlphaZero, хоча і є важливою віхою, напевно, це не AGI :)

AlphaGo, хоча і сильний у грі Go, є вузько сильним ("сильний-вузький AI"), визначається як сила в одній проблемі або типі проблеми (наприклад, Go і інші не випадкові ідеальні інформаційні ігри.)

Як мінімум, AGI має бути настільки ж сильним, як і люди у всіх проблемах, над якими працювали або вирішувались люди.

АГІ часто асоціюється з надінтеллігентністю , визначається як інтелект, що перевершує людський рівень.

AGI не обов'язково передбачає супер-інтелект, в тому сенсі, що ми вважаємо андроїд, який може виконувати всі види діяльності людини з такою ж здатністю, як і люди, як штучний загальний інтелект .

Але технічно AlphaGo - це вузький надрозвідник тим, що він перевершує всі показники роботи людини в одній проблемі.

— DukeZhou
джерело

Вузьких суперінтеллігенцій немає. Ми називаємо це слабким AI :). Жодна людина не може знайти напівоптимальні збірки Microsoft Word або Excel за все життя - в той час як сучасні машини можуть робити це за кілька годин.

— Quonux

@Quonux Залежить від визначення, підозрюю. Визначення Бостромом надінтеллігентності є приблизно аналогічним Штучному загальному інтелекту, але сам термін, етимологічно кажучи, просто означає "вищий інтелект", буквально "вище + інтелект". Згідно з цим базовим визначенням, "сильний-вузький AI" може бути синонімом "вузької надінтеллігентності", оскільки початкове визначення "сильного" було AGI, тому після AlphaGo вчені почали використовувати "вузький" класифікатор.

— DukeZhou

@Quonux частина мого моменту тут полягає в тому, що з появою AlphaGo термін "слабкий" для ШІ, що перевищує можливості людини в одному завданні, здається, був витіснений "сильно-вузьким ШІ".

— DukeZhou

2

Припущення, які можуть бути невірними

Існує два припущення, які можна визначити в тон статті.

Всі психічні виклики можна звести до гри з фіксованими правилами.
Машини краще, ніж люди, - це те, що люди дійсно хочуть або потребують.

У питанні є ще дві ідентифікуючі.

Загальний інтелект існує у людини ¹
Якщо вона існує у людей, тому це можливо в комп'ютерах.

Усі чотири можуть бути правдивими, але жоден із чотирьох не є певним.

Продуктивність AlphaZero

Якщо наша шахова дошка знаходиться на ігровій полиці в нашій шафі, наша трава довга, а наша газонокосарка зламана, у AlphaZero, якщо він підключений до робота-гуманоїда, не було б ігрових правил, кодованих для послідовності завдань.

Слухаючи прохання власника,
Навчившись маріонетковому майструвати робота,
Пошук та визначення всіх наших інструментів та запчастин,
Кріплення газонокосарки та
Повідомте нас газонокосарка готова до використання.

Тому для нас це не має особливої споживчої цінності. Не дуже загальне.

Навіть якщо це могло б скосити газон вже працюючою газонокосаркою, це було б корисно, що не вимагає здатності нічого виграти, а лише здатності підкорятися та проявляти нелюдський інтелект, необхідний для того, щоб не бігати над квітковою клумбою.

Те, що розумні люди DeepMind вирішили використовувати латинську табула-расу, а не порожній шифер, є помітним, але не настільки вражаючим, як побудова навчальної програми, яка може навчитися добре грати в три ігри з лише закодованими правилами та фактичною грою в якості входу.

Щоб вважати ці ігрові програми справді корисними в продуктовому просторі, не можна покладатися на стійкий інтерес до придбання програмного забезпечення, яке б'є покупця щоразу. Щоб продукти AI були життєздатними, функції навчання повинні бути здатні до того, що розмовно називається здоровим глуздом, що вимагає набагато ширшого та гнучкішого знання домену, ніж фіксовані правила гри. Ми можемо здогадатися, що більшість дослідників, які досягли важливих етапів у навчанні ігрових ігор, підштовхують у цьому напрямку. Вони теж знають, що їх результати дослідження повинні бути згодом вироблені або призвести до придбання пропозицій SaaS.

Що вражає тих, хто знаходиться поза межами поля, якщо ці досягнення можна буде перенаправити у центрі даних, щоб генерувати лікувальні генні терапії, щоб вилікувати рак або герпес, перевернути діабет або хворобу Альцгеймера. Тоді ми могли б пробачити дослідників за те, що вони не надали нам завантаження, яке могло б маріонетчиком освоїти робота для очищення нашої ванної кімнати. З статті не ясно, що AlphaZero адекватно продемонстрував, що він демонструє "надлюдські показники в багатьох складних сферах".

Те, що вони зробили, як і раніше вражає, і за тим, що й інші досягли успіху. Мало хто з нас наважився б винайти гру, щоб ці загальні програми для навчання ігор не навчалися швидко і перемогли нас протягом кількох ігрових примірників.

Аванси, що розглядаються в перспективі

Безумовно, виконуючи арифметику, сортуючи пошту, а тепер ігрові ігри, винаходи людства розширюють здібності оголеної людини, відсутній у його знаряддях. Цей прогрес вкладає комп'ютерні системи міцно в область інструменту. Задний мотик у певному сенсі теж нелюдський. Спробуйте прокласти кілометр труби без однієї.

І навпаки, людство грає роль медичного працівника комп’ютерів. Якщо вони захворіють або не вдається, ми змушені виганяти їх віруси та глистів або замінювати їх невдалі частини. Інакше наші будинки та бізнес потрапляють у занепокоєння.

Технології, як і на всі речі, слід розглядати в перспективі.

Людям було б доцільніше менше захоплюватися іграми та битись одне одним і більше зосереджуватися на спільній соціальній поведінці, спрямованій на вирішення соціальних та економічних проблем, за допомогою своїх щойно винайдених інструментів і робити це таким чином, щоб не створювати нових проблем і не запрошувати нові злодіяння.

Виноски

Те, що було описано як загальний інтелект у людей, є спірним на підставі доказів протилежного. Багато хто наводить ці стратегії та тенденції як доказ обмеження розумної людини.

Ядерне стримування як стратегія миру
Повна відсутність поміркованості споживання кінцевих, критичних природних енергетичних ресурсів
Постійно збільшуючи щільність моделей залежності в усьому світі
Викликаючи шосте масове вимирання на землі

— Дуглас Дазееко
джерело

Дякую за редагування, краще так (як мінімум для мене), приділяючи більше уваги технічним частинам відповіді. Можливо, існує інше питання, яким чином має бути ідеально раціональний або високоефективний AGI. Аналогічно, яких стандартів поведінки людей чи людей ми хочемо дотримувати людей - хоча це не було б для цього сайту, якщо б питання не стосувалося порівнянь із штучними розумами.

— Ніл Слейтер