Чи існує ефективний алгоритм еквівалентності виразів?

наприклад, $xy+x+y=x+y(x+1)$ ?

Вирази походять із звичайної алгебри середньої школи, але обмежуються арифметичним складанням і множенням (наприклад, ), без обертів, віднімання чи ділення. Букви є змінними. $2+2=4; 2.3=6$

Якщо це допомагає, ми можемо заборонити будь-який вираз, представлений із числовими значеннями, відмінними від ; тобто не ані ані : $1$ $x^2$ $3x$ $4$

багатолінійні , ніякі повноваження, окрім : в порядку, але не , і не все, що могло бути представлене як таке, як у повне розширення на суму продуктів, наприклад, не ; $1$ $x+xy \equiv x^1+x^1y^1$ $x^2+x^3y^4$ $x(x+y) \equiv x^2+y$
все одне , ніяких коефіцієнтів, окрім : є нормальним, але не , і не що-небудь, що могло б бути представлене таким чином, як у повному розширенні на суму- продукти, наприклад, не ; і $1$ $x+xy \equiv 1.x+1.xy$ $2x+3xy$ $a(x+y)+x(a+b) \equiv 2ax+ay+bx$
немає констант, окрім : знову ж таки, у повністю розширеній кількості продуктів, наприклад, не $1$ $(a+1)+(b+1) \equiv a+b+2$

$Q.$ Чи існує ефективний алгоритм для визначення того, чи є два вирази еквівалентними?

Для ілюстрації, ось неефективний алгоритм грубої сили з експоненціальним часом:

повністю розширити обидва вирази до суми продуктів , що легко перевірити на еквівалентність (просто ігноруйте порядок, оскільки комутація / асоційований може змінити порядок).

наприклад
$(a+b)(x+y) \rightarrow ax+ay+bx+by$
$a(x+y)+b(x+y) \rightarrow ax+ay+bx+by$

Це здається загальновідомою проблемою - навіть старшокласників навчають ручним способам її вирішення. Це також вирішується автоматизованими доказчиками теореми / шашками, але вони зосереджені на більш досконалих аспектах.

Ось робочий онлайн-автоматизований доказ про теорему: http://tryacl2.org/ , який показує еквівалентність шляхом знаходження послідовності маршрутів сполучення / об'єднання / розподілу тощо:

$xy+x+y=x+y(x+1)$ ?
(thm (= (+ (* x y) x y) (+ x (* y (+ x 1))) ))--- 188 сходинок

$y+x(y+1)=x+y(x+1)$ ?
(thm (= (+ y (* x (+ y 1))) (+ x (* y (+ x 1))) ))--- 325 кроків

Це моє перше питання тут, тому, будь ласка, повідомте мене, чи я обрав неправильне місце, неправильні теги, неправильний спосіб опису / запитання тощо. Дякую!
Примітка: це питання було переписано у відповідь на коментарі
Дякую всім респондентам! Я багато чого навчився.

complexity-theory time-complexity decision-problem

— гіперпалій
джерело

Питання тут потребує певного уточнення. Над яким полем ви працюєте? Чи є об'єкти типу " " і " " у ваших виразах елементами поля чи змінних? Це насправді поле (тобто чи додавання та множення мають обертання)? Зауважте, що сума продуктів не допомагає, оскільки експоненційно багато термінів.

a

$a$

b

$b$

(a_{1} + b_{1}) (a_{2} + b_{2}) \dots (a_{n} + b_{n})

$(a_1+b_1)(a_2+b_2)\cdots(a_n+b_n)$

— Девід Річербі

Якщо об'єкти є змінними, і віднімання дозволено, то ви, по суті, запитуєте про тестування поліноміальної ідентичності, що має алгоритм рандомизованого поліноміального часу за леммою Шварца-Зіппеля . iff

f (x) = g (x)

$f(x)=g(x)$

і основна ідея полягає в тому, що многочлен, який не є однаково нульовим, не має багатьох коренів, тому якщо ви починаєте відгадувати коріння навмання і знайдіть багато коренів, велика ймовірність того, що ваш многочлен був однаково нульовим.

f (x) - g (x) = 0

$f(x)-g(x)=0$

— Девід Річербі

Я здивований, що ніхто ще не згадав про це, але "якщо він знаходиться в НП, мені не потрібно турбуватися про пошук поліноміального алгоритму" не має сенсу. Кожна проблема в Р також в NP. Ви, мабуть, хотіли запитати, чи проблема неповна (або -тверда).

— Том ван дер Занден

Якщо ви боретеся з основами, наші довідкові запитання можуть бути корисними для вас.

— Рафаель

@hyperpallium Перш ніж запитати, чи є мова (тобто проблема вирішення) в NP, краще, якщо ви зрозуміли, що це означає. Можливо, допоможуть відповідні запитання, з якими пов’язаний Рафаель.

— Yuval Filmus

Відповіді:

Ваша проблема зводиться до нульового тестування багатоваріантних многочленів, для яких існують ефективні рандомізовані алгоритми.

Ваші вирази - це багатовимірні многочлени. Мабуть, ваші вирази побудовані за такими правилами: (а) якщо - змінна, то - вираз; (b) якщо - константа, то - вираз; (c) якщо - вирази, то і - вирази. Якщо це дійсно те, що ви задумали, кожен вираз є багатовимірним многочленом над змінними. $x$ $x$ $c$ $c$ $e_1,e_2$ $e_1+e_2$ $e_1e_2$

Тепер ви хочете знати, чи є два вирази рівнозначними. Це означає тестування того, чи є два багатофакторні многочлени еквівалентними: задані і , ви хочете знати, чи ці два поліноми рівнозначні. Ви можете перевірити це, віднімаючи їх і перевіряючи, чи результат однаковий нуль: визначте $p_1(x_1,\dots,x_n)$ $p_2(x_1,\dots,x_n)$

q (x_{1}, \dots, x_{n}) = p_{1} (x_{1}, \dots, x_{n}) - p_{2} (x_{1}, \dots, x_{n}) .

$q(x_1,\dots,x_n) = p_1(x_1,\dots,x_n) - p_2(x_1,\dots,x_n).$

Тепер еквівалентні тоді і тільки тоді, коли - нульовий многочлен. $p_1,p_2$ $q$

Тестування того, чи однаково дорівнює нулю, є проблемою нульового тестування для багатофакторних многочленів. Для цього існують ефективні алгоритми. Наприклад, одним із прикладних алгоритмів є оцінка за багатьма випадковими значеннями . Якщо ви знайдете значення таке, що , то ви знаєте, що $q$ $q(x_1,\dots,x_n)$ $x_1,\dots,x_n$ $x_1,\dots,x_n$ $q(x_1,\dots,x_n)$ $q$ не ідентично дорівнює нулю, тобто не є еквівалентом. Якщо після багатьох випробувань всі вони дорівнюють нулю, то можна зробити висновок, що однаково нульовий (якщо не однаково нульовий, ймовірність того, що всі ці випробування дають нуль, можуть бути експоненціально низькими). Кількість ітерацій, які потрібно зробити, пов'язана зі ступенем ; Детальну інформацію див. у літературі щодо тестування поліноміальної ідентичності. $p_1,p_2$ $q$ $q$ $q$

Наприклад, див. Https://en.wikipedia.org/wiki/Schwartz%E2%80%93Zippel_lemma та http://rjlipton.wordpress.com/2009/11/30/the-curious-history-of-the- schwartz-zippel-lema /

Ці алгоритми застосовуються, якщо ви працюєте над обмеженим полем. Ви не стан , яке поле / кільце ви працюєте, і ви лікуєте ці вирази як формальні вирази чи (наприклад, поліноми як абстрактні об'єкти) або як функції від . Якщо ви працюєте над обмеженим полем, наведені вище методи застосовуються негайно. $\mathbb{F}^n \to \mathbb{F}$

Якщо ви розглядаєте вирази як формальні об'єкти, то ваші вирази еквівалентні багатоваріантним многочленам з цілими коефіцієнтами. Ви можете перевірити еквівалентність цих вибираючи великий випадковий простий і тестування еквівалентності по модулю , тобто в поле . Повторіть це многочлена багато разів, з різними випадковими значеннями , і ви повинні отримати ефективний рандомізований алгоритм для перевірки еквівалентності цих формальних виразів. $r$ $r$ $\mathbb{Z}/r\mathbb{Z}$ $r$

— DW
джерело

З іншого боку, важко буде довести, що для кожного однаково-нульового виразу існує не надто довгий доказ того, що вираз однаково дорівнює нулю.

$\;$

@RickyDemer, чудовий момент! Приємне спостереження. Я трактував питання як запитання про тестування на еквівалентність, а не про доведення цього, але це дуже приємне спостереження. (Якщо ви хотіли показати доказ еквівалентності на практиці, я підозрюю, що доцільно виставити такий доказ, якщо ви готові робити криптографічні припущення, для деякого визначення поняття "доказ" - наприклад, схеми, яка досягає надійності в випадкова модель оракула.)

— DW

Спасибі! Я розглядаю їх як формальні об'єкти, без зворотів, ділення чи віднімання (але використання алгебри середньої школи для цього питання; швидше за все, здається, це вже вирішено). Ви маєте на увазі, продовжуйте вибирати великі випадкові прості числа

, і це трактує вирази так, ніби вони були скінченними полями над базовим набором цілих чисел

? Це посилання на вікі говорить, що для цього нульового тестування не існує відомого субекспоненціального детермінованого алгоритму. Чи знаєте ви, чи це стосується моєї проблеми?

r

$r$

[0.. r - 1]

$[0..r-1]$

— гіперпалій

@hyperpallium, так саме це я маю на увазі. Так, я вважаю, що це стосується і вашої проблеми. Ось чому я запропонував рандомізований алгоритм - є ефективні рандомізовані алгоритми, навіть невідомі ефективні детерміновані алгоритми.

— DW

Як було зазначено в коментарі вище, ОП працює не в обмеженому полі, а скоріше в комутативному семирингу. Це означає, що додаткові інверси не гарантовано існують, тому "віднімання" виразів для перевірки рівності з нулем не є дійсною операцією.

— apnorton

Для того, щоб стежити на один потужності , один-Коефіцієнт і один-постійних обмежень в питанні:

Вони визначають підмножину проблеми тестування поліноміальної ідентичності. Зрозуміло, що їх можна вирішити технікою, яка вирішує загальну проблему. Питання полягає в тому, чи утворюють вони підмножину, яку легше вирішити.

$(a+b)^n$ $(a+b)(a+b) = aa+ab+ab+bb = aa+2ab+bb$ $(aa+2ab+bb)(a+b) = aaa+2aab+abb + aab+2abb+bbb = aaa+3aab+3abb+bbb$ and again terms are combined, making a smaller simpler problem. This combining of terms is a form of dynamic programming.

That is, the possibility of combining terms, creating a non-one coefficient, makes the problem easier not harder.

(Although there is more work in calculation in multiplying non-one coefficients)

non-one constants are included in the above argument by considering constants as variables with zero exponent.

one-power I don't think this makes any difference. Although non-one exponents can be created in more than one way (e.g. $a^4=a^2a^2=a^1a^3$ ), and this can lead to overlap and combination (as in the Binomial Theorm/Pascal's triangle above), actual combination is only possible if non-one coefficients are allowed.

The above is not a formal or rigorous argument. It rests on an assumption about what makes the problem difficult. But it does seem to me that combining terms only makes for an easier problem - so preventing this by the one coefficient constraint is not going to make the subset easier.

— hyperpallium
джерело