Як отримати невідомі значення

19

Чи може мені хтось допомогти з наступною проблемою?

Я хочу знайти деякі значення $a_i,b_j$ (mod $N$ ), де $i=1,2,…,K, j=1,2,…,K$ (наприклад, $K=6$ ), задавши список значень $K^2$ які відповідають різниці $a_i-b_j\pmod N$ (наприклад $N=251$ ), не знаючи конкретного відповідного відношення. Оскільки значення $a_i,b_j\pmod N$ не визначені однозначно, враховуючи відмінності $a_i-b_j\pmod N$ , ми шукаємо будь-яке дійсне призначення значень.

Безумовно, спробувати кожну перестановку чисел $K^2$ у списку (цілком $K^2!$ Можливі випадки), а потім вирішити модульні рівняння з $a_i,b_j$ як змінні нездійсненно.

Насправді ця проблема виникає у статті про криптоаналіз до ранньої версії схеми підпису NTRU ( http://eprint.iacr.org/2001/005 ). Однак автор написав лише одне речення «Простий алгоритм зворотного відстеження знаходить одне рішення ...» (у Розділі 3.3), і тому хто-небудь може дати більше пояснень? Крім того, автор також зазначив, що «кожен круговий зсув $\{((a_i+M)\mod N,(b_i+M)\mod N\}_{i=1}^K$ або swap $(\{(N-1-b_i,N-1-a_i)\}_{i=1}^K)$ призводить до того ж шаблону $a_i-b_j\mod N$ ”і чи корисне це твердження?

— гість
джерело

7

Зауважте, що відновити неможливо , оскільки якщо до всіх чисел додати деяку константу , то відмінності залишаються однаковими.

ai,bj $a_i,b_j$

C $C$

— Yuval Filmus

1

@Yuval: Це вже включено в останнє речення опису. Я думаю, що потрібне лише одне рішення, оскільки їх може існувати декілька.

— domotorp

2

@Yuval Вибачте за не вказавши, що «s також повинні бути прийняті модульне . Так що не існує нескінченних рішень.

ai,bj $a_i,b_j$

N $N$

— гість

@domotorp Так, знайти будь-яке з рішень добре.

— гість

1

Можливо, ОП може уточнити, що , приймаються за модулем раніше на посаді: можливо, в заголовку або в першому абзаці. Питання з постійною також варто згадати. Обидві речі плутали мене, коли я почав читати.

ai $a_i$

bj $b_j$

N $N$

C $C$

— Хуан Бермеджо Вега

4

Ось пропозиція, для і . Нам дається список $K = 6$ $N = 251$ . Почніть з одного з них, не втрачаючи загальності . Без втрати загальності , і отримуємо значення . Тепер візьміть ще один, і сподіватисящо вона має вигляд (це відбувається з ймовірністю ), і вивести . $a_i - b_j \pmod{N}$ $a_1-b_1$ $b_1=0$ $a_1$ $a_2-b_1$ $5/35 = 1/7$ $a_2$

На даному етапі, ми знаємо , . Наша наступна мета полягає в тому, щоб шукати для . Для кожного кандидата , якщо тоді також має бути у списку. Якщо $a_1,a_2,b_1$ $a_1-b_j$ $j \neq 1$ $a_i-b_j$ $i=1$ $(a_i-b_j)+(a_2-a_1)=a_2-b_j$ , то ймовірністьщо також в списку приблизно . Отже, якщо ми знайдемо якогось кандидата для якого також є у списку, то, ймовірно, . Таким чином ми можемо відновитись $i \neq 1$ $(a_i-b_j)+(a_2-a_1)$ $33/251$ $a_i-b_j$ $(a_i-b_j)+(a_2-a_1)$ $i=1$ з певною визначеністю. $b_2$

На цьому етапі ми знаємо . Таким же чином , що ми витягнутого , можна відновити з достатньою ступенем впевненості. Потім ми можемо відновити , шукаючи кандидата для якого і $a_1,a_2,b_1,b_2$ $b_2$ $a_3$ $b_3$ $a_i-b_j$ $(a_i-b_j)+(a_2-a_1)$ обидва в списку. Тому щонас є щес, наша ймовірність відмови йде значно вниз. Продовжуємо і знаходимо . $(a_i-b_j)+(a_3-a_1)$ $a$ $b_3,a_4,b_4,a_5,b_6,a_6,b_6$

У будь-який момент в цьому алгоритмі, ми могли б здогадатися що - то не так, і це в кінцевому рахунку призведе до протиріччя (скажімо , в якій - то момент, що не хороший кандидат ). Потім ми повертаємось назад і спробуємо іншу можливість; якщо ми вичерпаємо всі можливості, ми знову відступимо і спробуємо іншу можливість (для іншого етапу алгоритму); і так далі. $a_i-b_j$

Це дійсно добре програмувати цей алгоритм - це, мабуть, єдиний спосіб зрозуміти, як правильно реалізувати зворотний трек. Це також єдиний спосіб сказати, чи працює цей алгоритм на практиці.

— Юваль Фільм
джерело

Дякую, і я також зашифрую це відтворення, щоб зрозуміти його. Можливо, автор цього оригінального документу використовував подібний метод, тому що він також згадав "зворотній шлях".

— гість

Вибачте, що забули написати коментар до вашої відповіді! Я також реалізував запропонований вами метод (на C ++). Висновок полягає в тому, що ваш алгоритм працює досить добре, і одне з рішень можна знайти дуже швидко (менше ніж на секунду на моєму ПК). І цього разу я можу краще зрозуміти процедури зворотного треку. Велике спасибі!

— гість

Чому я не можу "@Yuval" у своєму останньому коментарі ?! Вибачте, але я кілька разів намагався.

— гість

Можливо, ви могли б поділитися кодом в Інтернеті, щоб інші люди, які читали документ, мали доступ до нього.

— Yuval Filmus

5

Оновлення : Опис, наведений нижче, стосується іншої проблеми (у якій у вас все парні відстані в наборі, а не попарні відстані між двома різними наборами). Я все одно залишу це, оскільки це тісно пов'язане.

Ця проблема називається проблемою колії , і це окремий випадок загальної проблеми вбудовування -torus. Вона також тісно пов’язана з проблемою "під ключ", в якій різниці відстаней є абсолютними (не по модулю деяка кількість). $d$

Невідомо, чи допускає проблема прохідної колії полігональний алгоритм. Існують різні алгоритми псевдо-полі часу для відповідних питань. Найкраща довідка (на жаль, стара) - робота Лемке, Скіени та Сміта .

— Суреш Венкат
джерело

1

Я думаю, що ця проблема інша. У задачі про прохідний шлях ми знаємо всі попарні відстані, тут ми знаємо його лише між двома точками, які знаходяться в різних групах. Хоча це здається менше інформації, але насправді це може допомогти вирішити проблему.

— domotorp

Ага так. це двосторонній графік. гарна думка.

— Суреш Венкат

Біпартитовий графік? Щось на зразок. Можливо, я повинен спробувати проблему таким чином, але в мене зараз немає конкретного думки.

— гість

3

Ось зауваження, яке, на мою думку, дає тобі місце, можливо, достатньо одного, щоб вирішити проблему.

Припустимо, у нас є чотири відмінності , , , які виникають у вигляді попарних різниць між двома 's та 2 ' s. Назвіть це квартетом відмінностей. Зауважте, що у нас нетривіальні стосунки: $a_1-b_1$ $a_1-b_2$ $a_2-b_1$ $a_2-b_2$ $a$ $b$

(a 1 - b 1) - (a 1 - b 2) = (a 2 - b 1) - (a 2 - b 2) (mod N) .

$(a_1-b_1)-(a_1-b_2) = (a_2-b_1)-(a_2-b_2) \pmod N.$

Ви можете спробувати використати це відношення для визначення потенційних квартетів із списку . Наприклад, виберіть зі списку чотири відмінності; якщо вони не задовольняють вищевказаним відносинам, то вони точно не виникають із структури квартету; якщо вони задовольняють стосунки, вони можуть виникнути з квартету. $K^2$

Є багато способів взяти речі звідси, але я підозрюю, що цього буде достатньо.

Я особливо підозрюю, що для ваших прикладних параметрів, проблема буде досить простою, тому що вищевказаний тест на розпізнавання квартету, ймовірно, не буде мати занадто багато помилкових позитивних результатів. Наше з усіх способів вибору 4 відмінностей зі списку, буде ${K^2 \choose 4}$ квартети (які всі задовольнятимуть відносини), а решта - це неквартети (які задовольняють відношення з вірогідністю, евристично). Тому ми очікуємо побачити про ${K \choose 2}^2$ $1/N$ хибних позитивних результатів, тобто 4-кортезів, які проходять тест, навіть якщо вони не є квартетами. Для ваших параметрів це означає, що у нас є 225 квартетів таінших помилкових позитивних результатів; тому приблизно половина 4-х кортежів, які проходять тест, насправді є квартетами. Це означає, що вищевказаний тест є досить хорошим способом розпізнавання квартетів. Після того, як ви зможете розпізнати квартети, ви зможете реально поїхати в місто, відновивши структуру списку відмінностей. $({K^2 \choose 4}-{K \choose 2}^2)/N$ $(58905-225)/251 \approx 234$

— DW
джерело

@DW: Дякую, але мені зараз цікаво наступний крок після того, як знайдуться всі можливі квартети (всього 225 + 234 = 459). Чи слід шукати 3 квартети, що не перетинаються, і перевіряти, чи можуть вони стати можливим рішенням? Як це досягти ефективно? Можливо, не так складно, оскільки не буде багато перекриттів.

— гість

@aguest, гарне запитання! Я не можу згадати, що я думав у той час. Я думаю , що я пам'ятаю , думав один підхід міг би почати з одного квартету, а потім подивитися на всі інші , які перекривають його в 2 відмінностей (наприклад, що виникають з

, де

), але я не знаю, куди податися звідти (як відфільтрувати помилкові позитиви). a1,aj,b1,b2 $a_1,a_j,b_1,b_2$

j≠2 $j\ne 2$

— DW

3

Ось інший підхід, заснований на итеративно знайти номери , які не можуть з'являтися серед . Назвемо безліч більш-аппроксимацией «S , якщо ми знаємо , що . Точно так же, є overapproximation з «и , якщо ми знаємо , що . Очевидно, що менший $\{a_1,\dots,a_6\}$ $A$ $a$ $\{a_1,\dots,a_6\} \subseteq A$ $B$ $b$ $\{b_1,\dots,b_6\} \subseteq B$ $A$ , Тим більше корисно це по-наближення, і те ж саме відноситься і до . Мій підхід ґрунтується на ітераційному уточненні цих надмірних наближень, тобто ітеративному зменшенні розміру цих наборів (оскільки ми виключаємо все більше і більше значень як неможливих). $B$

Основою цього підходу є метод доопрацювання : задавши перевищення апроксимації для та надмірне наближення для , знайдіть нове перевищення для такого , що . Зокрема, як правило , буде менше , ніж , так що це дозволяє нам уточнити Надмірна наближення для «с. $A$ $a$ $B$ $b$ $A^*$ $a$ $A^* \subsetneq A$ $A^*$ $A$ $a$

За допомогою симетрії, по суті, той самий трюк дозволить нам уточнити наше надмірне наближення для : з огляду на перевищення наближення для та надмірне наближення для , воно призведе до нового -приближення для 's. $b$ $A$ $a$ $B$ $b$ $B^*$ $b$

Отже, дозвольте мені розповісти, як зробити уточнення, тоді я зберу все, щоб отримати повний алгоритм цієї проблеми. Далі, нехай позначає множину різниць, тобто ; ми зосередимося на пошуку доопрацьовуватися наближення , враховуючи . $D$ $D=\{a_i-b_j:1 \le i,j \le 6\}$ $A^*$ $A,B$

How to compute a refinement. Consider a single difference $d \in D$ . Consider the set $d+B=\{d+y : y \in B\}$ . Based on our knowledge that $B$ is an over-approximation of the $b$ 's, we know that at least one element of $d+B$ must be an element of $\{a_1,\dots,a_6\}$ . Therefore, we can treat each of the elements in $d+B$ as a "suggestion" for a number to possibly include in $A$ . So, let's sweep over all differences $d \in D$ and, for each, identify which numbers are "suggested" by $d$ .

Now I'm going to observe that the number $a_1$ is sure to be suggested at least 6 times during this process. Why? Because the difference $a_1-b_1$ is in $D$ , and when we process it, $a_1$ will be one of the numbers it suggests (since we're guaranteed that $b_1 \in B$ , $(a_1-b_1)+B$ will surely include $a_1$ ). Similarly, the difference $a_1-b_2$ appears somewhere in $D$ , and it'll cause $a_1$ to be suggested again. In this way, we see that the correct value of $a_1$ will be suggested at least 6 times. The same holds for $a_2$ , and $a_3$ , and so on.

So, let $A^*$ be the set of numbers $a^*$ that have been suggested at least 6 times. This is sure to be an over-approximation of the $a$ 's, by the above comments.

As an optimization, we can filter out all suggestions that are not present in $A$ immediately: in other words, we can treat the difference $d$ as suggesting all of the values $(d+B)\cap A$ . This ensures that we will have $A^* \subseteq A$ . We are hoping that $A^*$ is strictly smaller than $A$ ; no guarantees, but if all goes well, maybe it will be.

Putting this together, the algorithm to refine $A,B$ to yield $A^*$ is as follows:

Let $S = \cup_{d \in D} (d+B)\cap A$ . This is the multi-set of suggestions.
Count how many times each value appears in $S$ . Let $A^*$ be the set of values that appear at least 6 times in $S$ . (This can be implemented efficiently by building an array $a$ of 251 initially, initially all zero, and each time the number $s$ is suggested, you increment $a[s]$ ; at the end you sweep through $a$ looking for elements whose value is 6 or larger)

A similar method can be built to refine $A,B$ to get $B^*$ . You basically reverse things above and flip some signs: e.g., instead of $d+B$ , you look at $-d+A$ .

How to compute an initial over-approximation. To get our initial over-approximation, one idea is to assume (wlog) that $b_1=0$ . It follows that each value $a_i$ must appear somewhere among $D$ , thus the list of differences $D$ can be used as our initial over-approximation for the $a$ 's. Unfortunately, this doesn't give us a very useful over-approximation for the $b$ 's.

A better approach is to additionally guess the value of one of the $a$ 's. In other words, we assume (wlog) that $b_1=0$ , and use $A=D$ as our initial over-approximation of the $a$ 's. Then, we guess which one of these 36 values is indeed one of the $a$ 's, say $a_1$ . That then gives us an over-approximation $B=a_1-D$ for the $b$ 's. We use this initial over-approximation $A,B$ , then iteratively refine it until convergence, and test whether the result is correct. We repeat up to 36 times, with 36 different guesses at $a_1$ (on average 6 guesses should be enough) till we find one that works.

A full algorithm. Now we can have a full algorithm to compute $a_1,\dots,a_6,b_1,\dots,b_6$ . Basically, we derive an initial over-approximation for $A$ and $B$ , then iteratively refine.

Make a guess: For each $z \in D$ , guess that $a_1=z$ . Do the following:
1. Initial over-approximation: Define $A=D$ and $B=z-D$ .
2. Iterative refinement: Repeatedly apply the following until convergence:
  - Refine $A,B$ to get a new over-approximation $B^*$ of the $b$ 's.
  - Refine $A,B^*$ to get a new over-approximation $A^*$ of the $a$ 's.
  - Let $A:= A^*$ and $B:= B^*$ .
3. Check for success: If the resulting sets $A,B$ each have size 6, test whether they are a valid solution to the problem. If they are, stop. If not, continue with the loop over candidate values of $z$ .

Analysis. Will this work? Will it eventually converge on $A=\{a_1,\dots,a_6\}$ and $B=\{b_1,\dots,b_6\}$ , or will it get stuck without completely solving the problem? The best way to find out is probably to test it. However, for your parameters, yes, I expect it will be effective.

If we use method #1, as long as $|A|,|B|$ are not too large, heuristically I expect the sizes of the sets to monotonically shrink. Consider deriving $A^*$ from $A,B$ . Each difference $d$ suggests $|B|$ values; one of them correct, and the other $|B|-1$ can be treated (heuristically) as random numbers. If $x$ is a number that does not appear among the $a$ 's, what is the probability that it survives the filtering and is added to $A^*$ ? Well, we expect $a$ to be suggested about $(|B|-1) \times 36/251$ times in total (on average, with standard deviation about the square root of that). If $|B|\le 36$ , the probability that a wrong $x$ survives the filtering should be about $p=0.4$ or so (using the normal approximation for the binomial, with continuity correction). (The probability is smaller if $|B|$ is smaller; e.g., for $|B|=30$ , I expect $p\approx 0.25$ .) I expect the size of $A^*$ to be about $p (|A|-6) + 6$ , which will strictly improve the over-approximation since it is strictly smaller than $|A|$ . For instance, if $|A|=|B|=36$ , then based upon these heuristics I expect $|A^*|\approx 18$ , which is a big improvement over $|A|$ .

Therefore, I predict that the running time will be very fast. I expect about 3-5 iterations of refinement to be enough for convergence, typically, and about 6 guesses at $z$ should probably be enough. Each refinement operation involves maybe a few thousand memory reads/writes, and we do that maybe 20-30 times. So, I expect this to be very fast, for the parameters you specified. However, the only way to find out for sure is to try it and see if it works well or not.

— D.W.
джерело

@DW: Thank you very much for your long answer and the effort you took to type so many words!!! According to your description, your algorithm here is quite correct. And I’m going to code it to test the efficiency right now.

— a guest

@DW: Hi, I’ve implemented your description in C++. The algorithm runs fast and the refinement step does reduce the sizes of original sets

$A$ and

$B$ . However, the convergence seems to be not so perfect. In fact, for each guess

$z\in D$ , the final sizes of

$A^*$ and

$B^*$ are still more than 10 according to my record output by the program. The most frequent number of existing elements when

$A^*$ (and

$B^*$ ) can not be improved by further repetitions of refinement is 11, but I can hardly see a number below 10. However, this has made the problem solvable by trying each 6-elements chosen from

— a guest

@DW: (Cotinued)final

$A^*$ and

$B^*$ for each guess

$z$ (although I didn’t implement the last step on my PC). The total amount computation will be about

$2^{20}$ , I estimate. Thank you very much!

— a guest

Sorry, but my last comment is too long, and I have to split it into two.

— a guest