Java (n = 8)
import java.util.*;
import java.util.concurrent.*;
public class HankelCombinatorics {
public static final int NUM_THREADS = 8;
private static final int[] FACT = new int[13];
static {
FACT[0] = 1;
for (int i = 1; i < FACT.length; i++) FACT[i] = i * FACT[i-1];
}
public static void main(String[] args) {
long prevElapsed = 0, start = System.nanoTime();
for (int i = 1; i < 12; i++) {
long count = count(i), elapsed = System.nanoTime() - start;
System.out.format("%d in %dms, total elapsed %dms\n", count, (elapsed - prevElapsed) / 1000000, elapsed / 1000000);
prevElapsed = elapsed;
}
}
@SuppressWarnings("unchecked")
private static long count(int n) {
int[][] perms = new int[FACT[n]][];
genPermsInner(0, 0, new int[n], perms, 0);
// We partition by canonical representation of the row sum multiset, discarding any with a density > 50%.
Map<CanonicalMatrix, Map<CanonicalMatrix, Integer>> part = new HashMap<CanonicalMatrix, Map<CanonicalMatrix, Integer>>();
for (int m = 0; m < 1 << (2*n-1); m++) {
int density = 0;
int[] key = new int[n];
for (int i = 0; i < n; i++) {
key[i] = Integer.bitCount((m >> i) & ((1 << n) - 1));
density += key[i];
}
if (2 * density <= n * n) {
CanonicalMatrix _key = new CanonicalMatrix(key);
Map<CanonicalMatrix, Integer> map = part.get(_key);
if (map == null) part.put(_key, map = new HashMap<CanonicalMatrix, Integer>());
map.put(new CanonicalMatrix(m, perms[0]), m);
}
}
List<Job> jobs = new ArrayList<Job>();
ExecutorService pool = Executors.newFixedThreadPool(NUM_THREADS);
for (Map.Entry<CanonicalMatrix, Map<CanonicalMatrix, Integer>> e : part.entrySet()) {
Job job = new Job(n, perms, e.getKey().sum() << 1 == n * n ? 0 : 1, e.getValue());
jobs.add(job);
pool.execute(job);
}
pool.shutdown();
try {
pool.awaitTermination(1, TimeUnit.DAYS); // i.e. until it's finished - inaccurate results are useless
}
catch (InterruptedException ie) {
throw new IllegalStateException(ie);
}
long total = 0;
for (Job job : jobs) total += job.subtotal;
return total;
}
private static int genPermsInner(int idx, int usedMask, int[] a, int[][] perms, int off) {
if (idx == a.length) perms[off++] = a.clone();
else for (int i = 0; i < a.length; i++) {
int m = 1 << (a[idx] = i);
if ((usedMask & m) == 0) off = genPermsInner(idx+1, usedMask | m, a, perms, off);
}
return off;
}
static class Job implements Runnable {
private volatile long subtotal = 0;
private final int n;
private final int[][] perms;
private final int shift;
private final Map<CanonicalMatrix, Integer> unseen;
public Job(int n, int[][] perms, int shift, Map<CanonicalMatrix, Integer> unseen) {
this.n = n;
this.perms = perms;
this.shift = shift;
this.unseen = unseen;
}
public void run() {
long result = 0;
int[][] perms = this.perms;
Map<CanonicalMatrix, Integer> unseen = this.unseen;
while (!unseen.isEmpty()) {
int m = unseen.values().iterator().next();
Set<CanonicalMatrix> equiv = new HashSet<CanonicalMatrix>();
for (int[] perm : perms) {
CanonicalMatrix canonical = new CanonicalMatrix(m, perm);
if (equiv.add(canonical)) {
result += canonical.weight() << shift;
unseen.remove(canonical);
}
}
}
subtotal = result;
}
}
static class CanonicalMatrix {
private final int[] a;
private final int hash;
public CanonicalMatrix(int m, int[] r) {
this(permuteRows(m, r));
}
public CanonicalMatrix(int[] a) {
this.a = a;
Arrays.sort(a);
int h = 0;
for (int i : a) h = h * 37 + i;
hash = h;
}
private static int[] permuteRows(int m, int[] perm) {
int[] cols = new int[perm.length];
for (int i = 0; i < perm.length; i++) {
for (int j = 0; j < cols.length; j++) cols[j] |= ((m >> (perm[i] + j)) & 1L) << i;
}
return cols;
}
public int sum() {
int sum = 0;
for (int i : a) sum += i;
return sum;
}
public int weight() {
int prev = -1, count = 0, weight = FACT[a.length];
for (int col : a) {
if (col == prev) weight /= ++count;
else {
prev = col;
count = 1;
}
}
return weight;
}
@Override public boolean equals(Object obj) {
// Deliberately unsuitable for general-purpose use, but helps catch bugs faster.
CanonicalMatrix that = (CanonicalMatrix)obj;
for (int i = 0; i < a.length; i++) {
if (a[i] != that.a[i]) return false;
}
return true;
}
@Override public int hashCode() {
return hash;
}
}
}
Зберегти як HankelCombinatorics.java
, скласти як javac HankelCombinatorics.java
, запустити як java -Xmx2G HankelCombinatorics
.
З NUM_THREADS = 4
на моїй чотирьохядерний машині він отримує 20420819767436
за n=8
в 50 до 55 секунд пройшли, з неабиякою варіабельністю між прогонами; Я очікую, що це може легко управляти тим же самим на вашій окта-сердечній машині, але на це знадобиться година чи більше n=9
.
Як це працює
Враховуючи n
, існують 2^(2n-1)
двійкові матриці n
х n
Ханкеля. Рядки можуть бути перетворені n!
способами, а стовпці - n!
способами. Все, що нам потрібно зробити, це уникнути подвійного рахунку ...
Якщо ви обчислюєте суму кожного рядка, то ні перестановка рядків, ні переривання стовпців не змінюють мультисету сум. Напр
0 1 1 0 1
1 1 0 1 0
1 0 1 0 0
0 1 0 0 1
1 0 0 1 0
має мультисету рядків {3, 3, 2, 2, 2}
, і так само всі матриці Hankelable, отримані з неї. Це означає, що ми можемо групувати матриці Хенкеля по цих мультисетах рядів, а потім обробляти кожну групу незалежно, використовуючи кілька ядер процесора.
Існує також корисна симетрія: матриці, що мають більше нулів, ніж одиниці, знаходяться в біекції, а матриці - більше, ніж нулі.
Подвійний облік має місце , коли Ганкель матриця M_1
з перестановкою рядків r_1
і перестановкою стовпців c_1
відповідає матриці ганкелева M_2
з перестановкою рядків r_2
і перестановкою стовпців c_2
(до двох , але не всі три M_1 = M_2
, r_1 = r_2
, c_1 = c_2
). Рядки і стовпці перестановки є незалежними, так що якщо ми застосуємо рядки перестановку r_1
до M_1
і рядку перестановку r_2
в M_2
шпальтах як мультимножини повинні бути рівні. Отже, для кожної групи я обчислюю всі мультисети стовпців, отримані шляхом застосування перестановки рядків до матриці групи. Найпростіший спосіб отримати канонічне зображення мультисетів - це сортування стовпців, що також корисно на наступному кроці.
Отримавши окремі мультисети стовпців, нам потрібно знайти, скільки n!
перестановок кожного є унікальним. На цьому етапі подвійний підрахунок може відбутися лише в тому випадку, якщо в заданому мультисеті стовпців є повторювані стовпці: що нам потрібно зробити, це підрахувати кількість зустрічей кожного окремого стовпця в мультисеті, а потім обчислити відповідний мультиноміальний коефіцієнт. Оскільки стовпці відсортовані, підрахунок легко зробити.
Нарешті ми їх додаємо.
Асимптотична складність не є тривіальною для обчислення до повної точності, тому що нам потрібно зробити деякі припущення щодо множин. Ми оцінюємо за порядком 2^(2n-2) n!
мультисетів стовпців, забираючи n^2 ln n
час для кожного (включаючи сортування); якщо групування не займає більше ln n
фактора, у нас є складність у часі Theta(4^n n! n^2 ln n)
. Але оскільки експоненціальні чинники повністю домінують над поліноміальними, це так Theta(4^n n!) = Theta((4n/e)^n)
.