Ви можете взяти його -pages-articles.xml.bz2
з сміттєзвалища Wikimedia та обробити їх за допомогою WikiTaxi (завантажити у верхньому лівому куті). Інструмент імпорту Wikitaxi створить з .taxi
файлу (близько 15 Гбіт для Вікіпедії) .bz2
. Цей файл буде використаний програмою WikiTaxi для пошуку статей. Досвід дуже схожий на досвід роботи браузера.
Або ви можете використовувати Kiwix , швидше, щоб налаштувати, оскільки він також забезпечує вже оброблені дамп ( .zim
файли). Як зазначено в коментарі, для того, щоб mwoffliner
можна було використовувати інші сайти MediaWiki для kiwix , він може не працювати з усіма, оскільки вони можуть мати спеціальні відмінності, але це єдиний варіант, на який я натрапив.
Візьміть із Вікімедію речі wget
не є хорошою практикою. Якщо занадто багато людей зробить це, це може затопити сайти запитами.
Пізніше відредагуйте для випадку, коли ви бажаєте також зображень в автономному режимі:
Якщо ви хочете повне дзеркало Вікіпедії (включаючи зображення), повне форматування HTML недоторкане, яке завантажуватиметься приблизно 30 годин , вам слід скористатися:
Англійська Вікіпедія має багато даних. Є 13,9+ мільйонів сторінок з 20,0+ ГБ тексту, а також 3,7+ мільйонів мініатюр.
XOWA :
Налаштування всього цього на вашому комп’ютері не буде швидким процесом ... Сам імпорт вимагатиме 80 Гб дискового простору та п’ять годин обробки текстової версії. Якщо ви також хочете зображень, цифри збільшуються до 100 Гб місця на диску і 30 годин часу обробки. Однак, коли ви закінчите, у вас з'явиться повна, нещодавня копія англійської Вікіпедії із зображеннями, які можуть вміститися на 128 Гб SD-картці.
Але офлайн-версія дуже схожа на онлайн-версію, включає фотографії тощо:
(Я випробував нижче статтю повністю в автономному режимі)
Пізніше відредагуйте, якщо нічого із зазначеного не застосовується:
Якщо wiki не є частиною Wikimedia або не має дампа, на github є проект, який завантажує цю wiki за допомогою свого API:
Main Page
та перейдіть за посиланнями звідти.