Мені потрібно прочитати текстовий файл для слова і повернути його значення. Будь-який інший формат файлу також буде працювати.
Мені потрібно прочитати текстовий файл для слова і повернути його значення. Будь-який інший формат файлу також буде працювати.
Відповіді:
У проекті Гутенберга розміщений Необлакований словник англійської мови Вебстера, а також багато інших літературних творів публічного домену. Насправді схоже, що у них є кілька версій словника, розміщених з авторськими правами різних років. Я пов’язав авторське право 2009 року. Можливо, ви захочете розібратися по сайту та дослідити різні версії словника Вебстера.
user1247808 має гарне посилання на: wget -c
http://www.androidtech.com/downloads/wordnet20-from-prolog-all-3.zip
Якщо для вас недостатньо слів:
http://dumps.wikimedia.org/enwiktionary/latest/enwiktionary-latest-all-titles-in-ns0.gz (оновлений URL з пропозиції Михайла Кропата)
Хоча це ім'я файлу змінюється, ви хочете знайти останнє ... що виявляється просто великим (дуже великим) текстовим файлом.
sed -i 's/TYPE=/ENGINE=/g' wordnet20-from-prolog-all-3.sql
щоб замінити застарілий синтаксис, перш ніж запустити його на 5.0+ версії MySQL
Я не знаю, якщо це занадто пізно, але я думав, що це допоможе комусь іншому.
Я хотів так само погано ... знайшов це врешті-решт.
Можливо, це не ідеально, але мені достатньо (для мого маленького додатка зі словника).
http://www.androidtech.com/downloads/wordnet20-from-prolog-all-3.zip
Це не дамп-файл, а файл сценарію MYSQL .sql
Слова містяться в таблиці WN_SYNSET, а словник / значення в таблиці WN_GLOSS
Here are some files related to natural language and chatterbot projects that we are making available to the public
sed -i 's/TYPE=MyISAM/ENGINE=MyISAM/g' filename.sql
щоб він працював в останньому MySQL
Перевірте, чи відповідають ці безкоштовні ресурси вашим потребам -