Чи мертві онтології та семантична павутина? [зачинено]


10

Чи помер Семантичний Інтернет? Чи онтології мертві?

Я розробляю план роботи для своєї дипломної роботи на тему "База знань через набір онтологій для груп інтересів навколо заболочених земель" . Я досліджував і розробляв онтології для цього, але мені все ще незрозуміло щодо багатьох речей. Яка мова моделювання онтологій?

Яка методологія онтологій краще? ОТК чи МЕТОНТОЛОГІЯ ?

Чи є якась програма, яка робить так, як робить

Cratilo - це програмне забезпечення для аналізу текстових корпусів та вилучення конкретних термінів галузі дослідження (його розробляють професори Хорхе Антоніо Меджіа, Франциско Хав'єр Альварес та Джон Альбейро Санчес, Інститут філософії Антіокійського університету). Це дає змогу лексичний аналіз текстів, виявлення слів, які відображають їх частоту та розташування в тексті. Через процес розпізнавання, Cratylus ідентифікує всі слова в тексті і будує базу даних, стає проектом аналізу твору. Чи є інші подібні інструменти?

Чи можна терміни, знайдені Кратило, використовувати для створення бази знань?

Які існують відкриті смислові рамки, які можна використовувати для таких речей?

Чи існує програмне забезпечення, яке автоматично створює RDF, OWL та XML? Як працює хвостик? Йєна? Кунжут?


2
У вашому дописі занадто багато питань. Спробуйте розділити це.
Якуб Котовський

Крім того, ви перехрестили це на opendata. Прочитайте: meta.stackexchange.com/questions/64068/…
Spacedman

Відповіді:


15

(Хоча я думаю, що ваше запитання зазвичай не розглядають як хороше запитання для цього веб-сайту, я вважаю, що його слід зберігати, оскільки майже кожен новий в галузі спочатку подібний заплутаний і важко знайти пряму, тверезу та врівноважену інформацію про це.)

Чи помер Семантичний Інтернет? Чи онтології мертві?

Багато людей відійшли від семантичної павутини. З іншого боку, є ще багато хто використовує його. Завжди було багато плутанини щодо того, де її цінність. Є випадки використання, які справді користуються семантичними веб-технологіями, але їх дуже мало і між ними.

Пов'язані відкриті дані

Ось частково тому було створено підполе Linked Open Data. Пов'язані дані ви можете бачити як більш прагматичну викреслену версію семантичної павутини (або як необхідного активізатора семантичного бачення більш великого розміру).

Пов'язані дані, хоча і більш прагматичні, все ще використовують онтології. Просто використовувати OWL та конструювати свої онтології спочатку та дуже формально не просто.

База знань, така як Freebase (зараз її замінює Wikidata ), навіть не базується на технологіях Semantic Web (проте вона завжди доступна і у вигляді відвалів RDF). З іншого боку, навіть Freebase ґрунтується на поняттях, подібних до понять Semantic Web, і він має форму онтологій.

Програмне забезпечення для генерації онтологій

Не існує програмного забезпечення, яке б автоматично створювало високоякісні онтології. Принаймні, не в сенсі логічних онтологій OWL / першого порядку. З іншого боку, багато видів програмного забезпечення, включаючи згаданий вами Cratilo, можуть допомогти вам побудувати нижчий крок у семантичному спектрі, наприклад, словник чи, можливо, навіть фольксономія, який згодом може бути перетворений на більшу частину таксономії чи онтології шляхом інші алгоритми. Може бути навіть програмне забезпечення для створення повноцінних онтологій OWL, але я думаю, що це все ще досить активна область досліджень.

Онтології та методології

Як завжди, це залежить від того, які саме ваші потреби та цілі. У таких галузях, як біомедицина та наука про життя в цілому, вони створюють складні формальні онтології, оскільки вони мають дані з дуже різноманітною структурою, а онтології допомагають їм організовувати та використовувати речі. На противагу цьому, ешопу може бути краще дотримуватися звичайного реляційного моделювання баз даних і додавати лише глобальні ідентифікатори (URI) у дусі зв'язаних даних, якщо вони хочуть створити належний графік знань пізніше.

Навіть якщо вам потрібні онтології, ви можете спочатку пропустити методики. Особливо, якщо ви справді новачок у цій галузі та мало розумієте, які ваші потреби.

Йєна, кунжут, ...

Йена, кунжут, віртуоз тощо - це триплетні магазини - вони використовуються для зберігання та запиту RDF. Більшість онтологій можна представити в RDF. Навіть ті, що написані в OWL. RDF має семантичну частину, RDF / S, що дозволяє сформулювати деякі основні онтології. Цього може бути достатньо для початку. Навіть RDF / S може заплутатися і переплутатися, коли ви почнете думати про порожні вузли, названі графіки (чи виправлені вони? Вони динамічні?) Тощо.

Хоча я думаю, що ваше запитання зазвичай не розглядають як гарне запитання для цього веб-сайту, я вважаю, що його слід зберегти, оскільки майже кожен новий у галузі спочатку подібний заплутаний, і важко знайти пряму, тверезу та збалансовану інформацію про це.


велике дякую, вибачте за стільки запитань, вперше я використовую обмін стеками, мене бентежить мій дипломний проект, у мене немає ні радників, ні директорів :( і я втратив інформацію про онтології, я намагаюся структурувати мій дипломний проект із заболочених земель та онтологій та управління знаннями, але це не так, якщо я добре працюю. Ще раз дякую за допомогу. Вибачте за мою англійську, я намагаюся вдосконалити її
Антоніо Едгар Мартінес

@AntonioEdgarMartinez, будь ласка, прийміть одну з відповідей. Я пропоную прийняти відповідь jkbkot, оскільки вона є всеосяжнішою, ніж моя.
Войцех Вальчак

2

У вашій посаді занадто багато занадто загальних проблем.

Ми точно перебуваємо в літній епосі ШІ зараз (на відміну від ЗІ зимової ), і дослідження Semantic Web приділяють менше уваги.

Тим не менш, існує багато проектів, пов’язаних із побудовою онтологій. Google має графік знань та сховище знань . Обидва вони використовують Freebase (серед інших джерел).

Є кілька десятків посилань, які я можу дати вам, щоб відповісти на деякі ваші запитання, але найкраще, що ви можете зробити, це перегляд веб- сторінок W3C Semantic .

Погляньте на RDF, SPARQL, OWL, Virtuoso, Protege - це фактично стандарти.

Щодо вилучення онтологій з текстових корпусів - там є різні інструменти. Жоден з них не є ідеальним, тому вам дійсно доведеться провести деякі дослідження і знайти щось, що відповідає вашим потребам. Наприклад, є OntoLearn Reloaded (цей документ відносно новий, тому ви можете ознайомитися з бібліографією, щоб шукати інші підходи).


велике дякую, вибачте за стільки питань, вперше я використовую обмін стеками, мене бентежить мій дипломний проект, у мене немає радників чи директорів :( і я втратив інформацію про онтології, я намагаюся структурувати мій дипломний проект по водно-болотних угіддях та онтологіям та управлінню знаннями, але це не так, якщо я добре працюю. Ще раз дякую за допомогу. Вибачте за мою англійську, я намагаюся вдосконалити її
Антоніо Едгар Мартінес

2

Є також академічний проект DBPedia , версія RDF підмножини Вікіпедії.

За даними пошукової системи Alexa, яка займає рейтинг веб-сайтів за популярністю в Інтернеті, вона входить до топ-100 000 веб-сайтів - непогано, не зовсім не має значення.

Загальний інтерес для веб-сайту DBpedia.org у період 2015-2016 років, здається, був досить постійним. Дивіться захоплення екрана.

dbpedia timeseries 2015

Інші подібні сайти (за даними Alexa) набагато менш популярні.

Тому я б сказав, що семантичне прийняття веб-сайтів не мертве, воно просто смішно пахне.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.