Запитання з тегом «parsing»

Аналіз (не) структурованих даних для перетворення їх у структурований, нормалізований формат.

5
Отримання даних із веб-сторінки стабільним та ефективним способом
Нещодавно я дізнався, що використання регулярного вираження для розбору HTML веб-сайту для отримання потрібних даних - не найкращий спосіб дії. Отже, моє запитання просте: що тоді найкращий / найефективніший і загалом стабільний спосіб отримати ці дані? Зазначу, що: API не існує Немає іншого джерела, з якого я можу отримати дані …
11 data  parsing 

7
Методики розбору XML
Я завжди вважав XML дещо громіздким для обробки. Я не кажу про реалізацію аналізатора XML: я говорю про використання існуючого аналізатора на основі потоку, як SAX-аналізатор, який обробляє вузол XML за вузлом. Так, вивчити різні API для цих аналізаторів дуже просто, але коли я дивлюся на код, який обробляє XML, …

2
Алгоритм формування SQL-коду
Мені потрібен інструмент (для домашнього використання), який буде форматувати код SQL (SQL Server / MySQL). Існують різні сторонні інструменти та веб-сайти, які роблять це, але не точно, як мені це потрібно. Тому я хочу написати власний інструмент, який відповідає моїм потребам. Перше запитання: чи є стандарт чи конвенція щодо форматування …

1
Чому GCC перейшов з Bison на рекурсивний аналізатор спуску для C ++ та C?
Чи була якась зміна мови, яка цього вимагала, або якась практична причина, чому Бізон вже не був відповідним чи оптимальним? Я побачив у wikipedia, що вони перейшли, посилаючись на примітки до випуску GCC 3.4 та GCC 4.1 . У цих примітках до випуску зазначено: Рукописний рекурсивно-розбірний C ++ аналізатор замінив …
10 c++  c  parsing  compiler 

1
Чи заражає грамматика GPL Bison мою програму?
Я думаю про використання граматики GPL Bison для власного компілятора. Чи граматика «заразить» мій аналізатор таким чином, що він повинен бути відкритим кодом? Граматика - з точки зору - введення зубрів - GPL.

3
Написання компілятора компілятора - розуміння використання та функцій
Це частина серії запитань, яка присвячена сестринському проекту до проекту абстракції, який має на меті абстрагувати поняття, які використовуються в мовному дизайні у формі рамки. Сестринський проект називається OILexer, який має на меті побудувати аналізатор з граматичних файлів, без використання введення коду на сірники. Деякі інші сторінки, пов’язані з цими …

2
Розбір мови, щоб знайти важливі слова
Я шукаю певний вклад та теорію щодо підходу до лексичної теми. Скажімо, у мене є колекція рядків, яка може бути просто одним реченням або потенційно декількома реченнями. Я хотів би проаналізувати ці рядки та вирвати найважливіші слова, можливо, із оцінкою, яка позначає, наскільки ймовірно, що слово має значення. Давайте розглянемо …

3
Який випадок використання в реальному світі використання граматики Чомського типу I (залежно від контексту)
Останнім часом я весело вивчаю розвиток мовних аналізаторів у контексті того, як вони вписуються в ієрархію Хомських. Що таке хороший реальний (тобто не теоретичний) приклад контекстної граматики?

4
Як мені реалізувати додаток для обробки команд?
Я хочу зробити просту програму із підтвердженням концепції (REPL), яка приймає число, а потім обробляє команди на це число. Приклад: я починаю з 1. Потім я пишу " add 2", це дає мені 3. Потім я пишу " multiply 7", це дає мені 21. Потім я хочу знати, чи це …

6
Найкращий спосіб розбору файлу
Я намагаюся знайти краще рішення для розбору парних знаменитих форматів файлів, таких як: EDIFACT та TRADACOMS . Якщо ви не знайомі з цими стандартами, перегляньте цей приклад з Вікіпедії: Нижче див. Приклад повідомлення EDIFACT, яке використовується для відповіді на запит про доступність продукту: - UNA:+.? ' UNB+IATB:1+6XPPC+LHPPC+940101:0950+1' UNH+1+PAORES:93:1:IA' MSG+1:45' IFT+3+XYZCOMPANY …

1
Що робить деякі речі простішими для розбору, ніж інші?
Я щойно читав сторінку Вікіпедії для WebAssembly, і на ній написано: " WebAssembly - це ... розроблений так, щоб швидше розбирати, ніж JavaScript ", що наштовхнуло мене на думку, що робить певний мову чи формат даних швидшим для розбору, ніж інші та які алгоритми розбору використаний?
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.