Запитання з тегом «parsing»

Аналіз (не) структурованих даних для перетворення їх у структурований, нормалізований формат.

5
Чи можна визначити формат csv за допомогою регулярного вираження?
Нещодавно ми з колегою посперечалися, чи здатний чистий регулярний вираз повністю інкапсулювати формат csv, таким чином, щоб він міг аналізувати всі файли з будь-яким заданим символом втечі, цитатою та роздільником. Регекс не повинен бути здатний змінювати ці символи після створення, але він не повинен провалюватися в будь-якому іншому краєвому випадку. …

5
Чи є окремий синтаксичний аналіз та лексинг належними практиками щодо комбінаторів парсерів?
Коли я почав використовувати комбінатори парсера, першою моєю реакцією було відчуття звільнення від того, що відчувалося штучним розмежуванням між синтаксичним розбором і лексингом. Раптом усе просто розбиралося! Однак я нещодавно натрапив на цю публікацію на codereview.stackexchange, що ілюструє того, хто знову відновив цю відмінність. Спочатку я думав, що це дуже …

2
Чи використовують компілятори багатопотокові для швидшого часу компіляції?
Якщо я добре пам’ятаю свій курс компіляторів, типовий компілятор має такий спрощений контур: Лексичний аналізатор сканує (або викликає якусь функцію сканування) вихідного коду за символом Рядок символів введення перевіряється на відповідність словнику лексем Якщо лексема є дійсною, вона класифікується як лексема, якій вона відповідає Аналізатор підтверджує синтаксис комбінації лексем; токен-на-токен …

3
Загальний дизайн аналізатора файлів на Java за допомогою шаблону стратегії
Я працюю над продуктом, у якому відповідальність одного з модулів полягає в розборі XML-файлів та скиданні необхідного вмісту в базу даних. Незважаючи на те, що ця вимога полягає лише в аналізі XML-файлів, я хочу створити свій модуль розбору таким чином, щоб я могла підтримувати будь-які файли в майбутньому. Причиною такого …
14 java  design  parsing  xml 

5
Придумуємо лексеми для лексема
Я пишу аналізатор для створеної мною мови розмітки (пишу в python, але це не дуже важливо для цього питання - адже, якщо це здається поганою ідеєю, я хотів би запропонувати кращий шлях) . Я читаю про парсери тут: http://www.ferg.org/parsing/index.html , і я працюю над написанням лексеру, який повинен, якщо я …
14 python  parsing  lexer 

2
Який найпростіший приклад там пояснити різницю між синтаксичними розборами дерев та абстрактними синтаксичними деревами?
Наскільки я розумію, аналізатор створює дерево розбору, а потім відкидає його. Однак, воно також може вивести абстрактне синтаксичне дерево, яким нібито користується компілятор. Мені здається, що і дерево розбору, і абстрактне синтаксичне дерево створюються під етапом розбору. Тоді хтось може пояснити, чому вони різні?
14 parsing  trees 

5
блок тестів для аналізатора CSV
Які тести потрібно використовувати для тестування аналізатора CSV? У мене є простий синтаксичний аналізатор у C #, і я хочу бути впевненим, що у мене є хороше висвітлення тестових одиниць усіх поширених (і нечасто) крайових випадків. Які тести я повинен використовувати для виявлення потенційних проблем та межових випадків?
14 testing  parsing 

2
Що стосується розбору сканерів без "скасування інших проблем"?
Я не розумію цього речення зі статті Вікіпедії про проблему Данглінг Ельза : [Проблема Dangling Else] - це проблема, яка часто виникає при побудові компілятора, особливо при скануванні без сканера. Чи може хтось пояснити мені, як методи розбору сканерів можуть посилити цю проблему? Мені здається, що проблема полягає в граматиці …

5
Як мені найкраще керувати створенням відкритих вихідних кодів із конфіденційного дослідницького коду моєї компанії?
Моя компанія (назвемо їх Acme Technology) має бібліотеку з приблизно однією тисячею вихідних файлів, які спочатку надходили від її дослідницької групи Acme Labs, інкубувались у групі розробників протягом декількох років, а нещодавно були надані кільком клієнтам під нерозголошення. Acme готується випустити, можливо, 75% коду до спільноти з відкритим кодом. Інші …

6
Який найпростіший з файлів конфігураційний файл для читання? [зачинено]
Закрито . Це питання ґрунтується на думці . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Оновіть питання, щоб на нього можна було відповісти фактами та цитатами, відредагувавши цю публікацію . Закрито 5 років тому . Поточний файл конфігурації такий: mainwindow.title = 'test' mainwindow.position.x = 100 mainwindow.position.y = 200 mainwindow.button.label …

2
Зберігання природних мов, що зберігаються, аналізує дані
Нещодавно я почав експериментувати з обробкою природних мов (NLP) за допомогою CoreNLP Стенфорда , і мені цікаво, які є стандартні способи зберігання даних, розібраних у NLP, для чогось на зразок програми для видобутку тексту? Один із способів, на який я думав, може бути цікавим - зберігати дітей як список суміжності …

3
Як слід вказати граматику для аналізатора?
Я програмую вже багато років, але одне завдання, яке все ще займає мене невдовзі довго, - це визначити граматику для аналізатора, і навіть після цих надмірних зусиль я ніколи не впевнений, що граматика, яку я придумав, є хорошою ( будь-якою розумною мірою «добра»). Я не сподіваюся, що існує алгоритм автоматизації …

2
З точки зору мирян, що залишається рекурсією?
Відповідно до однієї сторінки на code.google.com, "ліва рекурсія" визначається так: Ліва рекурсія якраз і стосується будь-якого рекурсивного нетерміналу, який, коли він створює сентенційну форму, що містить себе, ця нова копія себе з’являється зліва від правила виробництва. Вікіпедія пропонує два різні визначення: З точки зору безконтекстної граматики, нетермінальний r є ліворекурсивним, …

3
Які проблеми, як правило, виникають під час роботи з повідомленнями HL7?
Я тестую продукт для підприємств охорони здоров’я, і ми працюємо з повідомленнями HL7. Я бачив людей, що стогнуть над іншим запитанням щодо проблем із HL7, але не згадуючи конкретики. Чи може хтось дати мені кілька уявлень про те, які питання чи класи проблем ми повинні спеціально шукати? Ми використовуємо деякі …
12 testing  parsing  hl7 

2
мова з двома бінарними операторами однакового пріоритету, ліво-асоціативним та право-асоціативним
Чи є мова програмування (або сценаріїв) (або якась доменна мова), яка має два бінарні оператори oplі oprмає той самий пріоритет, що oplє лівоасоціативною та oprправо асоціативною? (Я не можу знайти такий приклад, але я намагаюся зашифрувати якийсь загальний парсер, який достатньо загальний, щоб обробити цей дивний випадок) Як би розбиралися …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.