Виявити повторювані запитання
Колись тут був майданчик для гольфу. У нього виникли проблеми: люди надсилали подібні чи однакові питання знову і знову. Ви буливибрані вибрані примусові призовники на шантажі вимагається автоматизувати процес вирішення питання, чи є питання дублікатом існуючого, будь-якими способами (див. Правила).
Вхідні дані
Ваша програма повинна прийняти одну URL-адресу як вхідну інформацію. Можна припустити, що це призводить до запитання на codegolf.stackexchange.com .
Вихідні дані
Шукайте на сайті подібні запитання. Якщо ви вважаєте, що вхідне запитання є дублікатом існуючого питання (або навпаки), виведіть URL-адресу іншого питання. Ви можете вивести кілька URL-адрес, розділених новими рядками. В кінці вашого результату виведіть end
(окремим рядком).
Оцінка балів
- Якщо питання, яке ви виводили, було позначене як дублікат вхідного питання (або навпаки), ви набираєте 4 бали. Це "правильна здогадка".
- За кожен хибний позитив (він же "неправильна здогадка") ви втрачаєте 2 бали.
- За кожне запитання, яке насправді було дублікатом, але не відображається у ваших результатах (він же "відсутній здогад"), втрачайте 1 бал.
Виграє найвищий бал за 32 вхідні запитання. Ці 32 питання - це «раунд». На початку кожного раунду бали будуть скинуті до 0. Один раунд проводитиметься кожні кілька днів, а таблиця лідерів оновлюється після кожного раунду.
Правила
- Якщо запитання A і C закриті як дублікати B, A вважатиметься дублікатом C і навпаки.
- На початку кожного раунду ваша програма може не мати жодних даних щодо будь-яких питань (тобто відсутність жорсткого кодування ), за винятком способів розбору веб-сайту.
- Однак ви можете зберігати дані у зовнішніх файлах під час раунду.
- Дані не можуть зберігатися між раундами.
- У вашому виході повинен бути новий новий рядок.
- Ви не можете використовувати будь-які дані з веб-сайту, окрім результатів пошуку та URL-адреси, заголовка, тегів та тексту питання , із форматуванням або без нього. Наприклад, ви не можете використовувати текст "позначений як дублікат foo, bar ...", який відображається на дублюючих запитаннях.
- Ви можете отримати ці дані безпосередньо з сайту, через data.SE або через API.
- Кожне подання повинно мати ім’я.
- Кожне подання повинно мати чітку нумерацію версій.
- Якщо подання не дасть результату через обмежений термін (буде прийнято рішення; будь ласка, вкажіть, скільки часу буде подано), воно буде знищене та втратить 8 балів.