Як знайти поширені неправильні написання мого доменного імені?


38

Я хотів би зареєструвати неправильні написання мого доменного імені, але я не хочу спекулятивно реєструвати мільйони форм "просто вгадування". Наприклад, цей інструмент пропонує наступні параметри у Генераторі помилок друку

  • пропускати букви
  • подвійні літери
  • зворотні букви
  • пропустити місця
  • пропущений ключ
  • вставлений ключ

Що чудово, і генерує десятки, якщо не сотні можливих доменних імен ... але це не каже мені найважливіше: які з цих неправильних написань насправді трапляються найбільше з реальними користувачами в реальному Інтернеті?

Як я можу знайти фактичні помилкові дані від реальних користувачів?

Відповіді:


25

У Вікіпедії є декілька ресурсів, але вам доведеться пощастити, щоб мати домен, який є простим англійським словом ванілі, достатньо поширеним, щоб з’явитися тут.

Ви можете скористатися інструментом генератора друкарських помилок або чимось подібним, а потім наполегливо ввести кожне в Google - що за іронією долі спробує виправити ваш правопис - тоді скористайтеся "пошуком замість {неправильно написаної версії}" і подивіться, скільки шукати результати, отримані для конкретної помилки:

Показ результатів для трактату

Шукайте замість tretise

Це дає приблизно 117 000 результатів для "tretise" проти 17 800 000 результатів для "трактату". Отже, тепер у вас є уявлення про те, як часто трапляється помилка в усьому Інтернеті! Тож ви можете надавати перевагу неправильним написанням, які частіше трапляються в реальному світі.

Мабуть, найголовніше, я також знайшов ці сторінки:

http://how-to-spell.net/treatise

Як написати трактат?

Правильно: трактат .

Поширені помилки: tretise - 100%

Що, мабуть , використовує фактичні дані!

Ми зібрали відсотки неправильних написань майже з 15,423,252 сеансів перевірки орфографії на веб-сайті spellchecker.net (січень 2010 - червень 2012).

Ідеально мені сподобається, якщо Google поділився б даними щодо неправильних написань, тому що я підозрюю, що у них є тонна більше даних .. але я не впевнений, чи бажають вони поділитися, можливо, вони розглядають автоматичну корекцію правопису помилково введених пошукових термінів як конкурентну перевагу.

Було б дивним, хоч як вони!


2
Не забувайте, що ви також можете запитати своїх користувачів!
Alex L

2
Google Triliion слово корпус , звичайно , включав як правильно і неправильно написане слово, так що ви можете використовувати його і багато слів і число хрускоту обчислити їх самостійно з вихідних даних Google робить акцію.
hippietrail

OpenDNS та Google Public DNS, безумовно, мають подібну інформацію, але не передають її, а замість цього використовують її для покращення власних служб (OpenDNS має функцію корекції друку). Ви можете запустити власну безкоштовну службу DNS та збирати дані, я думаю.
Крістіан Давен

1
Я не думаю, що використання результатів Google не є хорошою ідеєю (навіть якщо це непрактично). Як xkcd вказує на свою провину , "кількість результатів", яку дає Google під час пошуку, чітко сформована ".
rodrigoq

9

Цікава проблема. Ви можете скористатись інструментом пошуку ключових слів google на веб- сайті https://adwords.google.com/o/KeywordTool, щоб дізнатися, скільки пошукових запитів на місяць проводиться для кожного друку ваших доменних імен (вам доведеться генерувати список помилок друку інструмент, про який ви згадували вище). Не ідеально, але представляв би фактичні помилки користувачів та надав би вам пристойних даних для продовження роботи. (Я просто перевірив це і отримав деякі результати, які здалися розумними.)


На жаль, це вже не правда, тепер, коли у нас є колібрі. Інструмент добору ключових слів Google був deprecated. Його було замінено Планувальником ключових слів, продуктом Google AdSense.
Еллі Кессельман

4

Цікаве запитання: аналіз результатів пошуку, описаний тут, безумовно, повинен бути гарною вихідною позицією, але чутливий до помилкових позитивів, викликаних іншими веб-сайтами з іменами, схожими на ваші. Він може також пропустити поширені помилки, про які ви не думали, дивлячись на список, я б сказав, аналізуючи перемикання слів, також може бути цікаво.

Метод, який особливо добре виявляє, які помилки найчастіше роблять звичайні відвідувачі, - це попросити їх ввести ім’я. Звичайно, не всі веб-сайти підходять для цього, якщо припустити, що сторінка є інтерактивною, вона повинна приємно відповідати.

Замість того, щоб використовувати звичайні капчу, просто покажіть кілька логотипів вашого сайту з (частиною) ім'ям, написаним там, і попросіть людей ввести його, перш ніж вони зможуть зробити свою справу.

Дані не базуватимуться на такій кількості населення, як пошук Google, але це буде саме цільова група, і тому результати повинні бути досить потужними.


1

Ви можете спробувати цей помилок пошуку домену . Параметри пошуку наступні, окремо або в поєднанні:

  • QWERTY клавіатура ковзає
  • Листовий обмін
  • Клейкі клавіші для зайвих чи відсутніх літер
  • Вигляд схожий на букву lпроти цифри1

Існує три "точки огляду" для пошуку. Реєстрант за замовчуванням. DNS - це сортоване представлення, що показує сервер імен та IP-адресу кожного друку. TLD знаходить помилки в іменах у будь-якому з цих шести TLD: .com .net .org .biz .us .infoі якщо він зареєстрований.

Чи відрізняється він від інструмента ключових слів ОП? Можливо. Він стверджує, що "знаходить загальні помилки друку, пов'язані з доменними іменами". Це означає, що дані були зібрані від користувачів, коли вони вручну вводили доменні імена в навігаційну панель браузера .

  • Пошук "Клейкі ключі" включає загальні варіанти, з дефісами або без них. Такі друкарські помилки зумовлені фізично здутими, липкими клавішами, а не помилками у сприйнятті людини. Це вказує на використання чогось кращого, ніж на експертно-системному підході.
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.