Що це за символ Unicode в моєму буфері обміну?


53

Чи є швидкий і простий спосіб знайти точку коду Unicode для будь-якого символу? Наприклад, я бачу смішного персонажа на веб-сторінці, PDF-файлі чи іншому документі.

Те, що я зараз роблю, - скопіювати персонаж у буфер обміну, зберегти його у файл та переглянути файл із шестигранним переглядачем. Крім того, я можу відкрити Microsoft Word, вставити та зробити Alt + X. Обидва ці методи трохи громіздкі. Чи є простіший спосіб?

Я використовую Notepad ++, тому, якщо є якийсь спосіб зробити це з Notepad ++, це було б підходящою відповіддю (це менш громіздко, ніж відкривати Word). А може, є спосіб це зробити за допомогою невеликої спеціалізованої програми?


5
ltg.ed.ac.uk/~richard/utf-8.html Гарний інструмент, вартий закладки!
tkausl

Як можна прийняти прийняту відповідь? Він взагалі не згадує Unicode і не працює добре для Unicode. Як саме це вирішило ваше запитання? Спробуйте 😍 і переконаєтесь, що це не працюватиме. Він навіть не відображає персонажа.
Томас Веллер

@ThomasWeller ви добре зазначаєте, і я змінив свою прийняту відповідь. Здається, що Notepad ++ може впоратися лише з 16-бітовими символами і не розуміє кодові точки, що перевищують 0xFFFF, який є вашим прикладом.
DodgyCodeException

@ user202729 Це не 2 роки. Там написано "запитували 15 грудня", що означає "15 грудня цього року", а не "грудень 2015 року". Тож усього 3 дні. Я не розумію, чому на це питання все частіше звертаються. Мене цікавило лише просте запитання про щось просте.
DodgyCodeException

1
Онлайн інструмент Який символ Unicode це , babelstone.co.uk/Unicode/whatisit.html
DrMoishe Pippik

Відповіді:


32

Я багато працюю з символами Unicode, тому я написав невелику програму Windows спеціально для цього:

Інформер символів Unicode ( документація )

Крім того, мій текстовий редактор, Rejbrand Text Editor , має широку підтримку символів Unicode.


1
Дякую! Це досить корисно. Я можу запропонувати F1 бути функцією довідки, яка відображатиме невелике вікно, що містить посилання на веб-сторінку вашої документації.
DodgyCodeException

6
З цікавості, на якій роботі ви працюєте?
Окер

У bash я використовую uniprops, який, здається, видає подібну інформацію.
TRiG

FYI, я завантажив ваш інформатор символів Unicode, і моє вірусне програмне забезпечення дуже його побоювалося. Не дозволяв би мені використовувати його, якщо я не додав його до білого списку, тому я не збираюся його використовувати. У вас є вірус-копія? ха-ха, я знаю, що він, мабуть, насправді не має вірусу, але все-таки, чому мій АВ його так ненавидить? До речі, це захист від кінцевих точок Symantec.
rory.ap

@ rory.ap: Я гарантую, що він повністю без вірусів. На жаль, помилково-позитивні проблеми є поширеними (можливо, особливо для додатків, написаних у Delphi). Це те, що я дуже усвідомлюю, і те, що насправді мене сумує. Сьогодні важко бути розробником програмного забезпечення Win32 у вільний час. Я просто хочу, щоб люди перестали робити зловмисне програмне забезпечення, щоб серйозні розробники хобі не впливали на помилкові позитивні результати. Можливо, підписання коду покращить ситуацію, але це не безкоштовно, і все програмне забезпечення, яке я випускаю, я віддаю безкоштовно. :(
Андреас Рейбранд

34

Notepad ++ має попередньо встановлений плагін під назвою Converter, який має можливість перетворити ASCII в HEX і навпаки. Цей інструмент є досить корисним для перетворення файлів даних у форматі HEX, які слід перетворити на ASCII для читання:

введіть тут опис зображення

Ось як це працює:

введіть тут опис зображення


2
Дякую! До речі, яке програмне забезпечення ви використовуєте для створення такого анімованого gif?
DodgyCodeException

44
Ха-ха! Я щойно помітив слово "восьмидесятичний" у цьому діалоговому вікні. Це означає базу 18. Розробник означає, звичайно, восьмерику (основа 8).
DodgyCodeException

5
@DodgyCodeException Я здогадуюсь LICEcap
user11153

3
@DodgyCodeException screentogif.com приємний для запису анімаційних gif- файлів .
Девід

5
Коли я вставляю 😍 туди, він пише D83D. Так що це лише половина третіх і НЕ працює добре з символами Unicode.
Томас Веллер

17

Коли я стикаюся з цією проблемою, швидкий пошук в Google зазвичай дає швидку відповідь. Наприклад, коли я google "😍 unicode", я отримую такий результат: Пошук Google за смайлами "усміхнене обличчя із очима у формі серця"

Мені цей метод подобається тому, що:

  • Він працює на будь-якому комп’ютері з Інтернетом
  • Вам нічого не потрібно встановлювати
  • Необхідні натискання клавіш ( Ctrl+ C& Ctrl+ T& Ctrl+ V& Enter) - це дії м'язової пам’яті для мене, і, мабуть, для більшості інших розробників / машинописів.

9

Є приємний маленький веб-сайт під назвою Unicode Character Inspector (побудований Тімом Вітлоком), який робить саме це. Мені здається, це зручніше, ніж текстовий редактор або настільна програма.


3
Щоб зробити це ще швидше, ви можете налаштувати ярлик пошукової системи у своєму браузері, щоб він перейшов вас безпосередньо на сторінку інформації про введений символ. Це працює, тому що ви можете вказати символ як параметр запиту типу https://apps.timwhitlock.info/unicode/inspect?s={some unicode character here}.
Ерік Сіндранд

9

У Unix-подібній системі *:

unicode -s "$(xsel -ob)"

Ви можете його псевдонімом або створити сценарій для його запуску.

Вихід виглядає приблизно так:

U+2672 UNIVERSAL RECYCLING SYMBOL
UTF-8: e2 99 b2 UTF-16BE: 2672 Decimal: ♲ Octal: \023162
♲ (♲)
Uppercase: 2672
Category: So (Symbol, Other)
Bidi: ON (Other Neutrals)

* Схоже, в оригінальному плакаті, ймовірно, використовується Windows, але (а) це не вказано, і (б) це рішення може допомогти іншим.


Дякую! Хоча я в основному використовую Windows, я також користуюся Linux, і в будь-якому випадку я можу завантажити порт Windows цієї утиліти (наприклад, GnuWin).
DodgyCodeException

6

Ви можете використовувати PowerShell!

[char]::ConvertToUtf32((gcb), 0)

Це друкує першу кодову точку Unicode тексту у буфері обміну.

Якщо вам не доведеться турбуватися про персонажів, що знаходяться поза базовою багатомовною площиною (це було б представлено у рядках .NET як високий і низький сурогат), ви можете використовувати це замість цього:

[int](gcb)[0]

Якщо ви віддаєте перевагу в шістнадцятковій формі , ви можете використовувати специфікатор формату :

'0x{0:x}' -f [char]::ConvertToUtf32((gcb), 0)

5

Примітка для будь-яких користувачів Emacs: ви можете набрати, C-u C-x =і вона дасть вам купу інформації про персонаж під курсором, включаючи точку коду Unicode, ім'я в базі даних Unicode та категорії тощо.

             position: 146 of 147 (99%), column: 0
            character: ♲ (displayed as ♲) (codepoint 9842, #o23162, #x2672)
    preferred charset: unicode (Unicode (ISO10646))
code point in charset: 0x2672
               script: symbol
               syntax: w    which means: word
             category: .:Base
             to input: type "C-x 8 RET 2672" or "C-x 8 RET UNIVERSAL RECYCLING SYMBOL"
          buffer code: #xE2 #x99 #xB2
            file code: #xE2 #x99 #xB2 (encoded by coding system utf-8-unix)
              display: by this font (glyph code)
    xft:-PfEd-Mensch-normal-normal-normal-*-16-*-*-*-m-0-iso10646-1 (#x985)

Character code properties: customize what to show
  name: UNIVERSAL RECYCLING SYMBOL
  general-category: So (Symbol, Other)
  decomposition: (9842) ('♲')


2

Я використовую http://unicode.scarfboy.com , який простий і добре працює.


2
Будь ласка, додайте короткий опис того, що робить сайт, чи є якийсь конкретний спосіб його використання та як конкретно вирішує питання щодо ОП. Відповіді на один рядок зазвичай недостатньо, щоб справді відповісти на запитання.
computercarguy

2

Я вважаю перетворювач коду Unicode Рішарда Ішиди (посилання github) дуже корисним для пошуку, між іншим, кодів символів Unicode. Він також забезпечує переклади / перетворення в інші кодові точки, кодування та, наприклад, утечу-послідовності.

Перетворювач Unicode

Ви також можете перевірити головну веб-сторінку Річарда Ісіди (rishida.net) , оскільки вона містить (посилання на) багато цінних інструментів та інформації, особливо якщо ви зацікавлені в інтернаціоналізації та кодуванні символів. Наприклад, ще одним дуже корисним інструментом, пов’язаним там, є його інструмент Uniview (посилання github) .

Uniview

І нарешті, також дуже корисним, хоча я в основному стосується користувачів Mac, є переглядач символів macOS , доступний через меню вводу , яке можна ввімкнути в системних налаштуванняхклавіатура

Хоча веб-сайт підтримки Apple в основному зосереджений на тому, як вставити смайли (...), програма перегляду символів насправді дуже корисна для пошуку конкретних ("спеціальних") символів та їх кодових точок у кількох різних кодуваннях, а також для пошуку яких шрифти на вашому systen містять специфічні гліфи.

Переглядач персонажів

Ура!


Переглядач персонажів, як зображено на цій фотографії, я вважаю, щонайменше, однією з основних версій (ОС) старої; Висока Сьєрра дає набагато менш зручне "Показати емоції та символи".
Антон Шервуд

@AntonSherwood нічого не змінилося, що я можу сказати. Ви можете визначити у вікні Emoji та Symbols "Налаштувати список", які таблиці відображати. Я вважаю, що Unicode не видно за замовчуванням.
user0721090601

Я можу підтвердити, що Сьєрра має повну панель "Персонажі" - Висока Сьєрра ні?
SilverWolf - Відновіть Моніку

Що ж, ми щодня дізнаємось щось. Дякую @guifa. Я зробив це на свій смак - але не можу відтворити показаний екран.
Антон Шервуд



0

Я хочу зазначити http://amp-what.com/, оскільки це дуже просто у використанні зі своїм швидким полем пошуку та підтримує різні позначення (& код, кодові точки Unicode , послідовність символів кодування URI).

Приклад зображення


0

Ось ще одна відповідь, використовуючи ідею користувача202729:

Закладка URL-адреси javascript:alert(prompt().codePointAt(0).toString(16))та використання браузера для запуску. (Працює в Chrome і Firefox. Схоже, він не працює на IE, але це може бути пов’язано з налаштуваннями безпеки.)

На відміну від інших відповідей, підключення до Інтернету не потрібно, жодна зовнішня утиліта для завантаження, не залежна від ОС.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.