Яке посилання на SQL Server слід використовувати для біблійної івриту? База даних, що розглядаються, повинна містити діакритику (тобто голосні звуки, наголоси, тропи тощо).
Яке посилання на SQL Server слід використовувати для біблійної івриту? База даних, що розглядаються, повинна містити діакритику (тобто голосні звуки, наголоси, тропи тощо).
Відповіді:
По-перше: між біблійною єврейською та сучасною єврейською різницею немає різниці. Ми просто маємо справу з івритом.
Друге: Незважаючи ні на що інше, ви хочете використовувати найновіший набір посилань, який є Зазвичай я настійно рекомендую використовувати найновішу версію будь-якого зіставлення, але, принаймні, в цьому одному випадку є вагомі підстави використовувати версію без номеру версії в імені. Зголовки версії 100 (або новіші) набагато повніші, і вони можуть відрізняти додаткові символи (або навіть повністю підтримувати їх, якщо використовуєте _100_
серією, оскільки вони мають новіші / повніші ваги сортування та лінгвістичні правила, ніж у старих серіях, у яких не вказано номер версії (технічно це версія 80
).SC
або 140
порівняння), але якщо припустити, що ви не маєте справу з додатковими символами, то версія 80 (немає версії порівняння з номером по імені) краще справляється з івритом (див. пункт "Шостий" нижче).
По-третє: Не існує поняття "Кана" (або типу Kana) на івриті, тому ви можете ігнорувати будь-які варіації зіставлення з _KS
їх назвами (оскільки це чутливість, яку ви ніколи не будете використовувати).
По-четверте: порівняння, що закінчуються _SC
допоміжними символами (тобто повним UTF-16), зазвичай, найкраще вибрати один із них, якщо вони доступні (мається на увазі, якщо ви використовуєте SQL Server 2012 або новішу версію).
По-п’яте: ви не хочете двійкового зіставлення ( _BIN
або _BIN2
), оскільки вони не можуть розрізняти івритські букви з голосними і контиляційними знаками, які однакові, але мають об'єднані символи в різних порядках, і вони не можуть ігнорувати голосні і інші позначення прирівнюйте такі речі, як א
і אֽ
.
Наприклад (голосний і контиляційний знак, що поєднує символи в протилежному порядку):
SELECT NCHAR(0x05D0) + NCHAR(0x059C) + NCHAR(0x05B8),
NCHAR(0x05D0) + NCHAR(0x05B8) + NCHAR(0x059C)
WHERE NCHAR(0x05D0) + NCHAR(0x059C) + NCHAR(0x05B8) =
NCHAR(0x05D0) + NCHAR(0x05B8) + NCHAR(0x059C) COLLATE Hebrew_100_CS_AS_SC;
-- אָ֜ אָ֜
SELECT NCHAR(0x05D0) + NCHAR(0x059C) + NCHAR(0x05B8),
NCHAR(0x05D0) + NCHAR(0x05B8) + NCHAR(0x059C)
WHERE NCHAR(0x05D0) + NCHAR(0x059C) + NCHAR(0x05B8) =
NCHAR(0x05D0) + NCHAR(0x05B8) + NCHAR(0x059C) COLLATE Hebrew_100_BIN2;
-- no rows
Шосте: Це залежить від того, як ви будете взаємодіяти зі значеннями рядків. На івриті немає великих і малих літер, проте є кілька кодових точок, на які впливає чутливість регістру. Існує навіть кілька точок коду, які залежать від ширини. Чутливий до акценту / нечутливий позначається на діакритиці, яка використовується для голосних, вимови та знаків кастиляції (тобто тропа).
Чи потрібно розрізняти остаточну та незакінчену форми однієї і тієї самої літери? На івриті є п'ять букв, які виглядають по-різному, коли використовуються як заключна літера слова. SQL Server обробляє це за допомогою чутливості до регістру / _CS
зіставлення (хоча, на жаль, воно, як видається, порушено в новій і, як правило, кращій версії 100 та новіших порівняннях):
SELECT NCHAR(0x05DE) AS [Mem],
NCHAR(0x05DD) AS [Final Mem]
WHERE NCHAR(0x05DE) = NCHAR(0x05DD) COLLATE Hebrew_CI_AS_KS_WS;
-- 1 row (expected; all sensitive except case)
-- Mem Final Mem
-- מ ם
SELECT NCHAR(0x05DE) AS [Mem],
NCHAR(0x05DD) AS [Final Mem]
WHERE NCHAR(0x05DE) = NCHAR(0x05DD) COLLATE Hebrew_CS_AI;
-- no rows (expected; all insensitive except case)
SELECT NCHAR(0x05DE) AS [Mem],
NCHAR(0x05DD) AS [Final Mem]
WHERE NCHAR(0x05DE) = NCHAR(0x05DD) COLLATE Hebrew_100_CI_AI;
-- no rows (expected 1 row; all insensitive)
Чи потрібно розрізняти вимови, голосні та контиляційні знаки? SQL Server обробляє це за допомогою акцентної чутливості / _AS
зіставлення (хоча, на жаль, воно, як видається, порушено в новій і, як правило, кращій версії 100 та новіших порівняннях). Зверніть увагу, що всі три згруповані разом під чутливістю до акценту і їх неможливо контролювати окремо (тобто ви не можете робити чутливі до голосних, але відзначати контиляцію нечутливими).
Вимовні позначки
Є кілька букв, які мають два різних звуки. Іноді єдиним показником, для якого звуку слід скористатись, є контекст того, в якому слові є літера (а іноді навіть у навколишніх словах), наприклад, у власне Торі (де немає вимов чи голосних звуків). Але той самий текст в інших формах, як і інший текст, матиме крапки або всередині літери, або за буквою Шин над буквою. Буква Шин може мати звук "ш" або "с". Для позначення звуку "sh" (тобто літери "shin"), крапка вгорі праворуч, а крапка вгорі з лівого боку позначає звук "s" (літера "sin"):
SELECT NCHAR(0x05E9) AS [Shin], -- ש
NCHAR(0x05E9) + NCHAR(0x05C1) AS [Shin + Shin Dot], -- שׁ
NCHAR(0x05E9) + NCHAR(0x05C2) AS [Shin + Sin Dot] -- שׂ
WHERE NCHAR(0x05E9) = NCHAR(0x05E9) + NCHAR(0x05C1) COLLATE Hebrew_CS_AI_KS_WS
AND NCHAR(0x05E9) = NCHAR(0x05E9) + NCHAR(0x05C2) COLLATE Hebrew_CS_AI_KS_WS;
-- 1 row (expected; all sensitive except accent)
SELECT NCHAR(0x05E9) AS [Shin], -- ש
NCHAR(0x05E9) + NCHAR(0x05C1) AS [Shin + Shin Dot], -- שׁ
NCHAR(0x05E9) + NCHAR(0x05C2) AS [Shin + Sin Dot] -- שׂ
WHERE NCHAR(0x05E9) = NCHAR(0x05E9) + NCHAR(0x05C1) COLLATE Hebrew_CI_AS
OR NCHAR(0x05E9) = NCHAR(0x05E9) + NCHAR(0x05C2) COLLATE Hebrew_CI_AS;
-- no rows (expected; all insensitive except accent)
SELECT NCHAR(0x05E9) AS [Shin], -- ש
NCHAR(0x05E9) + NCHAR(0x05C1) AS [Shin + Shin Dot], -- שׁ
NCHAR(0x05E9) + NCHAR(0x05C2) AS [Shin + Sin Dot] -- שׂ
WHERE NCHAR(0x05E9) = NCHAR(0x05E9) + NCHAR(0x05C1) COLLATE Hebrew_100_CI_AI_SC
OR NCHAR(0x05E9) = NCHAR(0x05E9) + NCHAR(0x05C2) COLLATE Hebrew_100_CI_AI_SC;
-- no rows (expected 1 row; all insensitive)
Голосні
SELECT NCHAR(0x05D0) AS [Aleph], -- א
NCHAR(0x05D0) + NCHAR(0x05B8) AS [Aleph with vowel] -- אָ
WHERE NCHAR(0x05D0) =
NCHAR(0x05D0) + NCHAR(0x05B8) COLLATE Hebrew_CS_AI_KS_WS;
-- 1 row (expected; all sensitive except accent)
SELECT NCHAR(0x05D0) AS [Aleph], -- א
NCHAR(0x05D0) + NCHAR(0x05B8) AS [Aleph with vowel] -- אָ
WHERE NCHAR(0x05D0) =
NCHAR(0x05D0) + NCHAR(0x05B8) COLLATE Hebrew_CI_AS;
-- no rows (expected; all insensitive except accent)
SELECT NCHAR(0x05D0) AS [Aleph], -- א
NCHAR(0x05D0) + NCHAR(0x05B8) AS [Aleph with vowel] -- אָ
WHERE NCHAR(0x05D0) =
NCHAR(0x05D0) + NCHAR(0x05B8) COLLATE Hebrew_100_CI_AI_SC;
-- no rows (expected 1 row; all insensitive)
Мітки контиляції
Технічно, згідно з офіційними даними Unicode, знаки кастиляції на івриті є ігноруючими і повинні реєструватися тут як різниця лише при використанні двійкового порівняння. Однак SQL Server трактує їх так само, як і наголоси (на жаль) і не може ігнорувати їх окремо від вимови або голосних звуків.
SELECT NCHAR(0x05D0) AS [Aleph], -- א
NCHAR(0x05D0) + NCHAR(0x05A8) AS [Aleph with cantillation mark] -- א֨
WHERE NCHAR(0x05D0) =
NCHAR(0x05D0) + NCHAR(0x05A8) COLLATE Hebrew_CS_AI_KS_WS;
-- 1 row (expected; all sensitive except accent)
SELECT NCHAR(0x05D0) AS [Aleph], -- א
NCHAR(0x05D0) + NCHAR(0x05A8) AS [Aleph with cantillation mark] -- א֨
WHERE NCHAR(0x05D0) =
NCHAR(0x05D0) + NCHAR(0x05A8) COLLATE Hebrew_CI_AS;
-- no rows (expected; all insensitive except accent)
SELECT NCHAR(0x05D0) AS [Aleph], -- א
NCHAR(0x05D0) + NCHAR(0x05A8) AS [Aleph with cantillation mark] -- א֨
WHERE NCHAR(0x05D0) =
NCHAR(0x05D0) + NCHAR(0x05A8) COLLATE Hebrew_100_CI_AI_SC;
-- no rows (expected 1 row; all insensitive)
Чи потрібно розрізняти широкі та неширокі форми однієї і тієї ж букви? Єврейською мовою є вісім літер, які розтягнуті (широкі), але лише з метою використання сувоїв Тори (рукописних / реальних або друкованих) для збереження цілком виправданого стовпчастого формату (який насправді відображається в сувій Торі ). SQL Server обробляє це через ширину чутливості / _WS
зіставлення (що цікаво, що, здається, це єдина чутливість, яка працює правильно в новій версії 100 та новіших зіставленнях, хоча, на жаль, це найменша ймовірність використовувати):
SELECT NCHAR(0x05DC) AS [Lamed],
NCHAR(0xFB25) AS [Wide Lamed]
WHERE NCHAR(0x05DC) = NCHAR(0xFB25) COLLATE Hebrew_CI_AI;
-- no rows (expected 1 row; all insensitive)
SELECT NCHAR(0x05DC) AS [Lamed],
NCHAR(0xFB25) AS [Wide Lamed]
WHERE NCHAR(0x05DC) = NCHAR(0xFB25) COLLATE Hebrew_100_CS_AS_KS_SC;
-- 1 row (expected; all sensitive except width)
-- Lamed Wide Lamed
-- ל ﬥ
SELECT NCHAR(0x05DC) AS [Lamed],
NCHAR(0xFB25) AS [Wide Lamed]
WHERE NCHAR(0x05DC) = NCHAR(0xFB25) COLLATE Hebrew_100_CI_AI_WS_SC;
-- no rows (expected; all insensitive except width)
Так, може бути , Hebrew_CI_AI
для стовпців, і ви можете перепризначити на слові / предикат через COLLATE
заяву , якщо вам потрібно використовувати варіації, наприклад, COLLATE Hebrew_CS_AI
або , Hebrew_CI_AS
або Hebrew_CS_AS
.
додаткові нотатки
Дані вам потрібно буде зберігати в NVARCHAR
стовпцях / змінних. Більшу частину цього ви можете досягти заVARCHAR
допомогою 8-бітової сторінки за допомогою кодової сторінки Windows-1255 (для цього використовуються всі Hebrew_*
зіставлення), включаючи комбінування символів для голосних та точок вимови:
;WITH Hebrew AS
(
SELECT NCHAR(0x05E9) + NCHAR(0x05C1) + NCHAR(0x05B8)
COLLATE Hebrew_100_CS_AS AS [Shin]
)
SELECT
Hebrew.[Shin] AS [Unicode],
CONVERT(VARCHAR(20), Hebrew.[Shin]) AS [CodePage1255],
CONVERT(VARBINARY(10), CONVERT(VARCHAR(20), Hebrew.[Shin])) AS [CodePage1255_bytes]
FROM Hebrew;
-- Unicode CodePage1255 CodePage1255_bytes
-- שָׁ שָׁ F9D1C8
Однак тільки блок івриту Unicode містить знаки контиляції (тобто trope; кодові точки U + 0591 до U + 05AF) плюс кілька додаткових (кодові пункти U + 05C4 до U + 05C7), а блок Алфавітна форма презентації містить широкий варіант декількох букв плюс деякі інші речі.
Згідно з офіційними правилами Unicode CLDR (пошиття, специфічні для місцевості) для єврейської культури ("він" та "він-IL"), U + 05F3 ПУНКТУАЦІЯ HEBREW GERESH повинна відповідати або прийти раніше , U + 0027 APOSTROPHE. Зазвичай U + 05F3 сортує після апострофа. Така поведінка дійсно спостерігається при використанні демонстрації порівняння ICU та перемиканні між "кореневим" / стандартним порядком сортування (використовується англійською мовою США / "en-US") та "він". Однак, схоже, така поведінка не доступна ні в .NET, ні в SQL сервері:
SELECT NCHAR(0x05F3)
WHERE NCHAR(0x05F3) <= N'''' COLLATE Hebrew_100_CS_AS_KS_WS;
-- no rows
SELECT NCHAR(0x05F3)
WHERE NCHAR(0x05F3) <= N'''' COLLATE Hebrew_CS_AS_KS_WS;
-- no rows
Хоча прикро упущення, це має сенс, враховуючи те, що я не бачу спеціальних "він" чи "he-IL" -одиноких пошив у файлах таблиці сортування ваги Windows. Це може означати, що немає фактичної різниці між Hebrew_*
і Latin1_General_*
зіставленнями поза пов’язаною кодовою сторінкою, яка використовується лише для VARCHAR
даних, і яка тут не застосовується.
ОП відповів:
Так, мені потрібно розрізнити: 1) остаточну та незакінчену форми тієї самої літери 2) вимови 3) голосні і 4) контиляційні знаки.
У цьому випадку, оскільки вам не потрібно ігнорувати відмінності між цими властивостями, ви можете використовувати порівняння на 100 рівнів. Наведений нижче приклад показує івритську літеру (Sin) із вимовою, вимовою контиляції та голосною. Існує шість версій, щоб кожна можлива комбінація упорядкування символів, що поєднуються, могла бути представлена. Існує сьомий запис, який використовує іншу крапку для створення букви Shin з такою ж базовою літерою, голосною і контиляційною позначкою. Запит показує, що лише шість записів "Sin" відповідають один одному (навіть з різними порядками байтів), але не "Shin".
Я включив використання Latin1_General
та Japanese_XJIS_140
порівняння, щоб показати, що правила також працюють з тими, якщо вам потрібно скористатися ними ( 140
порівняння, лише на японській мові, мають більше відображень у верхньому та нижньому регістрі, ніж у старих версіях). Але в цілому, мабуть, найкраще дотримуватись єврейських посилань і використовувати неверсію, 100
якщо вам потрібно ігнорувати відмінності в голосних, позначках, крапках та фінальних формах проти неповноцінних форм.
DECLARE @Shin NVARCHAR(5) = NCHAR(0x05E9), -- base Hebrew letter
@Dot NVARCHAR(5) = NCHAR(0x05C2), -- Sin Dot
@Mark NVARCHAR(5) = NCHAR(0x05A8), -- Cantillation Mark (i.e. trope)
@Vowel NVARCHAR(5) = NCHAR(0x05B8); -- Vowel
DECLARE @Dot_Mark_Vowel NVARCHAR(20) = @Shin + @Dot + @Mark + @Vowel,
@Dot_Vowel_Mark NVARCHAR(20) = @Shin + @Dot + @Vowel + @Mark,
@Vowel_Dot_Mark NVARCHAR(20) = @Shin + @Vowel + @Dot + @Mark,
@Vowel_Mark_Dot NVARCHAR(20) = @Shin + @Vowel + @Mark + @Dot,
@Mark_Vowel_Dot NVARCHAR(20) = @Shin + @Mark + @Vowel + @Dot,
@Mark_Dot_Vowel NVARCHAR(20) = @Shin + @Mark + @Dot + @Vowel,
@ShinDot_Mark_Vowel NVARCHAR(20) = @Shin + NCHAR(0x05C1) + @Mark + @Vowel;
SELECT @Dot_Mark_Vowel AS [Sin], @ShinDot_Mark_Vowel AS [Shin];
;WITH chr AS
(
SELECT *
FROM (VALUES
(@Dot_Mark_Vowel, 'Dot + Mark + Vowel'),
(@Dot_Vowel_Mark, 'Dot + Vowel + Mark'),
(@Vowel_Dot_Mark, 'Vowel + Dot + Mark'),
(@Vowel_Mark_Dot, 'Vowel + Mark + Dot'),
(@Mark_Vowel_Dot, 'Mark + Vowel + Dot'),
(@Mark_Dot_Vowel, 'Mark + Dot + Vowel'),
(@ShinDot_Mark_Vowel, 'ShinDot + Mark + Vowel')
) tmp([Hebrew], [Description])
) SELECT chr1.[Hebrew],
'--' AS [---],
chr1.[Description] AS [Description_1],
CONVERT(VARBINARY(20), RIGHT(chr1.[Hebrew], 3)) AS [Bytes_1],
'--' AS [---],
chr2.[Description] AS [Description_2],
CONVERT(VARBINARY(20), RIGHT(chr2.[Hebrew], 3)) AS [Bytes_2]
FROM chr chr1
CROSS JOIN chr chr2
WHERE chr1.[Description] <> chr2.[Description] -- do not compare item to itself
AND chr1.[Hebrew] = chr2.[Hebrew] COLLATE Hebrew_100_CS_AS_SC
AND chr1.[Hebrew] = chr2.[Hebrew] COLLATE Latin1_General_100_CS_AS_SC
AND chr1.[Hebrew] = chr2.[Hebrew] COLLATE Japanese_XJIS_140_CS_AS;
-- this query returns 30 rows
Це залежить від багатьох речей. Збір - це сортування, порівняння та не-кодова сторінка коду.
Це репо має хороший перелік варіантів івриту.
+---------------------------+---------------------------------------------------------------------------------------------------------------------+
| Hebrew_BIN | Hebrew, binary sort |
| Hebrew_BIN2 | Hebrew, binary code point comparison sort |
| Hebrew_CI_AI | Hebrew, case-insensitive, accent-insensitive, kanatype-insensitive, width-insensitive |
| Hebrew_CI_AI_WS | Hebrew, case-insensitive, accent-insensitive, kanatype-insensitive, width-sensitive |
| Hebrew_CI_AI_KS | Hebrew, case-insensitive, accent-insensitive, kanatype-sensitive, width-insensitive |
| Hebrew_CI_AI_KS_WS | Hebrew, case-insensitive, accent-insensitive, kanatype-sensitive, width-sensitive |
| Hebrew_CI_AS | Hebrew, case-insensitive, accent-sensitive, kanatype-insensitive, width-insensitive |
| Hebrew_CI_AS_WS | Hebrew, case-insensitive, accent-sensitive, kanatype-insensitive, width-sensitive |
| Hebrew_CI_AS_KS | Hebrew, case-insensitive, accent-sensitive, kanatype-sensitive, width-insensitive |
| Hebrew_CI_AS_KS_WS | Hebrew, case-insensitive, accent-sensitive, kanatype-sensitive, width-sensitive |
| Hebrew_CS_AI | Hebrew, case-sensitive, accent-insensitive, kanatype-insensitive, width-insensitive |
| Hebrew_CS_AI_WS | Hebrew, case-sensitive, accent-insensitive, kanatype-insensitive, width-sensitive |
| Hebrew_CS_AI_KS | Hebrew, case-sensitive, accent-insensitive, kanatype-sensitive, width-insensitive |
| Hebrew_CS_AI_KS_WS | Hebrew, case-sensitive, accent-insensitive, kanatype-sensitive, width-sensitive |
| Hebrew_CS_AS | Hebrew, case-sensitive, accent-sensitive, kanatype-insensitive, width-insensitive |
| Hebrew_CS_AS_WS | Hebrew, case-sensitive, accent-sensitive, kanatype-insensitive, width-sensitive |
| Hebrew_CS_AS_KS | Hebrew, case-sensitive, accent-sensitive, kanatype-sensitive, width-insensitive |
| Hebrew_CS_AS_KS_WS | Hebrew, case-sensitive, accent-sensitive, kanatype-sensitive, width-sensitive |
| Hebrew_100_BIN | Hebrew-100, binary sort |
| Hebrew_100_BIN2 | Hebrew-100, binary code point comparison sort |
| Hebrew_100_CI_AI | Hebrew-100, case-insensitive, accent-insensitive, kanatype-insensitive, width-insensitive |
| Hebrew_100_CI_AI_WS | Hebrew-100, case-insensitive, accent-insensitive, kanatype-insensitive, width-sensitive |
| Hebrew_100_CI_AI_KS | Hebrew-100, case-insensitive, accent-insensitive, kanatype-sensitive, width-insensitive |
| Hebrew_100_CI_AI_KS_WS | Hebrew-100, case-insensitive, accent-insensitive, kanatype-sensitive, width-sensitive |
| Hebrew_100_CI_AS | Hebrew-100, case-insensitive, accent-sensitive, kanatype-insensitive, width-insensitive |
| Hebrew_100_CI_AS_WS | Hebrew-100, case-insensitive, accent-sensitive, kanatype-insensitive, width-sensitive |
| Hebrew_100_CI_AS_KS | Hebrew-100, case-insensitive, accent-sensitive, kanatype-sensitive, width-insensitive |
| Hebrew_100_CI_AS_KS_WS | Hebrew-100, case-insensitive, accent-sensitive, kanatype-sensitive, width-sensitive |
| Hebrew_100_CS_AI | Hebrew-100, case-sensitive, accent-insensitive, kanatype-insensitive, width-insensitive |
| Hebrew_100_CS_AI_WS | Hebrew-100, case-sensitive, accent-insensitive, kanatype-insensitive, width-sensitive |
| Hebrew_100_CS_AI_KS | Hebrew-100, case-sensitive, accent-insensitive, kanatype-sensitive, width-insensitive |
| Hebrew_100_CS_AI_KS_WS | Hebrew-100, case-sensitive, accent-insensitive, kanatype-sensitive, width-sensitive |
| Hebrew_100_CS_AS | Hebrew-100, case-sensitive, accent-sensitive, kanatype-insensitive, width-insensitive |
| Hebrew_100_CS_AS_WS | Hebrew-100, case-sensitive, accent-sensitive, kanatype-insensitive, width-sensitive |
| Hebrew_100_CS_AS_KS | Hebrew-100, case-sensitive, accent-sensitive, kanatype-sensitive, width-insensitive |
| Hebrew_100_CS_AS_KS_WS | Hebrew-100, case-sensitive, accent-sensitive, kanatype-sensitive, width-sensitive |
| Hebrew_100_CI_AI_SC | Hebrew-100, case-insensitive, accent-insensitive, kanatype-insensitive, width-insensitive, supplementary characters |
| Hebrew_100_CI_AI_WS_SC | Hebrew-100, case-insensitive, accent-insensitive, kanatype-insensitive, width-sensitive, supplementary characters |
| Hebrew_100_CI_AI_KS_SC | Hebrew-100, case-insensitive, accent-insensitive, kanatype-sensitive, width-insensitive, supplementary characters |
| Hebrew_100_CI_AI_KS_WS_SC | Hebrew-100, case-insensitive, accent-insensitive, kanatype-sensitive, width-sensitive, supplementary characters |
| Hebrew_100_CI_AS_SC | Hebrew-100, case-insensitive, accent-sensitive, kanatype-insensitive, width-insensitive, supplementary characters |
| Hebrew_100_CI_AS_WS_SC | Hebrew-100, case-insensitive, accent-sensitive, kanatype-insensitive, width-sensitive, supplementary characters |
| Hebrew_100_CI_AS_KS_SC | Hebrew-100, case-insensitive, accent-sensitive, kanatype-sensitive, width-insensitive, supplementary characters |
| Hebrew_100_CI_AS_KS_WS_SC | Hebrew-100, case-insensitive, accent-sensitive, kanatype-sensitive, width-sensitive, supplementary characters |
| Hebrew_100_CS_AI_SC | Hebrew-100, case-sensitive, accent-insensitive, kanatype-insensitive, width-insensitive, supplementary characters |
| Hebrew_100_CS_AI_WS_SC | Hebrew-100, case-sensitive, accent-insensitive, kanatype-insensitive, width-sensitive, supplementary characters |
| Hebrew_100_CS_AI_KS_SC | Hebrew-100, case-sensitive, accent-insensitive, kanatype-sensitive, width-insensitive, supplementary characters |
| Hebrew_100_CS_AI_KS_WS_SC | Hebrew-100, case-sensitive, accent-insensitive, kanatype-sensitive, width-sensitive, supplementary characters |
| Hebrew_100_CS_AS_SC | Hebrew-100, case-sensitive, accent-sensitive, kanatype-insensitive, width-insensitive, supplementary characters |
| Hebrew_100_CS_AS_WS_SC | Hebrew-100, case-sensitive, accent-sensitive, kanatype-insensitive, width-sensitive, supplementary characters |
| Hebrew_100_CS_AS_KS_SC | Hebrew-100, case-sensitive, accent-sensitive, kanatype-sensitive, width-insensitive, supplementary characters |
| Hebrew_100_CS_AS_KS_WS_SC | Hebrew-100, case-sensitive, accent-sensitive, kanatype-sensitive, width-sensitive, supplementary characters |
+---------------------------+---------------------------------------------------------------------------------------------------------------------+