Піньїнові комбінації


13

Створіть функцію, яка бере аргумент рядка піньїного складу і повертає істинну комбінацію існує, інакше помилково.

Використовуйте "v" для "ü".

Ось повний список комбінацій. http://www.pinyin.info/rules/initials_finals.html

Приклади

f("bu") == true
f("zheng") == true
f("nv") == true
f("ri") == true
f("cei") == false
f("ia") == false
f("kian") == false
f("qa") == false

Будь ласка, не робіть таких речей, як зішкріб веб-сторінок чи читання файлів методів введення, щоб зменшити кількість символів. (Якщо ви це зробите, довжина даних буде зарахована до кількості символів) Однією з цілей цього коду гольфу є бачити, як можна спростити правила. Найкоротший код виграє.


Що про щось подібне nar? : P
JiminP

1
Як зауваження, незважаючи на те, що говорять у прикладах, я не вірю, що nviце колись дійсна комбінація.
rintaun

Якщо на пов’язаній сторінці вже сказано, що "  er з цієї таблиці опущено", чи не слід також її включати? (Зрештою, це було число, якщо я правильно пам’ятаю ;-))
Joey

Відповіді:


4

JavaScript 1.6, 503 496 477 символів

function g(s){return/^([bfmpw]?o|[yjqx]ua?n|[ln]ve?|ei?|y[aio]ng|w?[ae]ng?|w?ai?|wei|y?ao|y?ou|y[ai]n?|yu?e|[^aeiou]+u)$/.test(s)|(((k=6*("ccsszzdflmnprtbghkjqx".indexOf(s[0])+(f=s[1]=='h')))|(r="a.e.ai.ei.ao.ou.an.ang.en.eng.ong.ua.uo.uai.ui.uan.uang.un.i.ia.ie.iao.iu.ian.iang.in.ing.iong.u.ue".split('.').indexOf(s.slice(f+1))))<0?0:k>84?r>17^k<108:parseInt("009m2f00b8jb009m2f00b7r3009m2n00b8jj1dwcfz0000rtfjba4f1xgbnjfj01rz1uyfb1009nn61b37cv1uyfa5".slice(k,k+6),36)>>r&1)}

Зрозуміло трохи легше (якщо заборонити помилки при розбитті коду на кілька рядків):

function _g(s)
{
  f = s[1] == 'h'
  k = "ccsszzdfghjklmnpqrtxb".indexOf(s[0]) * 6
  k += 6 * f
  return /^(weng|[bfmp]?o|[yjqx]ua?n|[ln]ve?|[ae]i?|y[aeiu]|y[aio]ng|[ae]ng?|wang?|wai?|we[in]|w[ou]|y?ao|y?ou?|y[ai]n|yue)$/.test(s) | 
         !!(k >= 0 && (1 << "a.e.ai.ei.ao.ou.an.ang.en.eng.ong.u.ua.uo.uai.ui.uan.uang.un.i.ia.ie.iao.iu.ian.iang.in.ing.iong.u.ue".split('.').indexOf(s.slice(f + 1)) & parseInt("00j85300mh2v00j85300mgan00j85b00mh332rsovz0002cp00b8jj00b8jjqmlts000b8jjv2mkfz3uwo3jv203jz3pwvelqmlts000jbaq2m6ewvqmlts03pwvdp".slice(k, k + 6), 36)))
}

Нульові початкові випадки плюс кілька разових випробувань перевіряються регулярним виразом. Після цього таблицю кодують у вигляді (з'єднаної) серії 6-значних цифр базової 36, по одному на початковий звук. Потім при пошуку використовується пара indexOfвикликів і зсув, щоб вибрати потрібний біт.

Тестовано на всіх клітинах таблиці комбінацій (заповнені клітини перевірені на справжні, порожні клітини перевірені на помилкові).

Редагувати: Замінено деякі з 36 знаків пошуку базової 36 на порівняння, оскільки g–, k–, h–, j–, q– і z– мають щільні блоки істини / помилки.

Редагувати: Перестановив бітовий тест, щоб уникнути зайвого !!та ще більше ущільнити регулярний вираз.


Для чого вам потрібен !!? Я не впевнений, що розумію, навіщо вам колись потрібен подвійний не ...
Пітер Олсон,

При ньому віддача дорівнює 0 або 1; без цього "true" повертається як ненульовий, але не обов'язково 1. Мій тестовий сценарій перевіряється, з if (g(s) == (validList.indexOf(s) >= 0)яким повертається false 16 == true; Я обговорював це з точки зору "що означає" справжнє "насправді" і залишив річ. У будь-якому випадку я маю заплановані зміни на сьогоднішній день, які позбавлять себе !!заміни 1<<r&*parseIntна (більш-менш), (parseInt>>r)&1щоб повернення - це 1, і я голю два коси.
DocMax

1

PHP, 548 символів

Зрозуміло, це, мабуть, не оптимально, але я написав регулярний вираз, щоб відповідати дійсним комбінаціям піньїна. Скорочення символів шляхом заміни повторних підрядів змінними.

Код

<?php $a='?|e(i|ng?)';$b='|o(u|ng)|u';$c='|a?n)?|i(a[on]';$d='(a(ng?|o|i)';$e='|ng?)';$f='(i|ng)?';echo(preg_match("/^([bpm](a(i|o$e$a|u|o|i(e|a[on]$e?)|[pm]ou|m(e|iu)|f(a(ng?)?|ou$a|u)|d$d$a?$b(o|i$c?|e|u)?)|[dtnl]$d?|e$f$b(o$c|e)?)|[jqxy](i(a(o$e?|e|u|o?ng|n)|u(e|a?n))|([zcs]h?|r)i|[nl](ve?|i(n|ang?|u))|[dl]ia|[dt](ing|ui)|[dn]en|diu|([gkh]|[zcs]h?)(e(ng?)|a(o|ng?|i)?|ou|u(o|i|a?n)?)|r(e(ng?)?|a(o$e$b(a?n?|o|i)?)|[gkh](ei|ong|u(a$f))|[zcs]hua$f|([zcs]|[zc]h)ong|(z|[zs]h)ei|a(i|o$e?|ou$a?|w(u|a(i$e?|o|e(i$e))$/",$argv[1]))?"true":"false";

Використання

> php pinyin.php bu
> true
> php pinyin.php cei
> false

1

F #, 681 символ

type l=Y|J|Q|X|W|F|B|P|M|N|L|T|D|Z|K|H|Zh|G|Sh|Ch|C|S|R|Iong|Vn|Van|Ia|Iu|In|Iang|Ve|V|Ian|Iao|Ie|Ing|I|Ei|A|Ai|An|Ang|Eng|U|Ao|E|Ou|Uo|Uan|Un|Ui|En|Ong|Ua|Uang|Uai|Ueng|O
let v x=x.GetHashCode()
let n x=J.GetType().GetNestedType("Tags").GetFields().GetValue(v x).ToString().Substring(6).ToLower();
let(^)a b=List.collect(fun x->List.map(fun z-> n x+ n z)b)a
let(-)a b=[v a..v b]
let(&)a b=a@b
let(!)a=[v a]
[<EntryPoint>]
let main a=
 printf"%b"(List.exists(fun x->x=a.[0])(Y-X^Iong-I& !W^Ei-Ui@Ua-O& !F^Ei-A@An-U@ !Ou&(F-N@D-Sh)^ !En&F-M^ !O&B-M^ !In&N-L^Iu-Un& !D^Ia-Iu&B-D^Ian-Ao& !M^E-Ou&Ch-S^A-Ong&T-Sh^Ei-Ui&N-G^ !Ong&K-Ch^Ua-Uai& !R^An-Ua&(Sh-R@ !Z@ !Zh)^ !I&["lia";"pou";"mui"]))
 0

Не виходить складів без правильних початкових приголосних (Y, W тощо).


1

APL (Dyalog Extended) , 475 байт

s←⊢⊆⍨' '≠⊢
a b c2097144 131064 1957895
f←{(⊂⍵)∊(12v),(s'yi ya ye yao you yan yang yin ying yong yu yue yuan yun wu wa wo wai wei wan wang wen weng nv lv nve lve'),(,⊤(a-8)1966080 393208 1966064 2096720 1966072 1048568a a 2056184a 131048a 7288b 7280 106488b 7280b 0 1958911 73735c c 352263c 24583 1859591c,57)/,('bpmfdtnlgkhzcs',s'zh ch sh r j q x')∘.,v'aoe',s'ai ei ao ou an ang en eng ong u ua uo uai ui uan uang un ueng i ia ie iao iu ian iang in ing iong u ue uan un'}

Спробуйте в Інтернеті!

Гольф в процесі.

Безумовно

s←{⍵⊆⍨' '≠⍵}
cons'b p m f d t n l g k h z c s zh ch sh r j q x'
vwls'a o e ai ei ao ou an ang en eng ong u ua uo uai ui uan uang un ueng i ia ie iao iu ian iang in ing iong u ue uan un'
tabcon∘.,vwl
bin←,⊤2097136 1966080 393208 1966064 2096720 1966072 1048568 2097144 2097144 2056184 2097144 131048 2097144 7288 131064 7280 106488 131064 7280 131064 0 1958911 73735 1957895 1957895 352263 1957895 24583 1859591 1957895 7 7 7 7 7
all'aoe',(12vwl),(s'yi ya ye yao you yan yang yin ying yong yu yue yuan yun wu wa wo wai wei wan wang wen weng nv lv nve lve'),bin/,tab
f←{(⊂⍵)∊all}

Спробуйте в Інтернеті!

Хелперна функція sрозпаковує розділену пробіл рядку:

{⍵⊆⍨' '≠⍵}    monadic function taking a string
    ' '≠⍵       0s at spaces, 1s elsewhere
 ⍵⊆⍨            Partition (split at 0s)

Я спочатку зберігаю можливі початкові та кінцеві рядки у складі, потім складаю таблицю tab що містить конкатенацію кожного рядка з першого списку з кожним рядком із другого списку.

Далі я зберігаю двійкові дані як список цілих чисел. Деякі з цілих чисел повторюються і тому можуть бути збережені у змінних, що також дозволяє усунути деякі простори.

Кожне ціле число декодується в двійкове і являє собою один рядок таблиці. Кожен біт числа представляє, чи певний склад у цьому рядку є дійсним складом, при цьому MSB представляє перший стовпець. Усі недійсні склади вилучаються з таблиці.

Ми вирівнюємо таблицю в список, додаємо форми без початкового приголосного в якості окремого відмінка і, нарешті, перевіряємо, чи є наш внесок у списку.

Можливий подальший потенціал для гольфу:

  • Запишіть кодування base64 або base255
  • Перестановіть стовпці та рядки, щоб зменшити числа.

Корисний сценарій і генератор тестових кейсів Python: Спробуйте його онлайн!

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.