Перетворити англійську на число [закрито]


27

Короткий та солодкий опис виклику:

Виходячи з ідей кількох інших питань на цьому веб-сайті, ваше завдання полягає в тому, щоб написати найкреативніший код у будь-якій програмі, який приймає як введення число, виписане англійською мовою, і перетворює його в цілу форму.

Дійсно сухі, довгі та ретельні технічні характеристики:

  • Ваша програма отримає як вхід ціле число на малій англійській мові між zeroта nine hundred ninety-nine thousand nine hundred ninety-nineвключно.
  • Він повинен виводити тільки ціле форма числа між 0і 999999і більше нічого (не пробілів).
  • Вхід НЕ міститиме ,або and, як у one thousand, two hundredабо five hundred and thirty-two.
  • Коли місця для десятків і одиниць є ненульовими, а місце десятків більше, ніж їх 1, вони будуть розділені символом HYPHEN-MINUS -замість пробілу. Дітто на десять тисяч і тисяч місць. Наприклад, six hundred fifty-four thousand three hundred twenty-one.
  • Програма може мати невизначене поведінку для будь-якого іншого введення.

Деякі приклади добре сприйнятої програми:

zero-> 0
fifteen-> 15
ninety-> 90
seven hundred four-> 704
sixty-nine thousand four hundred eleven-> 69411
five hundred twenty thousand two->520002


Це не особливо креативно, і воно не відповідає точно зазначеним тут специфікаціям, але може бути корисним як відправна точка: github.com/ghewgill/text2num/blob/master/text2num.py
Грег Х'югілл

Я майже міг опублікувати свою відповідь на це питання .
гр.ч.

Чому робиться складний розбір рядків? pastebin.com/WyXevnxb
blutorange

1
До речі, я побачив запис МОКЦ, який є відповіддю на це питання.
Перекус

2
А як щодо таких речей, як "чотири і двадцять"?
пухнастий

Відповіді:


93

Яблукопис

Дурний, хакі-маш-ап, який може засмутити деяких людей Купертіно / Маунтін-В'ю, але я вважаю, що це творче нерозумне, хакі-меш.

set myNumber to text returned of (display dialog ¬
    "Enter number as text:" buttons {"Continue…"} ¬
    default answer "" default button 1)
tell application "Google Chrome"
    activate
    open location "https://www.google.com"
end tell
delay 5
say "ok google. " & myNumber
delay 2
tell application "System Events"
    tell application process "Google Chrome"
        set fullURL to value of text field 1 of toolbar 1 of window 1
    end tell
end tell
set AppleScript's text item delimiters to "="
display alert item 2 of text items of fullURL

Використовує текст OSX для мовлення, щоб говорити номер тексту, та пошук аудіо в Google, щоб прослухати його та перетворити його на ціле число.

Вимоги

  • OSX
  • Гугл хром
  • розпізнавання мови ввімкнено у вашому обліковому записі Google
  • обсяг вийшов до розумного рівня

Терміни затримки, можливо, потрібно буде коригувати залежно від хромованого часу завантаження та часу пошуку Google.

Приклад введення:

введіть тут опис зображення

Приклад виводу:

введіть тут опис зображення


13
Я думаю, це може бути лише трохи творчим ...;)
Авраам

5
Лол, це круто
justhalf

2
Можливо, занадто креативний.
Чіз

Через тиждень ваша відповідь явно лідирує на 74 голоси, тож я думаю, це означає, що .. ви виграєте! До речі, майте на увазі, якщо я використовую цей код? Це було б дуже корисно для багатьох реальних проектів, над якими я працюю зараз! ;)
Авраам

3
@Abraham Дякую! Ви жартуєте про те, щоб використовувати це у виробничому коді, правда?
Цифрова травма

34

Bash, 93 64 55 символів *

У фантастичному bsd-gamesпакеті, який доступний для більшості операційних систем Linux, є маленька іграшка командного рядка, яка називається number. Він перетворює числа в англійський текст, тобто робить це прямо протилежне цьому питанню. Це дійсно навпаки: дотримуються всіх правил у питанні number. Це майже занадто добре, щоб бути збігом обставин.

$ number 42
forty-two.

Звичайно, numberне відповідає на питання. Ми хочемо, щоб було навпаки. Я подумав над цим на деякий час, спробував синтаксичний аналіз рядків і все це, потім зрозумів, що я можу просто зателефонувати numberна всі 999,999 номери і побачити, чи щось відповідає вхідному. Якщо так, перший рядок, де він збігається, має вдвічі більше номера рядка, який я шукаю ( numberдрукує рядок крапок після кожного числа). Просто як це. Отже, без зайвих прихильностей, ось повний код мого запису:

seq 0 999999|number -l|awk "/$1/{print (NR-1)/2;exit}"

Це навіть коротке замикання, тому перетворення "двох" відбувається досить швидко, і навіть більш високі числа зазвичай розшифровуються за секунду на моєму полі. Ось приклад запуску:

wn@box /tmp> bash unnumber.sh "zero"
0
wn@box /tmp> bash unnumber.sh "fifteen"
15
wn@box /tmp> bash unnumber.sh "ninety" 
90
wn@box /tmp> bash unnumber.sh "seven hundred four"
704
wn@box /tmp> bash unnumber.sh "sixty-nine thousand four hundred eleven"
69411
wn@box /tmp> bash unnumber.sh "five hundred twenty thousand two"    
520002

Звичайно, для цього вам потрібно буде numberвстановити.


*: Так, я знаю, це не є code-golfвикликом, але стислість - це майже єдина вибаглива якість мого вступу, так що ... :)


8
+1. Для мене використання numberзворотного боку є найбільш креативним у цій відповіді. Хоча гольф теж хороший :)
Digital Trauma

1
Це насправді досить креативно! Мені це подобається!
sokie

13

Javascript

(function parse(input) {
  var pat = "ze/on/tw/th.?r/fo/fi/ix/se/ei/ni/ten/ele".split("/");
  var num = "", last = 0, token = input.replace(/-/g, " ").split(" ");
  for(var i in token) {
    var t = token[i];
    for(var p in pat) if(t.match(RegExp(pat[p])) !== null) num += "+" + p;
    if(t.indexOf("een") >= 0) num += "+10";
    if(t.indexOf("lve") >= 0) num += "+10";
    if(t.indexOf("ty") >= 0) num += "*10";
    if(t.indexOf("dr") >= 0) { last = 100; num += "*100"; }
    if(t.indexOf("us") >= 0) {
      if(last < 1000) num = "(" + num + ")"; last = 0;
      num += "*1000";
    }
  }
  alert(eval(num));
})(prompt());

Вам подобаються деякі eval()?

Запустіть цей скрипт на консолі браузера.

Редагувати: Дякую за відгук. Виправлено помилки (знову).


дійсно приємний код ^^
zsitro

2
Коли ви введете щось на кшталт "сто шістнадцять", це дасть 126.
scrblnrd3

Ця програма не працює для деяких номерів, починаючи з того часу, twelveколи вона повертається 23.
Авраам

Не вдається "twenty".
200_успіх

seven thousand three hundred thirty fiveдай мені10335
Дитина

7

Пітон

Просто для того, щоб куля котилася.

import re
table = {'zero':0,'one':1,'two':2,'three':3,'four':4,'five':5,'six':6,'seven':7,'eight':8,'nine':9,
         'ten':10,'eleven':11,'twelve':12,'thirteen':13,'fourteen':14,'fifteen':15,'sixteen':16,'seventeen':17,'eighteen':18,'nineteen':19,
         'twenty':20,'thirty':30,'forty':40,'fifty':50,'sixty':60,'ninety':90}
modifier = {'hundred':100,'thousand':1000}

while True:
    text = raw_input()
    result = 0
    tmp = 0
    last_multiplier = 1
    for word in re.split('[- ]', text):
        multiplier = modifier.get(word, 1)
        if multiplier > last_multiplier:
            result = (result+tmp)*multiplier
            tmp = 0
        else:
            tmp *= multiplier
        if multiplier != 1:
            last_multiplier = multiplier
        tmp += table.get(word,0)
    print result+tmp

5

Perl + CPAN

Навіщо винаходити колесо, коли це вже зроблено?

use feature 'say';
use Lingua::EN::Words2Nums;

say words2nums $_ while <>;

Ця програма читає англійські рядки зі стандартного вводу (або з одного або декількох файлів, вказаних як аргументи командного рядка), по одному на рядок, і виводить відповідні числа на стандартний вихід.

Я перевірив цей код, використовуючи обидва вхідні приклади виклику, а також вичерпний тестовий набір, що складається з чисел від 0 до 999999, перетворених у текст за допомогою numberутиліти bsd-ігор (спасибі, Wander Nauta!), І він правильно аналізує усі. Як бонус він також розуміє такі входи, як, наприклад, minus seven(−7), four and twenty(24), four score and seven(87), one gross(144), a baker's dozen(13), eleventy-one(111) та googol(10 100 ).

( Примітка. Окрім самого інтерпретатора Perl, цій програмі також потрібен модуль CPAN Lingua :: EN :: Words2Nums . Ось декілька інструкцій щодо встановлення модулів CPAN . Користувачі Debian / Ubuntu Linux також можуть встановити цей модуль через менеджер пакетів APT як liblingua-en-words2nums-perl .)


4

Пітон

Загальне рекурсивне рішення з перевіркою дійсності. Може бути спрощено для потрібного діапазону номерів, але ось, напевно, я думаю:

terms = 'zero one two three four five six seven eight nine ten eleven twelve thirteen fourteen fifteen sixteen seventeen eighteen nineteen'.split()
tee  = 'twenty thirty forty fifty sixty seventy eighty ninety'.split()
for t in tee:
    terms.append(t)
    for s in terms[1:10]:
        terms.append(t+'-'+s)

terms = dict(zip(terms, range(100)))

modifiers = [('hundred', 100), ('thousand', 1000), ('million', 10**6), ('billion', 10**9)]

def read_num(words):
    if len(words) == 0: return 0
    elif len(words) == 1:
        if words[0] in terms:
            return terms[words[0]]
        else:
            raise ValueError(words[0]+' is not a valid english number.')
    else:
        for word, value in reversed(modifiers):
            if word in words:
                i = words.index(word)
                return read_num(words[:i])*value+read_num(words[i+1:])

    raise ValueError(' '.join(words)+' is not a valid english number.')

while True:
    try:
        print(read_num(input().split()))
    except ValueError as e:
        print(e)

2

VBScript 474

Це досить рутинна відповідь ... на жаль, така звичайна, що @Snack майже розмістив той самий процес, але перед мною.

i=split(REPLACE(REPLACE(inputbox(""),"lve","een"),"tho","k"))
o=split("z on tw th fo fi si se ei ni ten ele")
y=split("red *100) k )*1000 ty *10) een +10)")
z=""
p=0
for t=0 to UBOUND(i)
    s=split(i(t),"-")
    u=ubound(s)
    r=s(0)
    for x=0 to UBOUND(o)    
        IF INSTR(r,o(x)) THEN
            z=z+"+"+CSTR(x)
        END IF
        IF u Then
            IF INSTR(s(1),o(x)) THEN
                z=z+CSTR(x)
            END IF
        END IF
    next
    for m=0 to UBOUND(y)
        IF INSTR(r,y(m))AND u=0 THEN
            z=z+y(m+1)
            p=p+1
        END IF
    next
next
Execute("MSGBOX "+String(p,"(")+z)

1

Хаскелл

Як і в інших рекурсивних рішеннях, я думаю, але я зайняв час, щоб зробити це чистим.

Ось повне джерело з усіма поясненнями: http://ideone.com/fc8zcB

-- Define a type for a parser from a list of tokens to the value they represent.
type NParse = [Token] -> Int    

-- Map of literal tokens (0-9, 11-19 and tens) to their names.
literals = [
        ("zero", 0), ("one", 1), ("two", 2), ("three", 3), ("four", 4), ("five", 5), ("six", 6), ("seven", 7), ("eight", 8), ("nine", 9),
        ("eleven", 11), ("twelve", 12), ("thirteen", 13), ("fourteen", 14), ("fifteen", 15), ("sixteen", 16), ("seventeen", 17), ("eighteen", 18), ("nineteen", 19),
        ("ten", 10), ("twenty", 20), ("thirty", 30), ("fourty", 40), ("fifty", 50), ("sixty", 60), ("seventy", 70), ("eighty", 80), ("ninety", 90)
    ]

-- Splits the input string into tokens.
-- We do one special transformation: replace dshes by a new token. Such that "fifty-three" becomes "fifty tens three". 
prepare :: String -> [Token]

-- Let's do the easy stuff and just parse literals first. We just have to look them up in the literals map.
-- This is our base parser.
parseL :: NParse
parseL [tok] = case lookup tok literals of 
    Just x -> x

-- We're going to exploit the fact that the input strings have a tree-like structure like so
--                    thousand
--          hundred             hundred
--      ten       ten       ten         ten
--    lit   lit lit  lit   lit  lit    lit  lit
-- And recursively parse that tree until we only have literal values.
--
-- When parsing the tree
--       thousand
--     h1       h2
-- The resulting value is 1000 * h1 + h2.
-- And this works similarly for all levels of the tree.
-- So instead of writing specific parsers for all levels, let's just write a generic one :

{- genParse :: 
    NParse      : the sub parser
    -> Int      : the left part multiplier
    -> Token    : the boundary token 
    -> NParse   : returns a new parser -}   
genParse :: NParse -> Int -> Token -> NParse    
genParse delegate mul tok = newParser where
    newParser [] = 0
    newParser str = case splitAround str tok of
        -- Split around the boundary token, sub-parse the left and right parts, and combine them
        (l,r) -> (delegate l) * mul + (delegate r)  

-- And so here's the result: 
parseNumber :: String -> Int
parseNumber = parseM . prepare
    where   -- Here are all intermediary parsers for each level
    parseT = genParse   parseL  1       "tens"       -- multiplier is irregular, because the fifty in fifty-three is already multiplied by 10
    parseH = genParse   parseT  100     "hundred"
    parseK = genParse   parseH  1000    "thousand"
    parseM = genParse   parseK  1000000 "million" -- For fun :D

test = (parseNumber "five hundred twenty-three thousand six hundred twelve million two thousand one") == 523612002001

0

Common Lisp, 94

(write(cdr(assoc(read-line)(loop for i to 999999 collect(cons(format()"~r"i)i)):test #'equalp)))

Перетворення числа в текст вбудовано в CL, але не навпаки. Побудовує зворотне відображення чисел і перевіряє вхід на ньому.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.