Як написати трикотаж на R


342

Я хочу написати trycatchкод для усунення помилок при завантаженні з Інтернету.

url <- c(
    "http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html",
    "http://en.wikipedia.org/wiki/Xz")
y <- mapply(readLines, con=url)

Ці дві заяви успішно працюють. Нижче я створюю неіснуючу веб-адресу:

url <- c("xxxxx", "http://en.wikipedia.org/wiki/Xz")

url[1]не існує. Як записати trycatchцикл (функцію), щоб:

  1. Якщо URL-адреса неправильна, вихід буде таким: "веб-URL-адреса неправильна, не можу отримати".
  2. Коли URL-адреса неправильна, код не зупиняється, а продовжує завантажуватися до кінця списку URL-адрес?

Відповіді:


626

Ну тоді: ласкаво просимо у світ R ;-)

Ось ви йдете

Налаштування коду

urls <- c(
    "http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html",
    "http://en.wikipedia.org/wiki/Xz",
    "xxxxx"
)
readUrl <- function(url) {
    out <- tryCatch(
        {
            # Just to highlight: if you want to use more than one 
            # R expression in the "try" part then you'll have to 
            # use curly brackets.
            # 'tryCatch()' will return the last evaluated expression 
            # in case the "try" part was completed successfully

            message("This is the 'try' part")

            readLines(con=url, warn=FALSE) 
            # The return value of `readLines()` is the actual value 
            # that will be returned in case there is no condition 
            # (e.g. warning or error). 
            # You don't need to state the return value via `return()` as code 
            # in the "try" part is not wrapped insided a function (unlike that
            # for the condition handlers for warnings and error below)
        },
        error=function(cond) {
            message(paste("URL does not seem to exist:", url))
            message("Here's the original error message:")
            message(cond)
            # Choose a return value in case of error
            return(NA)
        },
        warning=function(cond) {
            message(paste("URL caused a warning:", url))
            message("Here's the original warning message:")
            message(cond)
            # Choose a return value in case of warning
            return(NULL)
        },
        finally={
        # NOTE:
        # Here goes everything that should be executed at the end,
        # regardless of success or error.
        # If you want more than one expression to be executed, then you 
        # need to wrap them in curly brackets ({...}); otherwise you could
        # just have written 'finally=<expression>' 
            message(paste("Processed URL:", url))
            message("Some other message at the end")
        }
    )    
    return(out)
}

Застосування коду

> y <- lapply(urls, readUrl)
Processed URL: http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html
Some other message at the end
Processed URL: http://en.wikipedia.org/wiki/Xz
Some other message at the end
URL does not seem to exist: xxxxx
Here's the original error message:
cannot open the connection
Processed URL: xxxxx
Some other message at the end
Warning message:
In file(con, "r") : cannot open file 'xxxxx': No such file or directory

Дослідження результату

> head(y[[1]])
[1] "<!DOCTYPE html PUBLIC \"-//W3C//DTD HTML 4.01 Transitional//EN\">"      
[2] "<html><head><title>R: Functions to Manipulate Connections</title>"      
[3] "<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\">"
[4] "<link rel=\"stylesheet\" type=\"text/css\" href=\"R.css\">"             
[5] "</head><body>"                                                          
[6] ""    

> length(y)
[1] 3

> y[[3]]
[1] NA

Додаткові зауваження

tryCatch

tryCatchповертає значення, пов’язане з виконанням, exprякщо немає помилки чи попередження. У цьому випадку конкретні значення повернення (див. return(NA)Вище) можна задати, надавши відповідну функцію обробника (див. Аргументи errorта warningв ?tryCatch). Це можуть бути функції, які вже є, але ви також можете їх визначити в межах tryCatch()(як я це робив вище).

Наслідки вибору конкретних зворотних значень функцій обробника

Як ми вказали, що NAслід повернути у випадку помилки, третім елементом yє NA. Якби ми вибрали NULLзначення повернення, довжина yпросто була б 2замість того, 3як lapply()просто «ігнорує» повернені значення, які є NULL. Також зауважте, що якщо ви не вкажете явне значення повернення через return(), функції обробника повернуться NULL(тобто у випадку помилки чи попередження).

"Небажане" попереджувальне повідомлення

Оскільки, warn=FALSEздається, не має жодного ефекту, альтернативним способом придушити попередження (що в даному випадку насправді не цікавить) є використання

suppressWarnings(readLines(con=url))

замість

readLines(con=url, warn=FALSE)

Кілька виразів

Зверніть увагу , що ви можете також помістити кілька виразів в «фактичних виразах частини» (аргумент exprпро tryCatch()) , якщо загорнути їх в фігурних дужках (так само , як я ілюстрував в finallyчастині).


Враховуючи, що перший рядок у ваших pasteфункціях закінчується пробілом, чому б не опустити пробіл та sep=""?
seancarmody

2
@seancarmody: true ;-) Я просто звик складати довші / складніші рядки, якщо мені довелося контролювати пробіли, фактично виписуючи їх.
Раппстер

3
Ви повинні використовувати paste0для цього!
seancarmody

6
paste0() знаходиться в базі. Внутрішньо, як paste()і paste0()виклик do_pasteв paste.c . Єдина відмінністьpaste0() не передавати sepаргумент.
jthetzel

1
@JulienNavarre: пам’ятайте, що «спробувати частина» завжди повертає останній об’єкт (на даний момент readLines(con=url, warn=FALSE)це фактична річ, яка може піти не так). Отже, якщо ви хочете додати повідомлення, вам потрібно буде зберегти фактичне значення перезавантаження у змінній: out <- readLines(con=url, warn=FALSE)за ним message("Everything worked")слідує далі out, щоб зробити це останнім об’єктом, який фактично повертається
Раппстер,

69

R використовує функції для реалізації блоку пробного лову:

Синтаксис виглядає приблизно так:

result = tryCatch({
    expr
}, warning = function(warning_condition) {
    warning-handler-code
}, error = function(error_condition) {
    error-handler-code
}, finally={
    cleanup-code
})

У tryCatch () є два "умови", з якими можна оброблятись: "попередження" та "помилки". Важливе, що потрібно розуміти під час написання кожного блоку коду, - це стан виконання та область застосування. @source


5
Замініть error-handler-codeнаcat("web url is wrong, can't get")
seancarmody

2
ви залишили поза
увагою

52

tryCatchмає трохи складну синтаксичну структуру. Однак, як тільки ми зрозуміємо 4 частини, які складають повний виклик tryCatch, як показано нижче, запам'ятати стає легко:

expr : [ Обов’язково ] R код (и), що підлягають оцінці

помилка : [ Необов’язково ] Що слід запустити, якщо сталася помилка під час оцінки кодів у expr

попередження : [ Необов’язково ] Що повинно запускатися, якщо виникло попередження під час оцінки кодів у expr

нарешті : [ Необов’язково ] Що слід запустити перед тим, як вийти з виклику tryCatch, незалежно від того, чи успішно працював expr, з помилкою чи з попередженням

tryCatch(
    expr = {
        # Your code...
        # goes here...
        # ...
    },
    error = function(e){ 
        # (Optional)
        # Do this if an error is caught...
    },
    warning = function(w){
        # (Optional)
        # Do this if an warning is caught...
    },
    finally = {
        # (Optional)
        # Do this at the end before quitting the tryCatch structure...
    }
)

Таким чином, приклад іграшки для обчислення журналу значення може виглядати так:

log_calculator <- function(x){
    tryCatch(
        expr = {
            message(log(x))
            message("Successfully executed the log(x) call.")
        },
        error = function(e){
            message('Caught an error!')
            print(e)
        },
        warning = function(w){
            message('Caught an warning!')
            print(w)
        },
        finally = {
            message('All done, quitting.')
        }
    )    
}

Тепер працює три справи:

Дійсний випадок

log_calculator(10)
# 2.30258509299405
# Successfully executed the log(x) call.
# All done, quitting.

Справа "попередження"

log_calculator(-10)
# Caught an warning!
# <simpleWarning in log(x): NaNs produced>
# All done, quitting.

Випадок "помилки"

log_calculator("log_me")
# Caught an error!
# <simpleError in log(x): non-numeric argument to mathematical function>
# All done, quitting.

Я писав про деякі корисні випадки використання, які я регулярно використовую. Більше деталей можна знайти тут: https://rsangole.netlify.com/post/try-catch/

Сподіваюся, це корисно.


34

Ось простий приклад :

# Do something, or tell me why it failed
my_update_function <- function(x){
    tryCatch(
        # This is what I want to do...
        {
        y = x * 2
        return(y)
        },
        # ... but if an error occurs, tell me what happened: 
        error=function(error_message) {
            message("This is my custom message.")
            message("And below is the error message from R:")
            message(error_message)
            return(NA)
        }
    )
}

Якщо ви також хочете зробити «попередження», просто додайте warning=подібну error=частину.


1
Чи повинні бути фігурні дужки навколо exprдеталі, оскільки замість однієї є дві лінії?
Поль

Дякую! Після подвійної перевірки, я не бачу ніякої необхідності в фігурних дужках
Пол

Дякуємо за подвійну перевірку. Коли я запускаю ваш код, я отримав Error: unexpected ')' in " )"і Error: unexpected ')' in " )". Додавання пари фігурних дужок вирішує проблему.
Пол,

У більшості випадків використання ви праві, дякую! Це було виправлено.
Павло

23

Оскільки я просто втратив два дні свого життя, намагаючись вирішити для tryCatch функції irr, я подумав, що повинен поділитися своєю мудрістю (а що не вистачає). FYI - irr - це фактична функція від FinCal в цьому випадку, коли в кількох випадках у великому наборі даних були помилки.

  1. Налаштуйте tryCatch як частину функції. Наприклад:

    irr2 <- function (x) {
      out <- tryCatch(irr(x), error = function(e) NULL)
      return(out)
    }
  2. Щоб помилка (або попередження) спрацювала, вам потрібно створити функцію. Я спочатку для частини помилок тільки що написав, error = return(NULL)і ВСІ значення повернулися до нуля.

  3. Не забудьте створити субпродукцію (наприклад, моє "вихід") і return(out).


3
Чому потрібен номер 3?
jan-glx
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.