Знайдіть розташування символу в рядку


87

Я хотів би знайти розташування символу в рядку.

Сказати: string = "the2quickbrownfoxeswere2tired"

Я хотів би, щоб функція повертала 4і 24- розташування символів 2s в string.


Навіщо використовувати регулярний вираз? Хіба у r немає .indexOf()чи чогось іншого?
fge

1
Я сумніваюся. Розробниками були Nixers і припускали, що всі знають регулярні вирази. Обробка рядків у R - це якось похмуро.
IRTFM

Відповіді:


115

Можна використовувати gregexpr

 gregexpr(pattern ='2',"the2quickbrownfoxeswere2tired")


[[1]]
[1]  4 24
attr(,"match.length")
[1] 1 1
attr(,"useBytes")
[1] TRUE

або, можливо, str_locate_allз пакету, stringrякий є обгорткою для (станом на версію 1.0)gregexpr stringi::stri_locate_allstringr

library(stringr)
str_locate_all(pattern ='2', "the2quickbrownfoxeswere2tired")

[[1]]
     start end
[1,]     4   4
[2,]    24  24

зверніть увагу, що ви можете просто використовувати stringi

library(stringi)
stri_locate_all(pattern = '2', "the2quickbrownfoxeswere2tired", fixed = TRUE)

Ще одним варіантом на базі Rбуде щось на зразок

lapply(strsplit(x, ''), function(x) which(x == '2'))

повинен працювати (з урахуванням вектора символів x)


як ми можемо витягти цілі числа зі списків / об'єктів, повернутих вашими першими 3 рішеннями?
3pitt

Використовуйте regexprзамість, gregexprщоб легко отримати цілі числа. Або використовуйте unlistна виході, як зазначено в іншій відповіді нижче.
Arani


20

Ви можете зробити результат лише 4 і 24, використовуючи unlist:

unlist(gregexpr(pattern ='2',"the2quickbrownfoxeswere2tired"))
[1]  4 24

2

знайти позицію n-го входження str2 у str1 (той самий порядок параметрів, що й Oracle SQL INSTR), повертає 0, якщо не знайдено

instr <- function(str1,str2,startpos=1,n=1){
    aa=unlist(strsplit(substring(str1,startpos),str2))
    if(length(aa) < n+1 ) return(0);
    return(sum(nchar(aa[1:n])) + startpos+(n-1)*nchar(str2) )
}


instr('xxabcdefabdddfabx','ab')
[1] 3
instr('xxabcdefabdddfabx','ab',1,3)
[1] 15
instr('xxabcdefabdddfabx','xx',2,1)
[1] 0

2

Щоб знайти лише перші місця, використовуйте lapply()з min():

my_string <- c("test1", "test1test1", "test1test1test1")

unlist(lapply(gregexpr(pattern = '1', my_string), min))
#> [1] 5 5 5

# or the readable tidyverse form
my_string %>%
  gregexpr(pattern = '1') %>%
  lapply(min) %>%
  unlist()
#> [1] 5 5 5

Щоб знайти лише останні місця, використовуйте lapply()з max():

unlist(lapply(gregexpr(pattern = '1', my_string), max))
#> [1]  5 10 15

# or the readable tidyverse form
my_string %>%
  gregexpr(pattern = '1') %>%
  lapply(max) %>%
  unlist()
#> [1]  5 10 15

1

Ви також можете використовувати grep:

grep('2', strsplit(string, '')[[1]])
#4 24
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.