Я хотів би знайти розташування символу в рядку.
Сказати: string = "the2quickbrownfoxeswere2tired"
Я хотів би, щоб функція повертала 4
і 24
- розташування символів 2
s в string
.
Я хотів би знайти розташування символу в рядку.
Сказати: string = "the2quickbrownfoxeswere2tired"
Я хотів би, щоб функція повертала 4
і 24
- розташування символів 2
s в string
.
Відповіді:
Можна використовувати gregexpr
gregexpr(pattern ='2',"the2quickbrownfoxeswere2tired")
[[1]]
[1] 4 24
attr(,"match.length")
[1] 1 1
attr(,"useBytes")
[1] TRUE
або, можливо, str_locate_all
з пакету, stringr
який є обгорткою для (станом на версію 1.0)gregexpr
stringi::stri_locate_all
stringr
library(stringr)
str_locate_all(pattern ='2', "the2quickbrownfoxeswere2tired")
[[1]]
start end
[1,] 4 4
[2,] 24 24
зверніть увагу, що ви можете просто використовувати stringi
library(stringi)
stri_locate_all(pattern = '2', "the2quickbrownfoxeswere2tired", fixed = TRUE)
Ще одним варіантом на базі R
буде щось на зразок
lapply(strsplit(x, ''), function(x) which(x == '2'))
повинен працювати (з урахуванням вектора символів x
)
regexpr
замість, gregexpr
щоб легко отримати цілі числа. Або використовуйте unlist
на виході, як зазначено в іншій відповіді нижче.
Ось ще одна пряма альтернатива.
> which(strsplit(string, "")[[1]]=="2")
[1] 4 24
[[1]]
робить?
Ви можете зробити результат лише 4 і 24, використовуючи unlist:
unlist(gregexpr(pattern ='2',"the2quickbrownfoxeswere2tired"))
[1] 4 24
знайти позицію n-го входження str2 у str1 (той самий порядок параметрів, що й Oracle SQL INSTR), повертає 0, якщо не знайдено
instr <- function(str1,str2,startpos=1,n=1){
aa=unlist(strsplit(substring(str1,startpos),str2))
if(length(aa) < n+1 ) return(0);
return(sum(nchar(aa[1:n])) + startpos+(n-1)*nchar(str2) )
}
instr('xxabcdefabdddfabx','ab')
[1] 3
instr('xxabcdefabdddfabx','ab',1,3)
[1] 15
instr('xxabcdefabdddfabx','xx',2,1)
[1] 0
Щоб знайти лише перші місця, використовуйте lapply()
з min()
:
my_string <- c("test1", "test1test1", "test1test1test1")
unlist(lapply(gregexpr(pattern = '1', my_string), min))
#> [1] 5 5 5
# or the readable tidyverse form
my_string %>%
gregexpr(pattern = '1') %>%
lapply(min) %>%
unlist()
#> [1] 5 5 5
Щоб знайти лише останні місця, використовуйте lapply()
з max()
:
unlist(lapply(gregexpr(pattern = '1', my_string), max))
#> [1] 5 10 15
# or the readable tidyverse form
my_string %>%
gregexpr(pattern = '1') %>%
lapply(max) %>%
unlist()
#> [1] 5 10 15
.indexOf()
чи чогось іншого?