Перевірка підрядків існує в рядку на C


169

Я намагаюся перевірити, чи містить рядок підрядку на C, наприклад:

char *sent = "this is my sample example";
char *word = "sample";
if (/* sentence contains word */) {
    /* .. */
}

Що можна використовувати замість string::findC ++?


7
Ви хочете: char * strstr (const char * s1, const char * s2) - знаходить перше виникнення рядка s2 у рядку s1.
JonH

@JonH Я думав, що це працює лише для символів. Я прийму одну з відповідей нижче, дякую ..
жодної

ви це змішуєте strchr.
JonH

@JonH ага, це має сенс зараз. ви чудові, ще раз дякую ..
жодного

Відповіді:


272
if(strstr(sent, word) != NULL) {
    /* ... */
}

Зауважте, що strstrповертає вказівник на початок слова, sentякщо слово wordзнайдено.


1
Ви також можете видалити "! = NULL", я думаю, що strstr повертається 0 або 1
Simon MILHAU

44
strstrповертає вказівник; Мені подобається бути явним, коли я тестую на покажчики.
nneonneo

3
... і falseє0
Джек

8
Коментар для моєї майбутньої довідки; strcasestrробить те ж саме, але ігнорує випадок.
amonett

2
@NgoThanhNhan Ви можете бачити реалізацію strstrв glibc тут: github.com/lattera/glibc/blob/master/string/strstr.c . Це набагато оптимізованіше, ніж наївне реалізація - і, ймовірно, швидше, ніж пряма самовизначена функція. Тим не менш, коли сумніваєтесь, орієнтир.
nneonneo


12

Спробуйте використовувати вказівники ...

#include <stdio.h>
#include <string.h>

int main()
{

  char str[] = "String1 subString1 Strinstrnd subStr ing1subString";
  char sub[] = "subString";

  char *p1, *p2, *p3;
  int i=0,j=0,flag=0;

  p1 = str;
  p2 = sub;

  for(i = 0; i<strlen(str); i++)
  {
    if(*p1 == *p2)
      {
          p3 = p1;
          for(j = 0;j<strlen(sub);j++)
          {
            if(*p3 == *p2)
            {
              p3++;p2++;
            } 
            else
              break;
          }
          p2 = sub;
          if(j == strlen(sub))
          {
             flag = 1;
            printf("\nSubstring found at index : %d\n",i);
          }
      }
    p1++; 
  }
  if(flag==0)
  {
       printf("Substring NOT found");
  }
return (0);
}

8

Ви можете спробувати це як для пошуку наявності підрядки, так і для вилучення та друку:

#include <stdio.h>
#include <string.h>

int main(void)
{
    char mainstring[]="The quick brown fox jumps over the lazy dog";
    char substring[20], *ret;
    int i=0;
    puts("enter the sub string to find");
    fgets(substring, sizeof(substring), stdin);
    substring[strlen(substring)-1]='\0';
    ret=strstr(mainstring,substring);
    if(strcmp((ret=strstr(mainstring,substring)),substring))
    {
        printf("substring is present\t");
    }
    printf("and the sub string is:::");

    for(i=0;i<strlen(substring);i++)
    {
            printf("%c",*(ret+i));

    }
    puts("\n");
    return 0;
}

Тест if(strcmp((ret=strstr(mainstring,substring)),substring))невірний: він відповідає лише, substringякщо це суфікс mainstring. Решта функції - це звичний спосіб запису printf("and the sub string is:::%s\n", substring);.
chqrlie

5

Цей код реалізує логіку того, як працює пошук (один із способів), не використовуючи жодної готової функції:

public int findSubString(char[] original, char[] searchString)
{
    int returnCode = 0; //0-not found, -1 -error in imput, 1-found
    int counter = 0;
    int ctr = 0;
    if (original.Length < 1 || (original.Length)<searchString.Length || searchString.Length<1)
    {
        returnCode = -1;
    }

    while (ctr <= (original.Length - searchString.Length) && searchString.Length > 0)
    {
        if ((original[ctr]) == searchString[0])
        {
            counter = 0;
            for (int count = ctr; count < (ctr + searchString.Length); count++)
            {
                if (original[count] == searchString[counter])
                {
                    counter++;
                }
                else
                {
                    counter = 0;
                    break;
                }
            }
            if (counter == (searchString.Length))
            {
                returnCode = 1;
            }
        }
        ctr++;
    }
    return returnCode;
}

Хоча цей код може відповісти на питання, надаючи додатковий контекст стосовно того, чому та / або як цей код відповідає на питання, покращує його довгострокове значення.
JAL

3

Ось як повідомити про позицію першого символу із знайденої підрядки:

Замініть цей рядок у наведеному вище коді:

printf("%s",substring,"\n");

з:

printf("substring %s was found at position %d \n", substring,((int) (substring - mainstring)));

3

Моє власне скромне (залежне від регістру) рішення:

uint8_t strContains(char* string, char* toFind)
{
    uint8_t slen = strlen(string);
    uint8_t tFlen = strlen(toFind);
    uint8_t found = 0;

    if( slen >= tFlen )
    {
        for(uint8_t s=0, t=0; s<slen; s++)
        {
            do{

                if( string[s] == toFind[t] )
                {
                    if( ++found == tFlen ) return 1;
                    s++;
                    t++;
                }
                else { s -= found; found=0; t=0; }

              }while(found);
        }
        return 0;
    }
    else return -1;
}

Результати

strContains("this is my sample example", "th") // 1
strContains("this is my sample example", "sample") // 1
strContains("this is my sample example", "xam") // 1
strContains("this is my sample example", "ple") // 1
strContains("this is my sample example", "ssample") // 0
strContains("this is my sample example", "samplee") // 0
strContains("this is my sample example", "") // 0
strContains("str", "longer sentence") // -1
strContains("ssssssample", "sample") // 1
strContains("sample", "sample") // 1

Тестовано на ATmega328P (avr8-gnu-toolchain-3.5.4.1709);)


1

Те саме буде досягнуто з цим простішим кодом: навіщо використовувати ці:

int main(void)
{

    char mainstring[]="The quick brown fox jumps over the lazy dog";
    char substring[20];
    int i=0;
    puts("enter the sub stirng to find");
    fgets(substring, sizeof(substring), stdin);
    substring[strlen(substring)-1]='\0';
    if (strstr(mainstring,substring))
    {
            printf("substring is present\t");
    }
    printf("and the sub string is:::");
    printf("%s",substring,"\n");
   return 0;
}

Але складною частиною було б повідомити, з якої позиції в початковому рядку починається підрядок ...


1
My code to find out if substring is exist in string or not 
// input ( first line -->> string , 2nd lin ->>> no. of queries for substring
following n lines -->> string to check if substring or not..

#include <stdio.h>
int len,len1;
int isSubstring(char *s, char *sub,int i,int j)
{

        int ans =0;
         for(;i<len,j<len1;i++,j++)
        {
                if(s[i] != sub[j])
                {
                    ans =1;
                    break;
                }
        }
        if(j == len1 && ans ==0)
        {
            return 1;
        }
        else if(ans==1)
            return 0;
return 0;
}
int main(){
    char s[100001];
    char sub[100001];
    scanf("%s", &s);// Reading input from STDIN
    int no;
    scanf("%d",&no);
    int i ,j;
    i=0;
    j=0;
    int ans =0;
    len = strlen(s);
    while(no--)
    {
        i=0;
        j=0;
        ans=0;
        scanf("%s",&sub);
        len1=strlen(sub);
        int value;
        for(i=0;i<len;i++)
        {
                if(s[i]==sub[j])
                {
                    value = isSubstring(s,sub,i,j);
                    if(value)
                    {
                        printf("Yes\n");
                        ans = 1;
                        break;
                    }
                }
        }
        if(ans==0)
            printf("No\n");

    }
}

1

Я вважаю, що у мене найпростіша відповідь. У цій програмі вам не потрібна бібліотека string.h, ні бібліотека stdbool.h. Просто використання покажчиків та арифметики вказівника допоможе вам стати кращим програмістом на C.

Просто поверніть 0 для False (підрядка не знайдена), або 1 для True (так, підряд "sub" знайдений у загальній рядку "str"):

#include <stdlib.h>

int is_substr(char *str, char *sub)
{
  int num_matches = 0;
  int sub_size = 0;
  // If there are as many matches as there are characters in sub, then a substring exists.
  while (*sub != '\0') {
    sub_size++;
    sub++;
  }

  sub = sub - sub_size;  // Reset pointer to original place.
  while (*str != '\0') {
    while (*sub == *str && *sub != '\0') {
      num_matches++;
      sub++;
      str++;
    }
    if (num_matches == sub_size) {
      return 1;
    }
    num_matches = 0;  // Reset counter to 0 whenever a difference is found. 
    str++;
  }
  return 0;
}

1
А як щодо перевиконання буфера?
Cacahuete Frito

Як би тут відбувалося переповнення буфера?
user9679882

Для початку ви не знаєте розмір буфера. Уявіть собі цей «простий» код: char a[3] = "asd"; char b[2] = "as"; is_substr(a, b);рядки введення не закінчуються NUL, тому ви перекрили масив.
Cacahuete Frito

Якщо будь-який з буферів має розмір 0 (масиви розміром 0 не існують, але це можливо, а також законно з точки зору користувача функції):char a[4] = "asd"; char b[3]= "as"; is_substr(a+4, b);
Cacahuete Frito

І тому причина strnstr()існує (принаймні, на libbsd)
Cacahuete Frito

1

Використання C - Немає вбудованих функцій

string_contains () виконує весь важкий підйом і повертає 1 на основі індексу. Відпочинок - це водійські та допоміжні коди.

Призначте вказівник на основний рядок та підрядку, збільшивши вказівник підрядкової стрічки при збігу, припиніть циклічно, коли вказівник підрядки дорівнює довжині підрядки.

read_line () - Маленький бонусний код для читання вводу користувача без попереднього визначення розміру вводу, який повинен надати користувач.

#include <stdio.h>
#include <stdlib.h>

int string_len(char * string){
  int len = 0;
  while(*string!='\0'){
    len++;
    string++;
  }
  return len;
}

int string_contains(char *string, char *substring){
  int start_index = 0;
  int string_index=0, substring_index=0;
  int substring_len =string_len(substring);
  int s_len = string_len(string);
  while(substring_index<substring_len && string_index<s_len){
    if(*(string+string_index)==*(substring+substring_index)){
      substring_index++;
    }
    string_index++;
    if(substring_index==substring_len){
      return string_index-substring_len+1;
    }
  }

  return 0;

}

#define INPUT_BUFFER 64
char *read_line(){
  int buffer_len = INPUT_BUFFER;
  char *input = malloc(buffer_len*sizeof(char));
  int c, count=0;

  while(1){
    c = getchar();

    if(c==EOF||c=='\n'){
      input[count]='\0';
      return input;
    }else{
      input[count]=c;
      count++;
    }

    if(count==buffer_len){
      buffer_len+=INPUT_BUFFER;
      input = realloc(input, buffer_len*sizeof(char));
    }

  }
}

int main(void) {
  while(1){
    printf("\nEnter the string: ");
    char *string = read_line();
    printf("Enter the sub-string: ");
    char *substring = read_line(); 
    int position = string_contains(string,substring);
    if(position){ 
      printf("Found at position: %d\n", position);
    }else{
      printf("Not Found\n");
    }
  }
  return 0;
}

-1
#include <stdio.h>
#include <string.h>

int findSubstr(char *inpText, char *pattern);
int main()
{
    printf("Hello, World!\n");
    char *Text = "This is my sample program";
    char *pattern = "sample";
    int pos = findSubstr(Text, pattern);
    if (pos > -1) {
        printf("Found the substring at position %d \n", pos);
    }
    else
        printf("No match found \n");

    return 0;
}

int findSubstr(char *inpText, char *pattern) {
    int inplen = strlen(inpText);
    while (inpText != NULL) {

        char *remTxt = inpText;
        char *remPat = pattern;

        if (strlen(remTxt) < strlen(remPat)) {
            /* printf ("length issue remTxt %s \nremPath %s \n", remTxt, remPat); */
            return -1;
        }

        while (*remTxt++ == *remPat++) {
            printf("remTxt %s \nremPath %s \n", remTxt, remPat);
            if (*remPat == '\0') {
                printf ("match found \n");
                return inplen - strlen(inpText+1);
            }
            if (remTxt == NULL) {
                return -1;
            }
        }
        remPat = pattern;

        inpText++;
    }
}
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.