C语言正则表达式

发布时间:2011-09-16 共2页

  /* 主程序 */

  int main(int argc, char** argv)

  {

  char * pattern;

  int x, z, lno = 0, cflags = 0;

  char ebuf[128], lbuf[256];

  regex_t reg;

  regmatch_t pm[10];

  const size_t nmatch = 10;

  /* 编译正则表达式*/

  pattern = argv[1];

  z = regcomp(®, pattern, cflags);

  if (z != 0){

  regerror(z, ®, ebuf, sizeof(ebuf));

  fprintf(stderr, "%s: pattern '%s' \n", ebuf, pattern);

  return 1;

  }

  /* 逐行处理输入的数据 */

  while(fgets(lbuf, sizeof(lbuf), stdin)) {

  ++lno;

  if ((z = strlen(lbuf)) > 0 && lbuf[z-1] == '\n')

  lbuf[z - 1] = 0;

  /* 对每一行应用正则表达式进行匹配 */

  z = regexec(®, lbuf, nmatch, pm, 0);

  if (z == REG_NOMATCH) continue;

  else if (z != 0) {

  regerror(z, ®, ebuf, sizeof(ebuf));

  fprintf(stderr, "%s: regcom('%s')\n", ebuf, lbuf);

  return 2;

  }

  /* 输出处理结果 */

  for (x = 0; x < nmatch && pm[x].rm_so != -1; ++ x) {

  if (!x) printf("%04d: %s\n", lno, lbuf);

  printf(" $%d='%s'\n", x, substr(lbuf, pm[x].rm_so, pm[x].rm_eo));

  }

  }

  /* 释放正则表达式 */

  regfree(®);

  return 0;

  }

  上述程序负责从命令行获取正则表达式,然后将其运用于从标准输入得到的每行数据,并打印出匹配结果。执行下面的命令可以编译并执行该程序:

  # gcc regexp.c -o regexp

  # ./regexp 'regex[a-z]*' < regexp.c

  0003: #include

  $0='regex'

  0027: regex_t reg;

  $0='regex'

  0054: z = regexec(®, lbuf, nmatch, pm, 0);

  $0='regexec'

  小结

  对那些需要进行复杂数据处理的程序来说,正则表达式无疑是一个非常有用的工具。本文重点在于阐述如何在C语言中利用正则表达式来简化字符串处理,以便在数据处理方面能够获得与Perl语言类似的灵活性。

  编辑特别推荐:

  

百分百考试网 考试宝典

立即免费试用