반응형
외부사이트의 조회수를 가져와야 하는경우 정규식
유투브 : \d+(\,*)\d+
플리커 : Viewed (\d+) times
출처 : http://user.chollian.net/~spacekan/source/string/regExp.htm
Special characters in regular expressions
의미 | |
\
|
다음 글자가 일반적인 글자가 아니고 특수문자로 사용된다는 지정이다.
특수문자로 사용할 문자앞에 backslash(\)를 붙여준다. \w는 w가 특수문자로 사용됨을 나타낸다.
\w의 의미는 모든 문자를 가리킨다.
또는 반대로 특수문자를 일반적인 문자로 지정하게 한다. \\는 backslash(\)문자를 나타낸다. \\\/는 slash(/) 문자를 나타낸다. |
^
|
input이나 line의 시작문자.
/^A/는 "Amatch"와는 맞지만 "an Amatch"와는 맞지 않는다.
|
$
|
input이나 line의 끝문자.
/A$/는 "abA"와는 맞지만 "aAb"와는 맞지 않는다.
|
*
|
앞 문자가 0번 이상 있으면 맞다. 없어도 되고 여러개 있어도 된다. /ab*c/는 "abbbc"와 맞다.
"ac"와도 맞다. 하지만, "ax"와는 맞지 않는다.
|
+
|
앞 문자가 1번 이상 있으면 맞다. 1개 이상 있어야 하고 여러개 있어도 된다. /ab+c/는 "abbbc"와 맞다.
하지만, "ac"와는 맞지 않는다.
|
?
|
앞 문자가 0번이나 1번은 있어야 맞다. /ab?c/는 "abc"와 맞고
"ac"와도 맞다. 하지만, "abbc"와는 맞지 않는다.
|
.
|
개행문자(\n)외에 모든 문자이면 맞다.
/.c/는 "Xc", "1c"와 맞다. 하지만, "ca", "\\nc"와는 맞지 않는다. (\\n은 \n의 뜻이다. 특수문자로
사용되는 \를 문자로 표현하기 위해서 앞에 \를 붙여준다. )
|
(x)
|
문자 'x'를 검색하고 맞으면 'x'를 기억한다. /a(bc)/는 "abcd"에서 검색되고 "bc"를 기억한다. 이 기억된 것은
RegExp 객체의 $1에서 $9까지로 또는 배열 [1]에서 기억된 숫자 [n]개 까지로 호출될 수 있다.
|
x|y
|
'x'나 'y'가 있으면 맞다. /abc|xx/는 "abc ZZZ"나 "xx ZZZ"와 맞다.
|
{n}
|
앞 문자가 n개 있으면 맞다. n은 양수 정수이다. /X{2}/는 "abcXX"와 맞다.
"abcXXX"와도 맞고 처음 2개의 "XX"가 검색된다.
|
{n,}
|
앞 문자가 최소한 n개 있으면 맞다. n은 양수 정수이다. /X{2,}/는 "abcXX"와 맞다.
"abcXXX"와도 맞고 3개의 "XXX"가 검색된다.
|
{n,m}
|
앞 문자가 최소한 n번에서 m번까지 있다면 맞다. /a{1,3}/은 "ab", "aaab"와 맞다.
|
[xyz]
|
xyz 중에서 아무런 문자가 있어도 맞다. 이것은 [x-z]과 같은 지정이다.
|
[^xyz]
|
xyz 중에서 하나의 문자라도 없으면 맞다. 이것은 [^x-z]과 같은 지정이다.
|
[\b]
|
backspace
|
\b
|
공백같은 것으로 단어의 경계되는 부분에 있는 문자이다. /\bX/는 "Xxx"와 맞다. /X\b/는 "xxX"와 맞다.
|
\B
|
\b와 반대이다. 단어 경계에 있지 않은 문자만 맞다.
/X\Bz/는 "XXz Xzz"에서 두번째의 "Xz"가 검색된다.
|
\cX
|
control-X 문자와 맞다. /\cM/은 control-M 문자이다.
|
\d
|
숫자는 맞다. [0-9]와 같은 지정이다. /\d/는 "hi5"에서 "5"를 검색한다.
|
\D
|
숫자가 아닌 것은 맞다. [^0-9]와 같은 지정이다. /\D/는 "hi5"에서 "h"를 검색한다.
|
\f
|
form-feed(\f) 문자와 맞다.
|
\n
|
linefeed(\n) 문자와 맞다.
|
\r
|
carriage return(\c) 문자와 맞다.
|
\s
|
space, tab, form feed, line feed를 가지고 있는 white space 문자와 맞다.[ \f\n\r\t\v]와
같은 지정이다. /\s\w*/는 "abc Xz"에서 "Xz"를 검색한다.
|
\S
|
white space 문자가 아닌 하나의 문자이다.
[^ \f\n\r\t\v]와 같은 지정이다. /\S\w*/는 "abc Xz"에서 "abc"를 검색한다.
|
\t
|
tab 문자
|
\v
|
vertical tab 문자
|
\w
|
underscore(_)문자를 포함하는 알파벳과 숫자 0에서 9까지의 문자.
[A-Za-z0-9_]와 같은 지정이다.
|
\W
|
\w의 반대이다. [^A-Za-z0-9_]와 같은 지정이다.
/\W/는 "50%"에서 "%"를 검색한다.
|
\n
|
n은 양수 정수이다. ()로 묵은 것을 지정한다. \1은 RegExp.$1, \2는 RegExp.$2의 값을 사용한다.
/ab(c)de\1/은 "abcdec"와 맞다.
|
\o숫자, \x숫자
|
escape문자로 ASCII codes 값을 넣을 수 있게한다. 8진, 16진 10진수를
넣을 수 있다.
|
반응형
'개발도 하냐?' 카테고리의 다른 글
mod_security AND fckeditor (0) | 2010.06.21 |
---|---|
Prototype URL encode, decode (0) | 2010.06.19 |
HTTP 응답코드 (0) | 2010.06.13 |
CakePHP Framework (0) | 2010.06.09 |
editplus setting (0) | 2010.06.06 |