정규식(Regular Expression)은 문자열에서 패턴을 찾거나 변경하는 데 사용되는 강력한 도구입니다. 여기에서는 정규식의 기본적인 예제를 소개하고, 각 예제가 어떻게 작동하는지 쉽게 설명해 드리겠습니다.
1. 숫자만 찾기
숫자만 포함된 문자열을 찾으려면 다음 정규식을 사용합니다:
\d+
\d는 숫자를 의미하고, +는 하나 이상의 숫자가 연속된 부분을 찾겠다는 뜻입니다.
예시:
123, abc123, 45, 78
2. 특정 단어 찾기
특정 단어를 찾으려면 해당 단어를 그대로 정규식에 사용합니다:
apple
위 정규식은 문자열에서 "apple"이라는 단어가 포함된 부분을 찾습니다. 대소문자는 구분합니다.
3. 이메일 주소 찾기
이메일 주소를 찾는 정규식은 다음과 같습니다:
^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$
^는 문자열의 시작을, $는 문자열의 끝을 나타냅니다. 이 정규식은 이메일 주소 형식을 확인할 수 있습니다.
예시:
example@example.com, test123@domain.org
4. 전화번호 형식 찾기
전화번호 형식을 찾으려면 다음과 같은 정규식을 사용할 수 있습니다:
^\d{3}-\d{3,4}-\d{4}$
\d는 숫자를 의미하고, {3}은 숫자가 3개가 연속되어야 한다는 의미입니다. 이 정규식은 일반적인 전화번호 형식을 찾습니다.
예시:
010-1234-5678
5. 정규식 특수 문자 정리
정규식에서 사용되는 주요 특수 문자와 그 의미는 다음과 같습니다:
- ^ : 문자열의 시작
- $ : 문자열의 끝
- . : 임의의 한 문자
- * : 앞 문자가 0번 이상 반복
- + : 앞 문자가 1번 이상 반복
- ? : 앞 문자가 0번 또는 1번 등장
- {n} : 정확히 n번 반복
- {n,} : 최소 n번 반복
- {n,m} : 최소 n번, 최대 m번 반복
- [] : 문자 클래스 (예: [a-z]는 소문자 a부터 z까지 포함)
- | : OR 연산 (예: cat|dog는 "cat" 또는 "dog"를 찾음)
- \d : 숫자 (0-9)
- \D : 숫자가 아닌 문자
- \s : 공백 문자 (스페이스, 탭 등)
- \S : 공백이 아닌 문자
- \w : 단어 문자 (알파벳, 숫자, _ 포함)
- \W : 단어 문자가 아닌 문자
- \\ : 백슬래시 자체를 의미