JavaScript, Python, PHP, Golang, Ruby 등을 위한 10개의 RegEx 테스터

정규 표현식은 고통스러울 수 있습니다. 글쎄, 가끔!

정규식과 그 패턴에 대해 알아봅시다. 우리는 복잡한 문자 수프처럼 보이는 그러한 패턴을 조사할 것입니다. 정규식의 모든 문자가 의미하는 바를 볼 것입니다.

이 기사를 읽고 나면 정규 표현식을 만들고 원하는 대로 사용할 수 있습니다. 마지막으로 요구 사항에 따라 RegEx를 만들고 이러한 도구를 사용하여 테스트할 수 있도록 일부 온라인 RegEx 테스트 도구도 나열합니다.

소개

정규식 또는 일반적으로 알려진 대로 RegEx는 문자 또는 문자열을 검색하기 위한 패턴으로 사용할 수 있는 모든 문자 시퀀스입니다.

예를 들어 – 문자열이나 구에 “apple”이라는 단어가 포함되어 있는지 확인하기 위해 정규식 “/apple”을 사용하여 문자열 내에서 검색할 수 있습니다. 또 다른 예로 “/[0-9]”는 주어진 문자열에 0과 9 사이의 숫자가 포함되어 있는지 확인합니다.

정규 표현식과 그 사용법

정규식은 현대의 웹 관련 작업에서 다양한 목적으로 널리 사용됩니다. 웹 양식의 유효성 검사, 웹 검색 엔진, IDE의 어휘 분석기, 텍스트 편집기 및 문서 편집기는 정규식이 자주 사용되는 몇 가지 예입니다.

우리는 모두 “CTRL + F”를 여러 번 사용하여 문서 또는 코드 내에서 특정 단어나 구 또는 표현을 찾기 위해 검색했습니다. 이 작업은 정규식 사용의 매우 일반적인 예라고 할 수 있습니다.

계속 진행하기 전에 매우 일반적으로 사용되는 정규식을 살펴보겠습니다.

🤔 아래의 RegEX가 무엇에 사용되는지 추측할 수 있습니까?

^([a-zA-Z0-9_-.]+)@([a-zA-Z0-9_-.]+).([a-zA-Z]{2,5})$

추측할 수 없더라도 걱정하지 마십시오. 나는 당신이 이 기사의 끝에서 추측할 수 있을 것이라고 확신합니다.

먼저 RegEx의 A, B, C부터 시작하겠습니다.

토큰

먼저 위에 표시된 Regex의 다양한 기호를 살펴보겠습니다.

^([a-zA-Z0-9_-.]+)@([a-zA-Z0-9_-.]+).([a-zA-Z]{2,5})$

위에 주어진 정규식을 보면 많은 기호나 문자 또는 토큰으로 구성되어 있음을 알 수 있습니다. 그들이 의미하는 바를 알아보자:

  PC에서 포켓몬 게임을 하는 방법

토큰

의미

^^

이 토큰은 문자열의 시작을 나타냅니다.

(…)

이것은 (…) 안에 주어진 모든 것이 캡처되는 그룹을 나타냅니다.

[…]

그만큼 [] 일치할 수 있는 문자를 묶습니다. 예를 들어 – [abc] 또는 b 또는 c와 일치합니다.

아즈

z에서 소문자 알파벳 세트. Regex는 대소문자를 구분한다는 점을 명심해야 합니다.

AZ

A부터 Z까지의 대문자 집합입니다.

0-9

0에서 9까지의 숫자입니다.

_

이것은 문자 _와 일치합니다.

이스케이프 문자입니다.

.

“.” 문자와 일치합니다. 문자 그대로. 기호 “.” 때문에 사용됩니다. 정규식에서 자체적으로 모든 문자와 일치하는 토큰입니다.

+

이것은 수량자입니다. 이것은 함께 사용되는 하나 이상의 문자와 일치합니다. 예를 들어, a+는 문자 a가 한 번 이상 나타남을 의미합니다.

이것은 “-” 문자와 일치합니다.

@

이것은 “@” 문자와 일치합니다.

{}

이것은 또 다른 수량자입니다. 문자의 발생 횟수를 나타내는 데 사용됩니다. 예를 들어, a{3}는 정확히 3개의 a를 의미합니다.

$

이것은 문자열의 끝을 나타냅니다.

주어진 정규식 패턴 분석

이제 토큰에 대한 사전 지식으로 무장하고 위의 정규식을 디코딩해 보겠습니다.

  • <작은><스팬 스타일=”색상: #ff0000;”><스팬 스타일=”색상: #000000;”>^([a-zA-Z0-9_-.]+)은 하나 이상의 대문자 또는 소문자 영숫자, 밑줄, 하이픈 또는 점으로 시작하는 문자열을 찾고 있음을 의미합니다. 예를 들어 user_name.01과 비슷하게 보이는 모든 것이 패턴과 일치합니다. 우리는 여기에 모든 기호를 포함할 필요가 없다는 것을 기억해야 합니다. [a-zA-Z0-9_-.] 할 것이다.
  • @ 문자는 @의 단일 발생과 일치합니다. 이전 예에 추가하면 다음과 같습니다. [email protected] 잘 맞을 것이다.
  • ([a-zA-Z0-9_-.]+) 첫 번째 점과 유사합니다. 또한 하나 이상의 영숫자 문자, 밑줄, 하이픈 또는 점을 포함하는 문자열을 찾고 있음을 의미합니다. 예를 추가하면, [email protected] 여기에 적합합니다.
  • 이미 짐작하셨겠지만 이메일 패턴을 암시하고 있습니다. 계속, . 단일 “.”와 일치합니다. 캐릭터. 진행 중인 예제를 계속 진행하면 다음과 같이 됩니다. [email protected]
  • ([a-zA-Z]{2,5})$ 이것은 문자열이 대문자 또는 소문자로 2~5개의 알파벳 문자로 끝나야 함을 의미합니다. 이전 예에 .com을 추가하면 다음을 얻을 수 있습니다. [email protected]이메일 문자열의 일반적인 패턴입니다.

위의 모든 것을 결합하면 이메일 ID 문자열을 검색하고 있음을 알 수 있습니다. 이제 이 표현식을 사용하여 이메일 ID를 확인할 수 있습니다. 테스트 이메일 ID가 이 패턴과 일치하면 유효한 이메일 ID라고 말할 수 있습니다.

추신 – 웹에서 가장 일반적인 이메일 ID에 대한 패턴입니다.

토큰 유형

많은 토큰을 Regex 내에서 다양한 조합으로 사용하여 다양한 표현을 설명할 수 있습니다. 아래에서는 정규식에서 사용되는 다양한 유형의 토큰을 살펴보겠습니다. 또한 각 범주에서 가장 일반적으로 사용되는 토큰도 살펴보겠습니다.

기본 토큰

기본 토큰부터 시작하겠습니다. 이 토큰은 거의 모든 정규식과 함께 사용됩니다. 그러므로 우리는 그들에 대해 먼저 배워야 합니다.

토큰

의미

아르 자형

이것은 캐리지 리턴 문자와 일치합니다.