Google Search Console의 REGEX에 대한 전체 가이드

Google Search Console(GSC)은 SEO 전문가들이 웹사이트의 성과를 분석하고 이해하는 데 필수적인 도구입니다.

정규 표현식(REGEX) 기능의 추가로, 콘텐츠에서 유의미한 통찰력을 얻는 동시에 새로운 아이디어를 구상하는 방식이 혁신적으로 개선되었습니다.

REGEX 기능은 웹 분석 분야에서 오랫동안 기다려온 기능으로, 이전에는 어렵거나 불가능했던 특정 URL 요소들을 필터링하는 것을 가능하게 했습니다.

이 글에서는 Google Search Console에서 REGEX를 활용하는 팁과 요령을 소개합니다. 또한, 원하는 분석 결과를 얻기 위해 REGEX 코드와 함께 사용되는 다양한 연산자 세트에 대해서도 자세히 알아보겠습니다.

REGEX, 즉 정규 표현식: 개요

Google Search Console은 웹사이트 운영자들이 웹사이트의 성과를 관리할 수 있도록 제공되는 무료 서비스입니다. 웹사이트의 클릭률, 노출 수, 클릭 수🖱️, 키워드 순위 등 SEO 캠페인의 성공 여부를 판단하는 데 필요한 상세한 정보를 제공합니다.

그러나, URL의 성과를 필터링하는 데에는 기존에 한계가 있었습니다. GSC는 분석을 위해 최대 1,000개의 행만 추출할 수 있었고, 복잡한 문자열이나 변형은 누락되기 쉬웠습니다. 경로, 도메인 속성 또는 접두사 등 URL의 특정 부분만 필터링하는 것이 가능했습니다.

정규 표현식(Regex)은 GSC에 새롭게 추가된 매우 효과적인 기능입니다. SEO 전문가들이 GSC를 활용하여 웹사이트의 작동 방식과 성과에 대한 더 깊은 통찰력을 얻을 수 있도록 지원하는 것이 목적입니다.

Regex를 사용하면 페이지 또는 쿼리 필터에 특정 코드를 적용하여 웹사이트의 중요한 SEO 정보들을 찾아낼 수 있습니다. 이러한 코드는 필터링 매개변수와 관련된 문자열을 묶는 특수 문자인 메타문자로 구성됩니다. Regex 코드를 입력하면, 결과가 패널에 표시되며, 필요에 따라 저장하여 참조할 수도 있습니다.

GSC에서 Regex 사용 시 이점

Google Search Console을 활용하는 주요 목적은 기술적인 관점에서 웹사이트를 분석하는 것입니다. SEO 팀은 검색 엔진에서 웹사이트의 순위를 높이고 트래픽을 유도하기 위한 최적화 전략을 수립하기 위해 다양한 도구와 기법들을 사용합니다.

Regex는 유용한 데이터를 수집하는 과정을 더 효율적으로 만들어, 최적화 계획을 개선하는 데 도움이 되는 다양한 이점을 제공합니다. Regex 보고서를 통해 해석할 수 있는 내용은 다음과 같습니다.

✨ 정규 표현식 코드를 검색어에 적용하면 특정 키워드나 구문에 대한 검색량을 파악할 수 있습니다. 이는 블로그 콘텐츠에 대한 새로운 아이디어를 얻고 더 많은 트래픽을 유도하는 데 도움이 됩니다.

✨ 정규 표현식 코드는 많은 양의 웹 데이터를 처리해야 하는 대기업 SEO 담당자들의 시간을 절약해 줍니다. 몇 개의 메타 문자와 정확한 구문만 있으면, 쿼리나 페이지를 특정 요구 사항에 맞게 분류할 수 있습니다.

✨ Regex의 주요 장점 중 하나는 단어, 문장 및 URL의 일반적인 조합을 처리할 수 있다는 것입니다. 실행 가능한 Regex 코드를 생성하려면, 이러한 문자를 올바른 순서로 배열해야 합니다.

✨ 트렌드에 따른 성과가 좋은 페이지와 저조한 페이지를 포함하여, 웹사이트에 대한 더 깊은 통찰력을 얻을 수 있습니다.

✨ 맞춤형 보고서에 정규 표현식 코드를 적용하여 특정 검색어에 대한 웹페이지의 트래픽 흐름을 추적할 수 있습니다. 이를 통해 팀은 특정 방향으로 작업할 수 있습니다.

Regex 문자의 다양한 조합을 설정하여 코드를 정의하고, 이를 통해 웹사이트 최적화를 위한 해법을 찾을 수 있습니다.

Google Search Console에서 정규 표현식을 어디에 적용하나요?

GSC에서 정규 표현식 기능을 사용하려면, 우선 웹사이트 소유권에 대한 접근 권한이 필요합니다. 이는 필수적인 조건으로, Google Search Console에서 속성을 추가해야만 다른 분석 작업을 진행할 수 있습니다.

Gmail ID로 Google Search Console에 로그인하고, 사이드바의 옵션에서 속성을 추가하여 시작해야 합니다. 속성이란 콘솔에 접근 권한이 있는 웹사이트를 의미합니다.

웹사이트 또는 URL을 추가하면 패널에서 해당 정보를 확인하라는 메시지가 표시됩니다✅. 확인 절차가 완료되면, 속성을 선택하여 추가 분석을 진행할 수 있습니다.

나열된 속성 이름 아래에서 “성과” 매개변수를 클릭하고, 그래프 위에 있는 “새로 만들기” 버튼을 눌러 필터링 옵션을 확인합니다.

쿼리 또는 페이지를 선택하여 결과 필터링에 Regex 코드를 적용할 수 있습니다.

정규 표현식 문자 설명

Google Search Console에서 검색어 및 페이지를 필터링할 때 사용되는 여러 정규 표현식 문자 세트가 있습니다. 각 메타 문자는 필터에서 서로 다른 의미를 나타냅니다. Regex를 잘 이해하면 GSC를 분석하는 것이 어렵지 않습니다.

다음 표에서는 Regex 코드에 사용되는 일부 기호와 문자를 예시와 함께 설명합니다.

문자	사용법	예시
()	괄호는 캡처 그룹이라고도 하며, 문자 또는 표현식을 그룹화하는 데 사용됩니다.	(Geek) 제목이나 태그 시작 부분에 "Mobile"이라는 단어가 포함된 모든 웹페이지를 가져옵니다.
\|	코드에 선택 사항을 적용하는 데 사용되는 OR 기호입니다.	모바일\|PC 보고서는 두 단어 중 하나가 포함된 모든 페이지를 가져옵니다.
^	캐럿 기호는 문자열 시작 부분에 있는 단어나 문구에만 일치합니다.	^Mobile 제목이나 태그 시작 부분에 "Mobile"이라는 단어가 있는 모든 웹페이지가 표시됩니다.
$	달러 기호는 문자열 끝에 있는 단어나 문구에만 일치합니다.	Mobile$ 제목이나 태그 끝에 "Mobile"이라는 단어가 있는 모든 웹페이지가 표시됩니다.
.	마침표 기호는 문자열의 단일 문자를 일치시키는 데 사용됩니다.	to. 제목이나 태그 끝에 "Mobile"이라는 단어가 있는 모든 웹페이지가 표시됩니다.
\	백슬래시는 문자의 리터럴 의미를 건너뛰는 데 사용됩니다.	\d 이것은 숫자 0-9가 있는 페이지와 일치합니다.
[xyz]	이 RegEx 코드는 괄호 안에 있는 문자 중 하나 또는 모두와 쿼리를 일치시킵니다.	mobile[xyz] 코드는 mobilex, mobilezy 및 mobilezxy와 같이 x, y 또는 z와 mobile의 조합으로 모든 단어가 포함된 페이지와 일치합니다.
[c-m]	이 RegEx 코드는 c와 m 사이에 있는 소문자 또는 대문자와 쿼리를 일치시킵니다.	Mobile[c-m] 코드는 mobilecjg, mobileeel, mobilecdf 등이 있습니다.
[3-7]	이 RegEx 코드는 3에서 7 사이의 숫자가 포함된 쿼리와 일치합니다.	모바일[0-9] 코드는 모바일과 3에서 7 사이의 숫자가 결합된 모든 단어가 있는 페이지와 일치합니다. mobile73, mobile654, mobile445 등이 있습니다.
[\w]	웹페이지의 모든 단어와 "to" 문자(예:ward, into, to)가 일치합니다.	[\w]*이동하는[\w] 백슬래시 뒤에 괄호 안에 소문자 "w" 문자가 옵니다. 이는 문자(소문자 및 대문자 모두), 숫자 또는 밑줄과 같은 모든 단어나 문자와 일치합니다.
[\W]	제목, 메타 또는 기사(예: 모바일폰, 모바일 앱)에서 "mobile"이라는 단어가 있는 페이지를 다른 단어와 일치시킵니다.	[\W]*이동하는[\W] 백슬래시 뒤에 대문자 "W"가 괄호 안에 표시됩니다. 문자나 숫자를 제외한 모든 항목과 일치합니다. 공백 문자 및 ?: # @ $%와 같은 기호를 의미합니다.

이러한 문자를 조합하여 GSC에서 복잡한 쿼리를 필터링할 수 있습니다.

Google Search Console의 특정 정규 표현식

Google Search Console의 메타문자를 사용하여 특정 목적을 달성하는 고유한 패턴이나 코드를 생성할 수 있습니다. GSC 포털에서 시도해 볼 수 있는 몇 가지 기능은 다음과 같습니다.

🔶 ^[\w\W\s\S]{70,}$

이 코드는 페이지의 모든 단어, 숫자, 단어가 아닌 문자 또는 특수 문자, 기호, 공백, 흰색이 아닌 줄 또는 새 줄과 일치합니다. 한정자 "70"은 문자열이 70자 이상임을 나타냅니다.

예: 이러한 유형의 코드는 비밀번호 확인, 상세 설명으로 제품 목록 정렬 또는 다른 곳에 적용할 수 있습니다.

🔶 (\w+\s){6,}\w+

이 Regex 코드에는 세 개의 섹션이 있습니다. 단어와 숫자 사이의 공백을 일치시키는 것을 목표로 합니다. 따라서 코드는 "최소 6단어 이상의 문자열입니다."와 같이 최소 6단어 이상인 문자열을 가져옵니다.

예: 이 코드는 긴 제목, 긴 소셜 미디어 댓글 등의 기사를 필터링하는 데 적용할 수 있습니다.

🔶 ^(누가|무엇을|어디에서|언제|왜|어떻게)[“ “]

이 Regex 코드는 간단하면서도 블로거와 SEO 전문가에게 매우 유용합니다. 이 단어로 시작하는 검색 엔진의 모든 쿼리와 일치한다는 것을 쉽게 이해할 수 있습니다. 괄호 안에는 "누가", "무엇을", "어디서" 등이 표시됩니다. 문자열은 다음 단어로 시작하고 그 뒤에 공백이 와야 합니다. 따라서 "그러나", "전체" 등과 같은 단어는 가져오지 않습니다.

예: 이 코드는 시장 동향과 사용자의 토론을 이해하여 새로운 콘텐츠 아이디어를 얻는 데 적합합니다.

🔶 "누가|무엇을|어디에서|언제|왜|어떻게"

위에서 설명한 Regex 코드와 유사하지만, 문자열이 이러한 단어로 시작하는지 여부에 관계없이 함수가 이러한 단어를 포함하는 모든 문자열과 일치합니다.

예: 이 코드는 의심스러운 진술을 강조하고 사용자 입력을 필터링하는 데 적합합니다.

🔶 .*

별표가 뒤따르는 메타 문자 마침표를 와일드카드 표현식이라고 부르는 경우가 많습니다. 이 코드 아래에 특정 문자열을 넣어 일치시키는 데 사용할 수 있기 때문입니다.

예: Regex .*Android.*는 Android라는 단어가 포함된 속성의 모든 페이지를 가져옵니다. 필터에 .* 코드를 직접 사용하면 한 달 동안 검색 엔진에 나타나는 모든 페이지를 추출합니다.

🔶 [^\/\.\-:0-9A-Za-z_]

캐럿 기호 다음에는 백슬래시가 옵니다. 백슬래시는 코드에 지정된 문자를 제외합니다. 여기서 코드는 슬래시, 숫자, 마침표, 콜론, 하이픈 및 모든 대문자와 소문자를 포함하지 않는 문자열과 일치합니다.

예: 따라서 이 코드는 &%$@와 같은 특수 문자가 포함된 URL, 메타 설명 또는 콘텐츠를 캡처하는 데 적용할 수 있습니다.

특정 섹션이 포함된 긴 정규 표현식 코드입니다. 코드 시작 부분에 사용된 문자 "?i"는 대소문자를 구분하지 않는 플래그입니다. 이는 코드가 대문자 또는 소문자에 관계없이 문자열과 일치함을 의미합니다. 그 뒤의 괄호에는 파이프(OR) 문자로 구분된 일부 단어가 포함되어 있습니다.

Regex 코드는 'scum' 또는 'Reliable'과 함께 'is' 또는 'are', 'Brand', 'Company' 또는 'Site'라는 단어를 포함하는 암시된 문자 대소문자에 관계없이 쿼리를 감지합니다.

예: 이 Regex 코드는 고객 쿼리 패턴을 찾는 데 신중하게 사용할 수 있습니다. 웹사이트에 긍정적인 리뷰가 있는지 부정적인 리뷰가 있는지 알 수 있습니다.

🔶 (kwd1|kwd2).*

이는 GSC가 kwd1 또는 kwd2라는 단어 뒤에 다른 문자나 숫자가 오는 페이지나 쿼리를 필터링하는 분리 정규 표현식 코드의 단순화된 사용법입니다.

예: 패턴을 사용하여 URL, 제목, 메타 또는 콘텐츠의 다른 단어나 숫자와 이러한 단어가 연결된 웹사이트의 페이지를 추출할 수 있습니다.

🔶(키워드1 및 키워드2)

이 코드는 접속사 표현의 명확한 예입니다. "AND"는 Regex 코드에 사용되는 연산자입니다. 주어진 두 단어가 동일한 순서로 포함된 페이지를 가져오는 데 사용됩니다.

예: GSC에 코드를 적용하여 두 개의 특정 단어가 동일한 순서로 포함된 페이지, 제목 또는 메타를 가져올 수 있습니다.

🔶 "키워드1 키워드2"

이 코드는 웹페이지에서 구문이나 단어의 정확한 순서를 일치시키는 데 적합합니다.

예: 제목, 설명 또는 특정 문구가 포함된 콘텐츠가 있는 페이지를 찾으려면 GSC에 코드를 적용하세요.

🔶 (키워드1 | 키워드2)

이 코드에는 두 단어와 파이프 문자가 있습니다. 이는 GSC가 "Keyword1" 또는 "Keyword2" 중 하나만 포함하고 둘 다 포함하지 않는 웹사이트 페이지를 표시한다는 것을 의미합니다.

예: 파이프 문자로 구분된 두 개 이상의 단어 중 하나가 포함된 페이지를 웹사이트에서 추출하려면 코드를 적용하세요.

🔶 (키워드1)\b(키워드2)\b

이 정규 표현식 코드에는 단어 경계를 나타내는 문자 "\b"가 포함된 두 개의 특정 단어가 있습니다. 이 두 단어가 포함된 페이지가 제공되며 그 사이에는 다른 단어, 숫자 또는 문자가 없습니다.

예: GSC 필터에서 이 코드를 사용하면 연속된 두 개의 별도 단어가 있는 페이지에 대해 알 수 있습니다.

🔶 (키워드1)\w+(키워드2)

코드에는 중간에 메타 문자 "\w+"가 있는 두 단어가 포함되어 있습니다. 여기서 "w"는 소문자입니다. 따라서 사이에 있는 단어 수에 관계없이 제목, 설명, 내용 등 이 두 단어가 포함된 모든 페이지를 가져옵니다.

예: 이 코드를 적용하면 제목, 콘텐츠 또는 메타에 적어도 이 두 단어가 포함된 웹사이트의 모든 페이지를 추출할 수 있습니다.

🔶 (키워드)\bpphrase

문자열을 괄호 안의 단어와 일치시키고 그 뒤에 단어 문구가 오는 간단한 Regex 코드입니다. 메타문자 “\b”는 단어 경계를 의미하거나 주어진 단어 사이에 다른 문자가 없음을 나타냅니다.

예: GSC의 이 Regex 코드는 "키워드 구문"과 같이 기사의 어느 위치에서나 주어진 단어가 연속적으로 포함된 페이지를 전달합니다.

이 Regex 코드는 파이프 문자로 구분된 여러 URL "a,b,c,e,g….."를 나열합니다. 따라서 이러한 URL 중 하나가 포함된 문자열을 필터링합니다.

예: GSC 패널에 이러한 패턴을 적용하여 제목이나 기사에 특정 URL이 있는 웹페이지를 얻을 수 있습니다.

🔶 ^(사과|공|고양이|오리 농장)$

주어진 코드는 문자열의 시작 부분이 "apple, ball, cat, or duck farm"이라는 주어진 단어 중 하나와 일치함을 의미합니다. 파이프 문자가 두 단어를 구분하기 때문입니다. 또한 다른 단어나 문자가 없음을 보장합니다.

예: 이 코드를 사용하면 처음에 특정 키워드가 있는 페이지에 대한 세부정보를 얻을 수 있습니다.

🔶 .*\/$

주어진 Regex 코드는 단어든 숫자든 모든 문자열을 캡처하는 것을 목표로 하지만 슬래시로 끝나야 합니다.

예: 슬래시로 끝나는 URL이 있는 페이지를 일치시키는 데 사용할 수 있습니다.

🔶 .(최고|상위|vs|리뷰).*

이 코드는 주어진 단어(파이프 문자로 구분) 중 하나와 연속되는 다른 단어, 숫자 또는 특수 문자와 함께 시작 부분에 마침표가 있는 문자열과 일치합니다.

예: 상업 보고서에서 이러한 Regex 패턴을 사용하여 시장 동향을 이해할 수 있습니다.

🔶 (구매|저렴|가격|구매|주문).

이 코드는 파이프 문자로 구분된 주어진 단어 중 하나가 있고 그 뒤에 다른 단어, 숫자 또는 문자가 오는 문자열과 일치합니다.

예: 이러한 코드는 웹사이트 제품과 관련된 거래 검색 또는 쿼리를 일치시키는 데 유용합니다.

이러한 코드에는 괄호 안의 단어 조합과 그 사이의 파이프 문자가 있습니다.

첫 번째 Regex는 "face"라는 단어 뒤에 "b" 또는 "be"가 있고 "ook"로 끝나는 문자열과 일치합니다. 따라서 가져온 페이지에는 facebook 또는 Facebeook이라는 단어가 포함됩니다.

두 번째 Regex는 "f"라는 단어 뒤에 "a" 또는 "e", "ce", "b" 또는 "be"가 뒤따르고 "ook"로 끝나는 문자열을 일치시킵니다. 따라서 가져온 페이지에는 facebook, fecebook, facesbeook 또는 fecebeook와 같은 하나의 조합이 포함됩니다.

세 번째 Regex는 "fa"라는 단어 뒤에 "c" 또는 "s", "e" 또는 "I"가 있고 "book"으로 끝나는 문자열과 일치합니다. 따라서 가져온 페이지에는 facebook, facibook, fasebook 또는 fasibook과 같은 하나의 조합이 있습니다.

예: 이러한 코드를 사용하여 웹페이지의 잠재적인 철자 오류를 일치시킬 수 있습니다.

🔶 .wp-.

주어진 코드는 마침표 뒤에 "wp-" 뒤에 다른 문자가 오는 문자열과 일치합니다.

예: WordPress URL이 포함된 페이지를 추출하는 데 적합합니다.

🔶 .*/url-1/.* 대 .*/url-2/.*

주어진 코드에는 비교 정규 표현식 문자가 포함된 두 개의 서로 다른 URL이 있습니다. 측정항목을 비교하기 위해 웹사이트에서 두 개의 특정 URL을 가져옵니다.

예: 이 코드를 적용하면 사이트의 두 특정 웹페이지 간의 트래픽, 사용자 증가율 및 기타 진행 상황을 비교할 수 있습니다.

기타 흔하지 않은 정규 표현식

🔺 (?i)\b키워드\b

이 코드는 "키워드"라는 단어가 포함된 문자열과 일치합니다. 검색은 웹페이지에 있는 단어의 대소문자 구분에 관계없이 이루어집니다.

🔺 "문구"

이 코드는 단순히 "문구"라는 단어가 포함된 페이지와 일치합니다.

🔺 \w{5}

이 코드는 5단어 문자가 포함된 쿼리와 일치합니다.

🔺 \d{3}

이 코드는 정확히 3자리 숫자로 구성된 쿼리와 일치합니다.

🔺 ([^” “]*)

이 Regex 코드는 따옴표 안에 문자가 없는 문자열과 일치합니다.

🔺 (?i)\b(키워드1|키워드2|키워드3)\b

이 주어진 코드는 파이프 문자로 구분된 단어 중 하나가 대문자 또는 소문자로 된 문자열과 일치합니다.

🔺 \W+

이 코드는 단어가 아닌 문자, 일반적으로 특수 문자와 일치합니다.

🔺 \d{3,5}

이 코드는 숫자가 3자리에서 최대 5자리인 모든 문자열과 일치합니다.

🔺 \b\w+\b

이 코드는 단어 경계가 있는 단어 문자 수와 일치합니다.

최종 단어

Google 검색 엔진은 성능 필터에 정규 표현식 코드를 도입한 이후로 방대한 정보의 원천이 되었습니다. 필요한 것은 분석 보고서를 추출하기 위해 코드 구조를 이해하는 것뿐입니다.

패널에 여러 Regex 코드를 만들어 웹사이트 성능에 대한 고유한 세부 정보를 얻고 이를 활용하여 더 나은 결과를 얻을 수 있습니다.

다음으로, 온라인 검색 능력을 향상하는 데 도움이 되는 Google 검색 요령을 확인해 보시기 바랍니다.