SEO용 URL 매개변수에 대한 종합 가이드

URL 매개변수 완벽 가이드: SEO 최적화 전략

웹사이트 주소(URL)에 추가되는 매개변수는 콘텐츠 필터링, 정보 구성, 그리고 사용자 행동 추적에 중요한 역할을 합니다. 하지만, 이 매개변수들은 콘텐츠 중복이나 크롤링 예산 낭비와 같은 SEO 문제를 야기할 수도 있습니다. 이 글에서는 URL 매개변수에 대해 자세히 알아보고, SEO 문제를 해결하는 방법을 제시합니다.

본격적인 논의에 앞서, URL이 무엇인지부터 명확히 짚고 넘어가겠습니다.

URL은 웹페이지의 주소로, ‘Uniform Resource Locator’의 약자입니다. 주소창이나 검색 엔진에 URL을 입력하면 해당 웹사이트나 페이지로 이동합니다.

URL은 일반적으로 다음과 같은 다섯 가지 주요 부분으로 구성됩니다.

예시: https://www.example.com/blog/url-parameters

위 URL의 각 부분을 살펴보면:

1. 프로토콜 (규약): http:// 또는 https:// 와 같이 웹을 통해 데이터를 전송하는 데 필요한 규칙을 의미합니다.

2. 도메인: 웹사이트의 이름으로, 웹사이트를 운영하는 주체(개인 또는 단체)를 나타냅니다. 위의 예시에서는 example이 도메인 이름입니다.

3. 하위 도메인: 웹사이트 내 구조를 구분하는 데 사용됩니다. www. 가 일반적인 하위 도메인이며, 동일한 웹사이트에서 여러 종류의 콘텐츠를 제공할 때 유용합니다.

예를 들어, 회사는 store.domain.com이나 shop.domain.com과 같이 여러 하위 도메인을 운영할 수 있습니다.

4. 최상위 도메인 (TLD): 도메인 이름 뒤에 오는 부분으로, .com, .org, .gov, .biz 등이 일반적입니다.

5. 경로: 찾고자 하는 정보나 콘텐츠의 정확한 위치를 나타냅니다. 위 예시에서는 blog/url_parameters가 경로입니다.

이처럼 URL의 각 부분은 정보 검색에 필요한 값을 제공합니다.

그런데, URL이 단순히 웹페이지를 찾는 것 외에 정보 교환에도 사용된다는 것을 알고 계셨나요?

바로 URL 매개변수가 그 역할을 담당합니다.

URL 매개변수란 무엇인가?

URL 주소에서 물음표 (?), 등호 (=), 앰퍼샌드 (&)와 같은 특수 문자를 보신 적이 있으신가요?

예를 들어, “마케팅”이라는 검색어를 입력했을 때 주소가 다음과 같이 나타난다고 가정해 봅시다:

www.example.com/search?q=마케팅

여기서 물음표 (?) 뒤에 나타나는 문자열을 “URL 매개변수” 또는 “쿼리 문자열”이라고 합니다. 물음표는 URL을 해석할 때 쿼리 문자열의 시작을 알리는 역할을 합니다.

URL 매개변수는 데이터가 많은 웹사이트, 특히 쇼핑몰이나 전자상거래 웹사이트에서 사용자가 상품을 필터링하거나 정렬하는 데 자주 사용됩니다.

URL 매개변수는 ‘키=값’ 쌍으로 구성되며, 여러 쌍은 앰퍼샌드(&)로 구분됩니다. 키는 데이터의 유형을, 값은 실제 데이터를 나타냅니다.

예를 들어, 전자상거래 웹사이트에서 신발을 검색하는 상황을 생각해 봅시다.

기본 URL은 다음과 같습니다.

https://www.example.com/shoes

여기서 색상으로 필터링을 추가하면 URL은 다음과 같이 변경됩니다.

https://www.example.com/shoes?color=black

(여기서 “color”는 키, “black”은 값)

최신 상품으로 필터링하려면 URL 매개변수를 추가하여 다음과 같이 변경됩니다.

https://www.example.com/shoes?color=black&sort=newest

URL 매개변수는 SEO에 중요한 역할을 하지만, 동일 페이지의 여러 변형을 생성하여 검색 엔진을 혼란스럽게 만들 수 있습니다. 이는 콘텐츠 중복 문제를 야기하고, 결과적으로 Google 검색 결과 순위에 부정적인 영향을 미칠 수 있습니다.

이제 URL 매개변수를 올바르게 사용하여 SEO 문제를 피하는 방법을 알아보겠습니다.

URL 매개변수 사용 방법

URL 매개변수는 페이지를 평가하고 사용자 설정을 추적하는 데 사용됩니다. 다음은 자주 사용되는 URL 매개변수 유형 11가지입니다.

1. 추적: UTM 코드는 유료 캠페인 및 광고 트래픽을 추적하는 데 사용됩니다. 예: ?utm_medium=video15 또는 ?sessionid=173

2. 정렬: 매개변수에 따라 항목을 정렬합니다. 예: ?sort=reviews_highest 또는 ?sort=lowest-price

3. 번역: URL 문자열은 선택한 언어의 이름으로 끝납니다. 예: ?lang=en 또는 ?language=de

4. 검색: 웹사이트에서 결과를 검색합니다. 예: ?q=검색어 또는 ?search=드롭다운옵션

5. 필터링: 유형, 이벤트, 지역 등 고유한 필드에 따라 필터링합니다. 예: ?type=셔츠&color=검정 또는 ?price_range=10-20

6. 페이지 매김: 온라인 상점 페이지의 콘텐츠를 여러 페이지로 나눕니다. 예: ?page=3 또는 ?pageindex=3

7. 식별: 갤러리 페이지를 크기, 카테고리 등으로 구성합니다. 예: ?product=white-shirt, ?category=정장, 또는 ?product_id=123

8. 제휴 ID: 제휴 링크를 추적하는 데 사용되는 고유 식별자입니다. 예: ?id=12345

9. 광고 태그: 광고 캠페인 성과를 추적합니다. 예: ?utm_source=이메일캠페인

10. 세션 ID: 웹사이트 내에서 사용자 행동을 추적합니다. 일반적으로 전자상거래 웹사이트에서 구매자 여정을 확인하는 데 사용됩니다. 예: ?session_id=4321

11. 동영상 타임스탬프: 동영상의 특정 타임스탬프로 이동합니다. 예: ?t=60

이제 매개변수화된 URL로 인해 발생할 수 있는 문제를 살펴보겠습니다.

URL 매개변수로 인한 주요 SEO 문제점

잘 구조화된 URL은 사용자가 웹사이트의 계층 구조를 이해하는 데 도움이 되지만, 너무 많은 매개변수를 사용할 경우 SEO 문제가 발생할 수 있습니다.

URL 매개변수로 인해 발생하는 가장 흔한 문제를 알아보겠습니다.

크롤링 예산 낭비

웹사이트에 매개변수 기반 URL이 많으면 Google은 동일 페이지의 다양한 버전을 크롤링하게 됩니다. 이는 크롤러가 불필요하게 대역폭을 소모하거나 크롤링을 중단하게 만들어 웹사이트 품질에 대한 잘못된 신호를 보낼 수 있습니다.

콘텐츠 중복

매개변수는 검색 엔진 봇이 동일한 웹페이지의 여러 버전을 크롤링하도록 유도하여, 서로 다른 매개변수로 여러 URL을 색인에 추가하여 콘텐츠 중복 문제를 일으킵니다.

예를 들어, 웹사이트에서 사용자가 가격이나 기능을 기준으로 콘텐츠를 정렬할 수 있도록 옵션을 제공하는 경우, 이러한 옵션은 페이지의 내용을 변경하는 것이 아니라 결과 범위를 좁히는 역할만 합니다.

다음 예시를 통해 이해해 봅시다.

http://www.example.com/footwear/shoes

http://www.example.com/footwear/shoes?category=sneakers&color=white

http://www.example.com/footwear/shoes?category=sneakers&type=men&color=white

위의 세 가지 URL은 모두 동일한 웹페이지의 다른 버전이지만, 검색 엔진 봇은 이를 서로 다른 URL로 인식합니다. 이로 인해 검색 엔진은 동일한 페이지의 모든 버전을 크롤링하고 색인화하여 콘텐츠 중복 문제를 일으킵니다.

키워드 잠식

여러 페이지가 동일한 키워드를 대상으로 할 경우 “키워드 잠식” 문제가 발생합니다. 이는 웹사이트 페이지가 서로 경쟁하게 만들어 SEO에 해를 끼칩니다.

키워드 잠식은 단일 통합 페이지보다 클릭률(CTR), 권위, 전환율을 낮춥니다.

이러한 상황에서 검색 엔진은 어떤 페이지를 검색 쿼리에 대해 우선적으로 순위를 매겨야 할지 혼란을 겪을 수 있습니다. 결과적으로 “잘못된” 페이지 또는 “원치 않는” 페이지가 순위가 매겨져 사용자의 반응을 기반으로 순위가 낮아질 수 있습니다.

낮은 클릭률

매개변수가 포함된 URL은 종종 보기 흉하고 읽기 어렵게 느껴질 수 있습니다. 투명성이 떨어지는 URL은 신뢰성이 낮아 보일 수 있으며, 사용자들은 클릭을 꺼리게 됩니다.

예를 들어:

URL 1: http://www.example.com/footwear/shoes

URL 2: http://www.example.com/footwear/shoes?catID=1256&type=white

여기서 URL 2는 URL 1에 비해 스팸성으로 보이고 덜 안정적으로 느껴집니다. 따라서 사용자가 이 URL을 클릭할 가능성이 적어 클릭률이 감소하고 순위에도 영향을 미쳐 도메인 권위가 더욱 낮아집니다.

URL 매개변수 처리 모범 사례

이제 URL 매개변수가 SEO에 악영향을 미칠 수 있다는 것을 알았습니다. 매개변수화된 URL을 생성할 때 몇 가지 수정을 통해 문제를 예방하는 방법을 알아보겠습니다.

동적 경로보다 정적 URL 경로 선호

정적 URL과 동적 URL은 모두 웹 페이지에 기능을 제공하는 다른 유형의 URL입니다. 동적 URL은 정적 URL보다 검색 엔진이 색인화하기 어려우므로 SEO에 이상적인 옵션으로 간주되지 않습니다.

매개변수 URL을 서버 측 렌더링을 사용하여 하위 폴더 URL로 변환하는 것이 좋습니다. 그러나 가격 필터로 생성된 URL은 SEO 가치를 더하지 않을 수 있으므로 모든 동적 URL에 적합한 해결책은 아닙니다. 이러한 경우에는 인덱싱하면 콘텐츠가 희박해질 수 있으므로 동적 URL을 사용하는 것이 좋습니다.

동적 URL은 추적에 유용합니다. 때로는 정적 URL이 모든 매개변수를 추적하는 이상적인 방법이 아닐 수도 있습니다.

따라서 특정 페이지를 색인화할 때는 정적 URL 경로를 사용하고, 페이지를 색인화하지 않으려면 동적 URL을 사용하는 것이 좋습니다. 추적, 정렬, 필터링, 페이지 매김과 같이 색인화할 필요가 없는 URL 매개변수는 동적 URL로, 다른 매개변수는 정적 URL로 사용할 수 있습니다.

매개변수화된 URL의 일관성

매개변수 URL의 빈 값, 불필요한 매개변수, 반복된 키와 같은 SEO 문제를 방지하려면 매개변수 URL을 적절하게 정렬해야 합니다.

크롤링 예산 낭비 및 순위 신호 분할과 같은 문제를 방지하려면 URL이 일정한 순서를 유지해야 합니다.

예를 들어:

https://example.com/product/facewash/rose?key2=value2&key1=value1

https://example.com/product/facewash/rose?key1=value1&key2=value2

위와 같이 매개변수의 순서가 다르면 검색 엔진 봇은 이러한 URL을 별개로 처리하고 두 번 크롤링합니다.

매개변수 순서를 일관되게 유지하면 다음과 같습니다.

https://example.com/product/facewash/rose?key1=value1&key2=value2

https://example.com/product/facewash/rose?key1=value1&key2=value2

개발자는 SEO 문제를 피하기 위해 매개변수 URL을 일정한 순서로 배열하는 방법에 대한 적절한 지침을 받아야 합니다.

표준 태그 구현

콘텐츠 중복을 피하려면 표준 태그를 구현할 수 있습니다. 매개변수 페이지의 표준 태그는 색인화하려는 기본 페이지를 가리켜야 합니다. 매개변수화된 URL에 표준 태그를 추가하면 기본 페이지가 표준으로 설정되므로, 크롤러는 선호하는 페이지만 색인화하게 됩니다.

Robot.txt 파일 사용 제한

robots.txt 파일을 사용하여 검색 엔진 크롤러를 제어할 수 있습니다. 이를 통해 크롤링할 페이지와 무시할 페이지를 검색 엔진에 알려줄 수 있습니다.

robots.txt 파일에 Disallow: /*?* 를 추가하여 중복을 유발하는 URL 매개변수가 있는 페이지를 차단합니다. 쿼리 문자열이 기본 페이지로 올바르게 정규화되었는지 확인해야 합니다.

내부 링크 일관성 유지

웹사이트에 많은 매개변수 기반 URL이 있고 일부 페이지는 ‘dofollow’로 색인화되지만 일부는 색인화되지 않는 경우, 매개변수화되지 않은 URL과 상호 링크를 설정해야 합니다. 이렇게 일관성을 유지하면 크롤러에게 어떤 페이지를 색인화해야 하는지 명확하게 전달할 수 있습니다.

내부 링크는 SEO, 콘텐츠 및 트래픽에도 긍정적인 영향을 미칩니다.

다양한 제품 및 콘텐츠 카테고리를 보유한 전자상거래 웹사이트의 경우, 페이지 매김 기능을 사용하여 콘텐츠를 여러 페이지 목록으로 나눌 수 있습니다. 웹사이트 URL에 페이지 매김을 적용하면 사용자 경험을 향상시킬 수 있습니다. “모두 보기” 페이지를 만들고 페이지 매김된 모든 URL을 해당 페이지에 배치하세요.

중복을 피하기 위해, 전체 보기 페이지를 참조하여 각 페이지 매김된 페이지의 헤더 섹션에 rel="canonical" 태그를 추가하세요. 크롤러는 이러한 페이지를 페이지 매김된 시리즈로 처리합니다.

페이지 매김된 URL의 순위를 매기고 싶지 않다면, 사이트맵에 추가하지 않을 수도 있습니다. 크롤링은 어떤 경우에도 “모두 보기” 페이지를 색인화합니다. 이를 통해 크롤링 예산도 줄일 수 있습니다.

다음은 URL 매개변수를 모니터링하고 웹사이트 SEO를 개선하는 데 도움이 되는 도구입니다.

구글 서치 콘솔

Google Search Console 도구를 사용하여 웹사이트 URL을 분석할 수 있습니다. “검색 결과” 탭에서 현재 노출되는 모든 URL을 확인할 수 있습니다. 페이지 URL 필터를 적용하면 페이지 목록을 얻을 수 있습니다.

필터를 사용하여 매개변수가 있는 URL을 찾으세요.

구글 애널리틱스

Google은 매개변수가 서로 다른 URL을 별도의 페이지로 취급합니다. Google Analytics는 모든 URL 매개변수의 페이지 조회수를 개별적으로 표시합니다.

의도한 것이 아니라면 “관리” > “보기 설정” > “URL 쿼리 매개변수 제외”를 사용하여 보고서에서 매개변수를 제거하고 페이지 조회수를 기본 URL의 값으로 결합할 수 있습니다.

Bing 웹마스터 도구

“내 사이트 구성” > “URL 매개변수 무시”에서 매개변수 이름을 추가하여 URL 매개변수를 제외할 수 있습니다. 그러나 Bing 웹마스터는 매개변수가 콘텐츠를 변경할 수 있는지 여부를 확인하는 고급 옵션을 제공하지 않습니다.

Screaming Frog SEO 스파이더 크롤링 도구

최대 500개의 URL을 무료로 크롤링하여 매개변수를 모니터링할 수 있습니다. 유료 버전을 사용하면 URL 매개변수를 무제한으로 모니터링할 수 있습니다.

Screaming Frog의 “매개변수 제거” 기능을 사용하면 URL에서 매개변수를 제거할 수 있습니다.

Ahrefs 사이트 감사 도구

Ahrefs 도구에는 사이트를 크롤링할 때 매개변수를 무시하는 “URL 매개변수 제거” 기능도 있습니다. 패턴 일치 매개변수를 무시하도록 설정할 수도 있습니다.

결국 Ahrefs 사이트 감사 도구는 페이지의 정규화된 버전만 크롤링합니다.

딥크롤

거대한 전자 상거래 사이트에 적합한 강력한 클라우드 크롤링 소프트웨어입니다. 차단하려는 매개변수를 “매개변수 제거” 필드에 추가하면 URL에서 제거됩니다. Deepcrawl을 사용하면 매개변수와 URL 재작성을 수정하고 제거할 수 있습니다.

결론

웹사이트 SEO에 있어 URL 매개변수는 종종 간과됩니다. 매개변수화된 URL을 꾸준히 관리하면 SEO 상태를 모니터링할 수 있습니다.

URL 매개변수 문제를 해결하려면 SEO팀과 웹 개발팀이 협력하여 매개변수 업데이트에 대한 명확한 지침을 공유해야 합니다. 매개변수화된 URL은 순위 신호에 영향을 미치고 다른 SEO 문제도 일으킬 수 있으므로 간과해서는 안 됩니다.

이제 URL 매개변수가 웹사이트 SEO 수준을 높이는 데 어떻게 기여하는지 이해했으므로, 웹 크롤러가 웹사이트의 페이지를 효율적으로 사용하고 가치를 부여하는 방법을 이해해야 합니다.

참고로, Javascript를 SEO 친화적으로 만드는 방법도 살펴보실 수 있습니다.