매일 업데이트
2022-11-17 08:58 10 min

Google 스프레드시트에서 중복 항목을 강조표시하고 삭제하는 단계별 가이드

Google 스프레드시트에서 중복 항목을 찾는 효과적인 방법

Google 스프레드시트에서 중복 데이터를 식별하는 데는 COUNTIF 함수와 데이터 정리 도구가 가장 많이 사용됩니다. 이 두 가지 방법은 간단하면서도 효과적입니다.

Google 스프레드시트란 무엇인가?

Google 스프레드시트는 Google에서 제공하는 클라우드 기반의 무료 스프레드시트 프로그램입니다. Microsoft Office와 경쟁하는 완벽한 오피스 제품군의 일부로, 데이터 준비 및 계산과 같은 다양한 작업을 수행할 수 있습니다.

이 프로그램은 데이터 수정, 정리 및 저장에 주로 활용됩니다. Google 문서 생산성 패키지의 핵심 요소로서 Google 드라이브, Google 시트, 그리고 Google 슬라이드가 통합되어 있습니다.

Google 스프레드시트의 가장 큰 장점 중 하나는 Excel과 달리 여러 사용자가 실시간으로 협업할 수 있다는 점입니다. 이는 팀 프로젝트에 특히 유용합니다.

사용자 친화적인 인터페이스와 데이터 구성을 위한 강력한 도구들을 제공함으로써 데이터베이스 구축 과정을 크게 간소화했습니다. 이로 인해 많은 사용자들이 데이터 관리 작업을 보다 효율적으로 처리할 수 있게 되었습니다.

Google 스프레드시트를 사용하면 생산성을 향상시키고 시간을 절약할 수 있습니다. 클라우드 기반으로 작동하므로 중요한 데이터 손실이나 실수로 인한 파일 덮어쓰기와 같은 문제에 대한 걱정을 덜 수 있습니다.

모든 데스크톱 및 모바일 운영 체제에서 접근이 가능하여 가장 널리 사용되는 스프레드시트 및 데이터베이스 프로그램 중 하나로 자리매김했습니다.

Google 스프레드시트, 데이터베이스 구축을 어떻게 간소화할까?

과거에는 데이터베이스를 만드는 것이 복잡하고 시간이 많이 소요되는 작업이었습니다. 하지만 기술 발전, 특히 Google 스프레드시트의 등장으로 이 과정이 상당히 단순해졌습니다. Google 스프레드시트는 차트, 수식, 이미지 추가 기능 등 다양한 유용한 기능을 제공합니다.

실시간 데이터 관리 및 저장이 필요한 대부분의 기업들은 고가의 데이터베이스인 PostgreSQL, MySQL, SQL Server 대신 Google 시트를 선호합니다. 특히 소규모 데이터 세트의 경우 Google 시트는 훌륭한 대안이 될 수 있습니다.

물론 Google 스프레드시트가 기업 전체를 위한 완벽한 데이터베이스 관리 시스템은 아닙니다. 하지만 소규모 기업이나 프로젝트에서 회사 재무 운영을 관리하는 데는 충분히 뛰어난 기능을 제공합니다.

무료로 이용할 수 있는 Google Sheets API, Apps 스크립트, 양식 트리거, 시간 트리거, ImportXML과 같은 고급 기능들은 Google 시트의 강력함을 더합니다.

Apps 스크립트는 MySQL, Microsoft SQL Server 등 다양한 데이터베이스에 연결하는 JDBC 서비스를 포함하고 있어 사용자가 다른 데이터베이스와 연결할 수 있도록 지원합니다.

이러한 기능을 활용함으로써 기업은 다양한 데이터 관리 시스템에 대한 지출을 줄일 수 있습니다.

이제 데이터베이스 내 중복 값이 미치는 영향에 대해 자세히 살펴보겠습니다.

데이터베이스 내 중복 값의 영향

데이터 분석 또는 보고 목적으로 사용되는 데이터베이스에서 중복 값은 데이터의 신뢰도를 떨어뜨릴 수 있습니다. 이러한 중복 값은 데이터에 부정적인 영향을 미칠 수 있습니다.

드물게 중복된 값은 데이터를 왜곡시켜 잘못된 결론을 도출하게 할 수 있습니다. 또한 데이터를 사용하고 이해하기 어렵게 만들 수도 있습니다.

따라서 데이터베이스에서 중복 값이 가져올 수 있는 잠재적 영향을 인지하고, 이를 방지하거나 최소화하기 위한 사전 조치를 취하는 것이 매우 중요합니다.

Google 스프레드시트에서 단일 열의 중복 항목 강조 표시

이 섹션에서는 Google 시트에서 데이터 중복 문제를 해결하고 효과적으로 제거하는 방법을 살펴보겠습니다.

중복 항목을 식별하기 위해 일반적으로 사용되는 수식은 다음과 같습니다:

=COUNTIF(범위, 조건)

Google 스프레드시트에서 이 수식을 사용하는 단계별 가이드를 소개합니다:

상단 메뉴에서 '서식' 옵션으로 이동한 후 아래로 스크롤하여 '조건부 서식'을 선택합니다.

조건부 서식 버튼을 클릭하면 오른쪽에 새로운 조건부 서식 옵션 패널이 나타납니다.

중복 항목을 강조 표시할 셀 범위를 선택한 후, 서식 규칙 섹션에서 '맞춤 수식' 옵션을 선택합니다.

다음 수식을 필드에 입력합니다:

=COUNTIF($G$6:$G$14,G6)>1

중복을 강조 표시하려는 열에 따라 G 셀을 적절한 열로 변경해야 합니다.

'완료' 버튼을 누르면 위 이미지와 같이 열에서 중복 항목이 강조 표시됩니다.

서식 스타일 설정을 통해 강조 색상 또는 기타 서식 옵션을 변경할 수 있습니다.

위의 예시에서는 단일 열에서 중복 항목을 강조 표시하는 방법을 살펴보았습니다. 다음 섹션에서는 여러 열에서 중복 항목을 강조 표시하는 방법을 알아보겠습니다.

여러 열에서 Google 시트의 중복 항목 강조 표시

이 과정은 중복 항목을 강조 표시하기 위해 지정하는 셀 범위와 수식을 제외하고는 위에서 설명한 방법과 동일합니다.

더 쉽게 이해할 수 있도록 예시를 들어 설명하겠습니다.

수식을 적용하려면 '서식' 메뉴에서 '조건부 서식' 옵션으로 이동합니다. 옵션은 오른쪽 패널에 나타납니다.

셀 범위는 '범위에 적용' 섹션에 지정합니다.

'서식 규칙' 섹션에서 여러 열의 중복 항목을 강조 표시하는 데 사용되는 수식은 다음과 같습니다:

=COUNTIF($F$6:$I$8,F6)>1

이 수식은 매우 간단하며 적용하기도 쉽습니다. 수식에는 중복을 확인해야 하는 셀 범위만 포함되어 있습니다.

이 수식을 실행하면 아래와 같이 4개의 열에 걸쳐 중복된 항목이 강조 표시됩니다.

이 예시에서는 강조 색상을 파란색으로 변경했습니다.

다음 섹션에서는 행의 중복 데이터를 강조 표시하는 방법을 살펴보겠습니다.

행에서 Google 시트의 중복 항목 강조 표시

Google 시트에서 데이터의 중복 행을 식별하는 방법은 중복 열을 강조 표시하는 방법과 약간 다릅니다.

수식을 제외하고는 모든 과정이 동일하므로 모든 단계를 다시 설명하지는 않겠습니다.

예시를 하나 들어 설명하겠습니다.

중복을 강조 표시할 셀 범위는 조건부 서식 옵션의 '범위에 적용' 부분에 나열합니다.

'맞춤 수식은 다음과 같습니다' 섹션에 입력할 수식은 다음과 같습니다:

=COUNTIF(ARRAYFORMULA($A$3:$A$10&$B$3:$B$10&$C$3:$C$10),$A3&$B3&$C3)>1

수식이 복잡해 보일 수 있지만, 중복을 강조 표시하려는 행의 시작 및 끝 셀 번호로 구성되어 있습니다.

이 수식을 실행하면 아래와 같은 결과가 표시됩니다.

이 예시에서는 강조 색상을 변경했으며, 이는 중복 열을 강조 표시할 때와 같은 서식 스타일 메뉴에서 설정할 수 있습니다.

특정 기준에 따라 Google 스프레드시트에서 중복 항목 강조 표시

특정 기준에 따라 중복 항목을 강조 표시하려면 별표 연산자(*)를 사용하여 지정된 범위를 연결하고, 결과를 표시하도록 COUNTIF 함수에 지시해야 합니다.

위의 조건을 실행하는 수식 구문은 다음과 같습니다:

=(COUNTIF(범위, 기준)>1) * (새로운 조건)

이해를 돕기 위해 예시를 하나 들어보겠습니다.

기준: 중복된 행 중 첫 번째 항목은 그대로 두고, 데이터베이스의 나머지 중복 행을 강조 표시하려 한다고 가정해 보겠습니다.

Google 시트에서 이 작업을 수행하는 방법을 살펴보겠습니다. 수식 변경을 제외하고는 다른 방법과 모든 단계가 동일하므로 바로 진행하겠습니다.

위에서 언급한 기준을 실행하는 수식은 다음과 같습니다:

=COUNTIF(ArrayFormula($A$3:$A3&$B$3:$B3&$C$3:$C3),$A3&$B3&$C3)>1

겉보기에 복잡하고 긴 수식은 셀 번호의 시작과 끝을 포함합니다.

아래 Google 시트는 첫 번째 'Apple' 및 'Orange' 항목을 건너뛰고 마지막 항목이 강조 표시되었음을 보여줍니다.

지금까지 특정 기준을 사용하여 행과 열에서 중복 데이터를 강조 표시하는 방법을 살펴보았습니다.

다음 섹션에서는 바로 가기를 사용하여 중복 데이터를 제거하는 방법을 빠르게 알아보겠습니다.

중복 제거 바로 가기

중복된 레코드를 제거하려는 데이터베이스 또는 열을 선택하고, 상단 메뉴에서 '데이터'를 클릭한 다음, '데이터 정리'로 스크롤하여 '중복 항목 삭제'를 선택합니다.

'중복 항목 삭제'를 클릭하면 대안을 선택하고 중복 제거를 승인하는 팝업 상자가 나타납니다.

아래 이미지와 같이 '데이터를 헤더 행으로 사용' 옵션을 선택할 수 있습니다. 시트에 헤더 행이 있는 경우 Google 시트에서 중복 항목을 삭제하는 동안 헤더 행을 무시하도록 하려면 이 체크박스를 선택하세요.

선택 사항을 확인하고 '중복 항목 삭제' 버튼을 클릭하면 아래 상태 메시지가 표시되며 중복 항목이 제거됩니다.

고유 목록을 만드는 방법은 무엇일까요?

중복된 데이터가 많은 데이터베이스에서 고유한 목록을 추출해 보겠습니다.

이 수식은 이해하고 적용하기 매우 간단합니다.

이해를 돕기 위해 이전 Google 스프레드시트 예시를 다시 사용하겠습니다.

고유 목록을 생성하는 구문은 다음과 같습니다:

=UNIQUE(범위 시작: 범위 끝)

아래 그림과 같이 D열에 수식을 설정하고, 고유 데이터를 추출할 셀 범위를 지정하고, 실행 후 결과를 D열에 표시합니다.

Google 스프레드시트에서 공백을 제거하는 방법

텍스트 또는 숫자 데이터를 포함하는 Google 시트에서 작업할 때 셀에 불필요한 공백이 자주 발생하여 불편함을 초래할 수 있습니다.

이 부분에서는 이러한 추가 공백을 제거하는 방법을 알아보겠습니다.

아래 Google 시트를 사용하여 불필요한 공백을 제거해 보겠습니다.

추가 공백이 있는 열 또는 데이터 집합을 선택하고, 상단의 '데이터' 메뉴로 이동한 다음, '데이터 정리'로 스크롤하여 '공백 자르기'를 클릭합니다.

'공백 자르기'를 선택하면 아래 그림과 같이 결과가 표시됩니다. 이제 열에 추가 공백이 모두 제거된 것을 확인할 수 있습니다.

마지막으로

데이터 중복은 시간 낭비일 뿐만 아니라 심각한 문제와 비용이 많이 드는 오류를 초래할 수 있습니다. Google 시트에서 데이터베이스 크기가 작은 경우에는 수동으로 찾을 수 있지만, 시트가 많은 경우에는 시간이 오래 걸리고 오류가 발생하기 쉽습니다. 위에서 제시된 기술들을 활용하면 Google 문서에서 중복 항목을 효과적으로 식별하고 한 번에 모두 제거할 수 있습니다.

다음으로, Google 시트 FAQ 치트 시트를 참고하시면 더욱 도움이 될 것입니다.

저자
Korea

기술 트렌드와 실용적인 팁을 전하는 लेखक입니다.