질적 대 초보자를 위한 정량적 데이터

데이터 분석은 수치적 또는 논리적 기법을 활용하여 데이터를 해석하고 평가하는 과정입니다.

이 과정은 정보의 종합적인 요약을 포함하며, 이를 통해 핵심 결과나 가능한 선택 사항을 제시할 수 있습니다. 데이터 분석은 최종 결과를 수집하고 전달하는 데 중요한 역할을 합니다.

데이터 분석 과정에서 수집된 자료를 정확히 구별하는 것은 필수적입니다. 데이터 분석 과정을 간소화하려면 정성적 데이터와 정량적 데이터라는 두 가지 접근 방식을 이해해야 합니다.

정성적 데이터와 정량적 데이터는 생성, 관찰, 검증 및 수집 방식에 따라 구분됩니다.

데이터는 수치, 사실, 측정값, 기록, 노트, 비디오, 이미지 등 다양한 형태로 나타날 수 있으며 디지털 또는 비디지털 형식으로 저장될 수 있습니다.

하지만 이 두 가지 데이터 유형 사이에는 상당한 차이가 존재합니다. 프로젝트에 적합한 데이터 유형을 선택하려면 각 유형의 특징과 차이점을 정확히 이해해야 합니다.

이제 정성적 데이터와 정량적 데이터의 차이점에 대해 자세히 알아보겠습니다.

정성적 데이터와 정량적 데이터: 정의

이 두 가지 용어를 명확하게 이해하려면, 먼저 정성적 데이터는 해석적이고 탐색적이며 주관적인 반면, 정량적 데이터는 결정적이고 객관적이며 핵심에 초점을 맞춘다는 점을 기억해야 합니다.

정성적 데이터

정성적 데이터는 측정하거나 수치로 표현할 수 없는 정보입니다. 이 데이터는 오디오, 이미지, 텍스트 등 다양한 형식으로 수집되며, 개념도, 타임라인, 인포그래픽과 같은 시각화 도구를 통해 공유됩니다.

예를 들어, 사용자가 웹사이트를 방문하여 상품을 장바구니에 추가했지만 구매를 완료하지 않고 떠난 경우, 방문자가 장바구니를 포기한 이유와 그들이 웹사이트나 상품에 대해 어떤 감정을 느꼈는지 조사하는 것이 정성적 데이터 분석입니다. 여기서 ‘품질’은 핵심 요소입니다. 따라서 정성적 데이터를 통해 통찰력을 얻어야 합니다.

위의 예에서 사용자 행동의 원인을 파악하기 위해 수치가 필요한 것이 아니라 그들의 경험과 이유를 직접 물어볼 수 있습니다. 즉, 정성적 데이터는 아이스크림 맛을 초콜릿이라고 표현하거나 바다를 파란색이라고 묘사하는 것처럼 특정 사물의 특성을 설명하는 데 사용되는 명칭이나 용어입니다.

정성적 데이터는 비통계적 형식으로, 일반적으로 반구조화되거나 구조화되지 않습니다. 이는 그래프나 차트를 통해 숫자로 표현할 필요가 없음을 의미합니다. 대신, 형식, 레이블, 속성, 특징 및 기타 식별자를 통해 특징지어집니다.

문서, 텍스트, 비디오 녹음, 오디오 녹음, 포커스 그룹, 인터뷰 기록, 메모 및 관찰을 통해 정성적 데이터를 생성할 수 있습니다. 그러나 운전면허증 번호나 주민등록번호와 같은 개인 식별 번호는 한 사람에게 고유하고 범주적이므로 정성적 데이터로 분류됩니다.

예시: 금색 손잡이, 부드러운 마감, 진한 갈색, 미국산 견과류 맛, 이탈리아산, 녹색 셔츠, 푸른 바다, 아름다운 그림 등.

정량적 데이터

정량적 데이터는 수치로 측정하거나 셀 수 있는 정보입니다. 이는 연구자가 통계 분석과 수학적 계산을 통해 수치화 가능한 데이터를 얻어 품질을 평가하는 데 사용하는 데이터입니다.

이러한 유형의 데이터는 ‘얼마나 자주?’와 ‘얼마나 많이?’와 같은 질문에 답합니다. 정량적 데이터는 수학적 방법을 사용하여 쉽게 검증하고 평가할 수 있습니다. 예를 들어 보겠습니다.

어떤 사람이 가게 주인에게 “저 프린터 가격이 얼마예요?”라고 질문하는 상황을 생각해 봅시다.

다양한 제품의 가격과 같은 데이터를 수집하는 것은 정량적 질문에 해당합니다. 값은 무게에 대한 킬로그램, 파운드, 비용에 대한 달러 등 측정 단위와 연결됩니다.

설문조사, 설문지 등을 통해 통계 분석에 필요한 정량적 데이터를 수집합니다. 간단히 말해, “수치화”할 수 있는 정보는 정량적 데이터라고 할 수 있습니다. 이는 본질적으로 구조화되어 있으며 통계 및 보고서를 통해 계산할 수 있습니다. 즉, 명확하고 엄격하게 정의됩니다.

정량적 데이터는 테스트, 설문조사, 실험, 측정, 시장 보고서 등을 통해 생성할 수 있으며, 더 명확하고 간결하게 표현됩니다.

예시: 킬로그램 단위의 무게, 한 달의 주 수, 인치 또는 피트 단위의 키, 킬로미터 또는 마일 단위의 거리, 년 또는 월 단위의 나이, 달러 단위의 수입, 센티미터 단위의 길이 등.

정성적 데이터와 정량적 데이터: 차이점

정성적 데이터와 정량적 데이터는 모든 분야에서 중요한 역할을 합니다. 각 데이터 유형을 더 잘 이해하려면 기준, 기능, 특성 등을 기준으로 차이점을 살펴봐야 합니다.

먼저 몇 가지 기본적인 차이점을 살펴보겠습니다.

  • 대상 객체의 분류가 품질이나 속성에 따라 달라지는 데이터를 정성적 데이터라고 합니다. 반면에 셀 수 있거나 수치로 표현할 수 있는 데이터를 정량적 데이터라고 합니다.
  • 정성적 데이터는 사람, 감정, 색상 등에 대한 이해에 의존합니다. 반면에 정량적 데이터는 의사 결정을 위한 통계적 결과를 얻을 수 있는 수치에 의존합니다.
  • 정성적 데이터에서는 언어적 정보가 수집되지만, 정량적 데이터에서는 측정 가능한 정보가 수집됩니다.
  • 정성적 데이터는 초기 이해를 높이는 데 사용되지만, 정량적 데이터는 최종 결론을 내리는 데 도움이 됩니다.

지금까지 두 가지 데이터 유형의 기본 개념을 살펴보았습니다. 이제 두 가지 유형의 주요 차이점을 자세히 알아보겠습니다.

시작해 보겠습니다!

기준 정성적 데이터 정량적 데이터
정의 정성적 데이터 분석은 최종 결과를 도출하기 위해 사회 및 인문 과학에 대한 이해를 발전시키는 데 사용되는 분석 방법입니다. 정량적 데이터 분석은 논리적 및 수학적 기술을 사용하여 정확한 사실 및 수치 정보를 생성하는 데 사용되는 분석 방법입니다.
데이터 예시 종교, 국적, 특정 사물의 색상, 선호도, 성별 등과 같은 데이터가 포함됩니다. 무게, 질량, 크기, 키, 가격 등과 같은 데이터가 포함됩니다.
접근 방식 계산할 수 없습니다. 수학적 도출을 통해 쉽게 계산할 수 있는 객관적인 분석 방법을 사용합니다.
분석 분석은 개발이 발생하는 이유, 사용자의 감정, 장바구니를 포기한 이유 등을 나타냅니다. 분석은 장바구니 포기율과 같은 개발의 수 또는 양을 설명합니다.
샘플 샘플은 대표성이 없고 전체적으로 크기가 작습니다. 샘플은 방대하고 일반화할 수 있습니다.
수집 방법 정성적 데이터는 서면 문서, 인터뷰, 관찰 등을 사용하여 수집할 수 있습니다. 정량적 데이터는 실험, 인터뷰, 관찰, 설문 조사, 여론 조사 등을 사용하여 수집됩니다.
데이터 유형 텍스트 기반입니다. 숫자 기반입니다.
결과 결과는 데이터 분석을 위해 집계하거나 단순히 설명합니다. 결과는 그래프와 차트를 통해 표현되는 변화에 따라 달라집니다.
구성 요소 단어, 객체, 그림 등이 포함됩니다. 수치 및 그래픽 정보가 포함됩니다.

실제 사례

예 1: (사무실 공간)

사무실 공간은 각 요소의 기능에 따라 두 가지 데이터 유형을 모두 나타낼 수 있습니다.

정성적 데이터

  • 크고 넓음
  • 훌륭한 자연광
  • 대형 식료품 저장실
  • 멋진 분수
  • 눈길을 끄는 벽 페인트
  • 멋진 액자
  • 실내 게임을 위한 넓은 공간

정량적 데이터

  • 바닥 면적 12000 평방 피트
  • 층수
  • 창문 수
  • 문 수
  • LED 수
  • 시스템 수

예 2: (웹사이트 기사)

정성적 데이터

  • 기사의 성격
  • 철자, 문법, 구두점 등 기사의 품질
  • 독자들이 기사에 대해 느끼는 감정
  • 기사가 주제와 용어를 얼마나 잘 설명하는지
  • 사용된 비디오 및 오디오의 품질

정량적 데이터

  • 단어 수
  • 사용된 이미지 수
  • 댓글, 페이지 조회수 등 참여도
  • 로드 시간
  • 생성된 리드 수

예 3: (대학교 캠퍼스)

정성적 데이터

  • 크고 빽빽한 나무
  • 밝은 색상
  • 최신식 건물
  • 스마트 조명 및 팬
  • 대형 강의실
  • 멋진 프로젝터
  • 양질의 서적

정량적 데이터

  • 강의실 수
  • 건물 수
  • 에어컨 통풍구 수
  • 주차 공간의 평방 미터
  • 강의실 크기
  • 벤치 수
  • 층수

정성적 데이터와 정량적 데이터: 유형

정성적 데이터의 유형

통계학자와 연구자들은 정성적 데이터를 세 가지 유형으로 분류합니다.

  • 이진 데이터: 항목을 좋음 또는 나쁨, 단단함 또는 부드러움, 옳음 또는 그름, 신선함 또는 오래됨 등으로 분류할 때 이진 데이터라고 합니다. 즉, 상호 배타적인 특성을 통해 특징지어지므로 동시에 발생할 수 없습니다. 통계학자들은 이러한 데이터를 사용하여 해당 항목의 특성을 예측하는 모델을 만듭니다.
  • 명목 데이터: 레이블이 지정된 데이터, 명목 척도 또는 명명된 데이터라고도 합니다. 이는 수치 값을 사용하지 않고 이름을 지정하는 데 사용할 수 있는 데이터 유형입니다.
  • 예를 들어 색상별로 항목 그룹을 구성하는 경우 색상에 따라 각 항목에 직접 레이블을 지정할 수 있습니다. 연구원들은 이러한 명목 데이터를 사용하여 색상과 같은 정보 집합을 구별합니다. 이 유형은 통계학자와 연구원들이 어떤 것이 더 좋은지 알아보기 위해 객관식 설문조사를 만드는 데 사용할 수도 있습니다.

  • 서수 데이터: 서수 데이터는 특정 규모 또는 순서로 분류된 정성적 데이터 유형입니다. 데이터 수집을 위한 필수 단계입니다.
  • 예를 들어 응답자가 서비스 만족도를 1~10의 척도로 입력하면 해당 입력에 따라 데이터를 수집합니다. 여기서는 각 값의 차이를 측정할 수 있는 표준 척도가 없습니다. 몇 가지 예로는 리커트 척도, 간격 척도 등이 있습니다.

정량적 데이터의 유형

정량적 데이터는 이산 데이터와 연속 데이터라는 두 가지 주요 유형으로 나뉩니다. 각 유형을 자세히 살펴보겠습니다.

이산 데이터

이산 데이터는 숫자 계산만 포함하는 정량적 데이터 유형입니다. 길이, 무게, 높이 등과 같은 측정 유형은 포함하지 않습니다.

예를 들어 학생 수, 일 수, 천장 선풍기 수, 개인의 나이 등이 있습니다.

개별 데이터를 식별할 때 다음과 같은 구별을 위해 몇 가지 질문을 사용해야 합니다.

  • 셀 수 있습니까?
  • 나눌 수 있습니까?
  • 측정할 수 있습니까?

등등…

이산 데이터는 더 작은 부분으로 나눌 수 없는 속성 데이터라고도 합니다. 유한 또는 무한하게 셀 수 있다고 말할 수 있습니다.

예: 셀 수 있는 유한 데이터는 A = {1,2,3,4,….,n의 임의 집합입니다. 여기서 n은 무한대보다 작은 숫자입니다}. 셀 수 있는 무한 데이터는 임의 집합 B = { 1,2,3,….}입니다.

연속 데이터

측정 척도에 배치할 수 있는 정량적 데이터 유형입니다. 즉, 더 작은 부분으로 나눌 수 있는 수치 값을 취합니다. 연속 데이터는 셀 수 없는 유한 및 셀 수 없는 무한으로 분류할 수 있습니다.

예를 들어 학생의 학점 평균(CGPA)은 10점 척도로 측정됩니다. 여기서 학생은 0에서 10점 사이의 점수를 얻을 수 있으며, 8.5, 1.57, 4.65, 2.68, 9.8 등이 포함됩니다. 이 데이터는 상한과 하한이 있으므로 셀 수 없는 유한 연속 데이터로 분류할 수 있습니다.

마찬가지로 셀 수 없을 정도로 무한한 데이터의 예로는 실수의 집합 R = {….,-1,0,1,….}. 이 시나리오에서 데이터에는 상한도 하한도 없습니다.

연속 데이터는 다시 두 가지 유형으로 나뉩니다.

  • 간격 데이터
  • 비율 데이터

간격 데이터는 모든 점이 서로 동일한 거리에 배치된 척도를 따라 측정할 수 있는 간단한 기술입니다. 반면 비율 데이터는 간격 데이터의 확장입니다. 정확한 데이터 측정에 대해 논할 때 궁극적으로 사용됩니다. 비율 데이터는 순서, 정확한 거리 등에 대해 알려줍니다.

정성적 및 정량적 데이터 생성 방법

정성적 데이터와 정량적 데이터의 다양한 데이터 수집 방법을 자세히 알아보기 전에 먼저 데이터 수집 유형을 이해해 보겠습니다.

데이터 수집 방법은 다음과 같습니다.

  • 설문조사, 설문지 및 퀴즈
  • 인터뷰
  • 포커스 그룹
  • 직접 관찰
  • 문서

데이터 수집 방법은 정량적 데이터 유형과 정성적 데이터 유형으로 나눌 수 있습니다.

정성적 데이터 수집 방법

  • 설문지 및 개방형 설문조사: 다양한 설문지 및 개방형 설문조사를 통해 데이터를 수집하는 방법으로 가장 많이 사용됩니다. 응답자가 더 유연하게 답변할 수 있도록 미리 정의된 답변이나 옵션이 포함되어 있지 않습니다.
  • 1:1 인터뷰: 일대일 인터뷰라고도 하며 정성적 데이터를 수집하는 데 사용되는 일반적인 방법입니다. 여기에서 인터뷰 데이터를 쉽게 수집할 수 있습니다. 이 기술은 개인화된 데이터를 수집하려는 경우에 특히 유용합니다.
  • 포커스 그룹: 포커스 그룹은 인터뷰 방법의 한 형태입니다. 하지만 1:1 인터뷰가 아닌 그룹 토론으로 진행됩니다. 여기서 자원은 돈, 시간 등의 측면에서 제한되지 않아 매우 편리합니다.
    예를 들어 십대 마약 사용자의 재활에 대한 연구를 수행하는 경우, 그룹의 모든 구성원은 마약 중독에서 회복 중인 십대여야 합니다.
  • 직접 관찰: 이것은 데이터를 수집하는 가장 수동적인 방법입니다. 데이터 수집자는 참가자를 대신하여 설정 상황을 자세히 관찰하고, 오디오 또는 비디오를 사진과 함께 녹음합니다. 직접적인 관찰을 포함하기 때문에 본질적으로 편향이 발생할 수 있습니다.

정량적 데이터 수집 방법

  • 온라인 퀴즈 및 폐쇄형 설문조사: 이 방법은 응답자가 주어진 선택지에서 선택할 수 있는 질문을 기반으로 합니다. 범주형 및 비율/간격형으로 나눌 수 있습니다.

범주형 질문은 이분법(예 또는 아니오), 확인란 질문, 객관식 질문 등으로 분류할 수 있습니다. 반면 간격형 문항은 리커트 척도, 행렬 문항, 평가 척도 등으로 구성됩니다.

정성적 데이터에 비해 정량적 데이터의 장점

정량적 데이터는 차트를 측정하고 준비하거나 보고서를 쉽게 작성할 수 있으므로 정성적 데이터에 비해 여러 가지 이점이 있습니다. 또한 정성적 데이터에 비해 시간이 적게 소요됩니다. 이 기술은 무엇을 기대해야 할지 모를 때 사용됩니다.

정성적 데이터에 비해 정량적 데이터가 갖는 장점을 살펴보겠습니다.

  • 더욱 과학적임
  • 정밀한 제어 가능
  • 객관성이 낮음
  • 집중적임
  • 더 큰 샘플 처리 가능
  • 간단한 방법으로 정리 가능
  • 반복 가능함
  • 관련성 있음
  • 구조적임
  • 일반화 가능함
  • 일관성 있음
  • 빠르고 시간 절약적임
  • 합리적인 의사 결정에 유용함
  • 더욱 수용 가능한 데이터
  • 접근성이 높음
  • 무작위 샘플 사용 가능
  • 직접 관찰 불필요

결론

정성적 데이터는 정량적 데이터에 비해 분석이 어렵습니다. 일반적인 접근 방식으로는 정성적 내용 분석, 주제 분석 및 담화 분석 등이 있습니다. 반면 정량적 데이터는 SPSS, R 또는 Excel을 사용하여 평균 점수, 특정 질문을 받은 횟수, 유효성 등을 계산하는 숫자나 값을 기반으로 합니다. 결과는 표나 그래프로 표현됩니다.

이 글이 정성적 데이터와 정량적 데이터의 차이점, 그리고 어떤 상황에서 어떤 데이터 유형을 선택해야 할지 이해하는 데 도움이 되기를 바랍니다.