List view
(0) Home/Intro
(0) Home/Intro
(1) Lead Validation
(1) Lead Validation
(2) Lead Nurturing
(2) Lead Nurturing
Lead Validation → Defining Data Sources
Defining Data Sources
데이터 소스 정의
개요
정의
데이터 소스 정의는 잠재 고객 데이터 수집의 출발점으로, 고객 맞춤 캠페인을 효율적으로 구축하기 위해 수집되어야 하는 정보의 출처와 그 세부 필드들을 규정하는 과정을 말한다.
‘데이터 소스’란 데이터를 수집할 수 있는 채널을 의미하며, 이러한 데이터 소스들은 기업이 고객과 접촉하는 모든 지점에 존재한다.데이터 소스를 체계적으로 정의하고 분류하는 작업은 향후 고객 맞춤형 CRM 활동과 마케팅 전략을 효과적으로 수행하기 위한 핵심 기반 중 하나로 작용한다.
나아가, 데이터 소스만큼 중요한 것은 바로 데이터 필드의 정의다. ‘데이터 필드’란 각 데이터 소스에서 수집되는 고객 관련 정보 항목들을 의미하며 이름, 이메일, 구매 차종 등의 구체적인 데이터 항목이 이에 해당한다. CRM 활동의 목적에 따라 필요한 데이터 필드는 달라질 수 있으며, 목적에 부합하는 데이터 필드를 선별하고 일관된 형식으로 관리하는 방안을 고려해볼 필요가 있다.
목표
1. 잠재 고객 관리를 위한 데이터 소스 표준화
잠재 고객 관리에 필요한 데이터 소스를 표준화하고 필수/선택/비핵심 데이터 소스로 기준을 수립한다.
2. 데이터 필드 분류 체계 정립
체계적인 데이터 관리와 평가를 위해, 데이터 필드의 분류 체계를 정보 카테고리별로 정립한다.
3. 데이터 소스 점검 및 평가 시스템 구축
데이터 소스 및 데이터 필드 구조를 주기적으로 점검하고 평가할 수 있는 시스템을 마련한다.
표준화 원칙
1. 활용 목적 기반의 데이터 소스 정의
데이터 소스는 CRM 활동의 활용 목적에 따라 추가 및 유지되어야 한다. 단순한 정보 수집을 넘어서, 잠재 고객 분석 및 맞춤형 캠페인 실행 가능성을 고려한 전략적 선정이 필요하다.
2. 데이터 필드 구조의 일관성 유지
각 데이터 소스에 포함되는 데이터 필드의 카테고리와 그의 명칭은 정의되어야 하며 모든 소스에서 동일한 기준과 해석 방식에 따라 일관되게 관리되어야 한다.
3. 데이터 소스 점검 및 평가 시스템 구축
데이터 소스 및 데이터 필드 구조를 주기적으로 점검하고 평가할 수 있는 시스템을 마련한다.
관련 KPI
1. 데이터 소스 RICE 점수
데이터 소스 RICE 점수는 대상 범위 (Range), 비즈니스 기여도 (Impact), 데이터의 신뢰도 (Confidence), 운영 비용 (Effort)으로 구성된 평가 지표로, 데이터 소스의 우선순위를 설정하고 효율적인 리소스 배분을 위한 의사결정을 할 수 있다.
2. 데이터 불일치 비율
데이터 불일치 비율은 동일한 필드가 여러 데이터 소스에 있을 때 값이 서로 다르게 입력된 항목의 비율을 말하며, 신뢰도가 낮은 필드를 식별해 데이터 품질을 향상시키는 데 활용할 수 있다.
3. 데이터 정확도 점수
데이터 정확도 점수는 특정 데이터가 실제 성과(예: 리드 전환 등)와 얼마나 연관되어 있는지를 측정하며, 이를 통해 데이터 필드의 활용 가치와 실무적 유용성을 평가할 수 있다.
실행 방법론
데이터 소스 현황 진단
표준화 원칙 1. 활용 목적 기반의 데이터 소스 정의
자사 보유 데이터 소스
우리는 잠재 고객 데이터를 관리하기 위해 보유 데이터 소스의 현황을 조사하고 이를 바탕으로 운영 중인 항목과 필요 항목을 선별할 수 있다. 이를 위해 현재 운영 중인 CRM 플랫폼 내에서 관리 중인 자사 보유 데이터 및 외부 수집 데이터 소스를 파악하고, 각 데이터 소스에 포함된 데이터 필드의 구조를 정리해야 한다.
운영 중인 CRM 플랫폼 내에는 다양한 데이터 소스가 존재하며, 대부분은 내부에서 수집한 자사 보유 데이터 소스로 구성된다. 효과적인 CRM 운영과 마케팅 활동을 위해, 자사가 보유한 데이터 소스를 초반부터 명확히 파악하고 활용 가능성을 이해하는 것이 중요하다.
고객 피드백 설문 | 제품/서비스 이용 후 고객의 의견을 수집한 설문 데이터 e.g. 설문, 차량 만족도 조사 |
리드 유입 설문 | 고객 관심 차종 정보 수집을 목적으로 한 설문 데이터 e.g. 시승 신청 설문, 견적 요청 양식 |
자사 채널 (웹/앱) | 웹사이트 및 앱에서의 고객 행동 및 상호작용 데이터 e.g. 자사 페이지 방문 사용 로그 |
자사 소셜 채널 | 브랜드 소셜 미디어 계정의 고객 반응 및 참여 데이터 e.g. 공식 인스타그램 및 유튜브 댓글 |
딜러십 관리 시스템 (DMS) | 딜러 네트워크 내 판매, 재고, 고객 정보 관리 시스템 데이터 e.g. 판매 이력, 고객 상담 기록 |
고객 지원 센터 | 고객 문의 및 서비스 요청 데이터 e.g. 콜센터 문의 기록, 채팅 기록 |
차량 운행 데이터 | 차량의 디지털 실시간 데이터 e.g. 주행 거리, 정비 알림 |
레거시 시스템 | 기존에 사용되던 시스템에서 축적된 데이터 e.g. 과거 CRM, ERP 기록 |
오프라인 이벤트 | 모토쇼, 행사 및 전시회에서 수집한 고객 데이터 e.g. 모터쇼 방문객 명단, 현장 설문 |
오프라인 딜러 | 딜러로부터 수집한 고객 반응 및 평가 기록 데이터 e.g. 판매 후 딜러 피드백, 매장 방문 기록 |
딜러십 리뷰 데이터 | 온라인 플랫폼에 등록된 딜러에 대한 고객 리뷰 데이터 e.g. 구글/네이버 리뷰 평점 |
외부 수집 데이터 소스
운영 중인 CRM 플랫폼에는 내부에서 수집한 자사 데이터뿐만 아니라, 외부 채널과 연계된 데이터 소스도 포함될 수 있다. 이처럼 다양한 출처의 데이터 확장 가능성을 염두에 두고 향후 잠재 고객 정보의 공백을 보완하며 보다 포괄적인 고객 관리를 실현할 수 있는 기반을 마련해야 한다.
금융기관 데이터 | 차량 구매를 위한 금융 서비스 데이터 e.g. 차량 리스 신청서 |
마케팅 퍼포먼스 데이터 | 캠페인 효과 분석을 위한 광고 노출 및 반응 데이터 e.g. 광고 캠페인 노출 기록 |
웹 행동 데이터 | 웹사이트 방문자의 행동 패턴 분석 데이터 e.g. 웹 검색 키워드 기록 |
경쟁사 구매 이력 | 산업 전반의 트렌드 및 경쟁사 관련 데이터 e.g. 경쟁사 차종 구매 이력 |
위치 기반 데이터 | 고객의 위치 정보 및 이동 경로 데이터 e.g. GPS 기반 방문 지역 |
소셜 미디어 데이터 | 외부 소셜 플랫폼 소비자 활동 데이터 e.g. 차량 리뷰 VoC, 블로그 후기 |
이커머스 데이터 | 외부 이커머스 플랫폼 데이터 e.g. 온라인 쇼핑몰 장바구니 기록 |
데이터 필드 카테고리 정의
표준화 원칙 2. 데이터 필드 구조의 일관된 설계
각 자사 보유 및 외부 데이터 소스에는 소비자 정보를 담고 있는 다양한 데이터 필드가 존재하며, 이러한 필드들은 ‘고객 정보’, ‘차량 정보’, ‘마케팅 활동 정보’, ‘구매 정보’, ‘서비스 정보’, ‘라이프스타일 정보’ 및 ‘웹 활동 정보’로 카테고리화할 수 있다. 데이터 필드를 카테고리별로 분류함으로써 잠재 고객에 대한 다양한 측면의 정보를 파악할 수 있으며, 어떤 카테고리에서 정보가 부족한지도 쉽게 확인할 수 있다.
고객 정보
우리는 잠재 고객 데이터를 관리하기 위해 보유 데이터 소스의 현황을 조사하고 이를 바탕으로 운영 중인 항목과 필요 항목을 선별할 수 있다. 이를 위해 현재 운영 중인 CRM 플랫폼 내에서 관리 중인 자사 보유 데이터 및 외부 수집 데이터 소스를 파악하고, 각 데이터 소스에 포함된 데이터 필드의 구조를 정리해야 한다.
데이터 필드 | 정보 예시 |
고객 ID | C08900 |
이름 | 길동 |
성 | 홍 |
성별 | 남성 |
생년월일 | 2000/01/05 |
혼인 여부 | 미혼 |
이메일 주소 | hong@naver.com |
전화번호 | 010-5555-0000 |
주소 | 서울시 강남구 테헤란로 123 |
우편번호 | 6134 |
거주 국가 | 대한민국 |
직업 | 마케팅 매니저 |
연 소득 | 45,000,000 원 |
학력 | 대졸 |
국적 | 대한민국 |
가구 구성원 수 | 4 |
주택 소유 여부 | 월세 |
고객 세그먼트 | 신규 |
차량 정보
차량 정보는 고객이 소유하거나 관심을 갖고 있는 차량의 세부 사양 및 상태를 중심으로 수집되는 데이터를 말한다. 제조사, 모델, 연식, 주행 거리 등의 정보가 포함되며, 이를 바탕으로 차량의 수명 주기를 예측하고 업셀링 제안이나 개인 맞춤형 서비스를 제공할 수 있다.
데이터 필드 | 정보 예시 |
차량 번호 (VIN) | 1HGCM82633A004352 |
제조사 | 현대 |
모델 | 쏘나타 |
연식 | 2019 |
트림 등급 | 스마트 |
차체 유형 | 세단 |
엔진 종류 | 가솔린 |
엔진 배기량 | 1999cc |
변속기 종류 | 자동 |
연비 (km/L) | 13.5 |
외장 색상 | 화이트 |
내장 색상 | 블랙 |
좌석 수 | 5 |
인포테인먼트 시스템 종류 | 8인치 터치스크린 |
주행 거리 (계기판) | 62,000km |
등록 주/도 | 경기도 |
보증 상태 | 보증 만료 |
타이어 크기 | 205/60R16 |
차량 구매일 | 43631 |
차량 소유 상태 | 자가 |
마케팅 정보
마케팅 정보는 고객이 브랜드와의 다양한 접점에 행동을 기반으로 수집되는 데이터를 말한다. 이메일 오픈 여부, 광고 클릭, 캠페인 참여 이력 등 고객의 상호작용 이력이 포함된다. 고객의 관심사와 행동 패턴을 파악해 맞춤형 타겟팅 전략 수립과 채널별 성과 측정에 효과적으로 활용될 수 있다.
데이터 필드 | 정보 예시 |
리드 소스 | 웹사이트 |
캠페인 ID | CMP202403 |
마케팅 채널 | 이메일 |
캠페인명 | 시승 이벤트 |
캠페인 유형 | 프로모션 |
CTA 클릭 수 | 3 |
이메일 오픈 수 | 5 |
문자 응답 여부 | 예 |
프로모션 사용 여부 | 예 |
행사 참여 여부 | 아니요 |
마케팅 동의 여부 (Opt-in) | 예 |
뉴스레터 구독 여부 | 예 |
SNS 참여도 | 중 |
온라인 시승 신청 | 예 |
과거 캠페인 응답 | 1회 |
추천인 정보 | 홍길동 |
구매 정보
구매 정보는 고객이 실제로 차량을 구매할 때 발생하는 다양한 거래 관련 데이터를 포함한다. 계약 조건, 결제 방식, 이용한 금융 상품 등이 이에 해당한다. 이 데이터는 고객의 구매 패턴을 분석하는 데 활용되며, 재구매를 유도하기 위한 맞춤형 제안부터 개인화된 금융 상품 추천에 이르기까지 다양한 전략적 마케팅 활동에 활용될 수 있다.
데이터 필드 | 정보 예시 |
구매 ID | PCH20240518001 |
구매일 | 2025/04/03 |
판매 딜러점 | 현대자동차 강남지점 |
딜러 ID | DLR0032 |
영업사원 ID | SLM7788 |
차량 가격 | 31,800,000 원 |
결제 방식 (할부, 리스) | 할부 |
계약금(선납금) | 3,000,000 원 |
대출 제공사 | 현대캐피탈 |
대출 기간 | 60개월 |
월 납입금 | 496,000 원 |
이자율 | 0.045 |
사용된 혜택 | 프로모션 캐시백 |
계약 서명일 | 2025/04/03 |
차량 인도일 | 2025/04/16 |
반품/교환 여부 | 아니요 |
결제 수단 | 신용카드 |
서비스 정보
서비스 정보는 고객이 차량 정비, 수리 등의 서비스를 받을 때 발생하는 상세 데이터를 의미한다. 이러한 데이터를 기반으로 정비 주기를 예측하거나 적절한 시점에 서비스 알림을 제공할 수 있으며, 고객 만족도 향상과 장기적인 리텐션 확보를 위한 전략 수립에 활용될 수 있다.
데이터 필드 | 정보 예시 |
정비 예약 ID | SVR20240215009 |
정비 일자 | 45337 |
정비소 ID | SRV088 |
서비스 유형 | 정기 점검 |
서비스 상세 내용 | 엔진 오일 및 필터 교체 |
교체된 부품 | 오일 필터 |
서비스 비용 | 120000 |
보증 수리 여부 | 예 |
정비 소요 시간 | 2시간 |
예정된 정기 점검 종류 | 60,000km 정기 점검 |
서비스 상태 | 완료 |
서비스 당시 주행 거리 | 62,500km |
다음 점검 예정일 | 45519 |
과거 정비 이력 | 3회 |
고객 만족도 점수 | 8 |
불만 접수 여부 | 아니요 |
라이프스타일 정보
라이프스타일 정보는 고객의 여가 활동, 소비 성향, 취미, 가족 구성 등 생활 방식 전반에 걸친 데이터를 포함한다. 이러한 정보는 직접적인 거래 기록에는 나타나지 않는 고객의 가치관 및 관심사를 파악하는 데 유용하며 맞춤형 경험 전략 수립에 활용될 수 있다.
데이터 필드 | 정보 예시 |
취미 생활 | 캠핑, 영화 감상 |
출퇴근 거리 | 12km |
가구 내 차량 수 | 1대 |
반려동물 보유 여부 | 예 |
운동 활동 수준 | 주 1회 |
기술 활용 능력 | 보통 |
친환경 생활 여부 | 관심 있음 |
엔터테인먼트 취향 | 액션, 코미디 |
음악 취향 | 팝, 발라드 |
스포츠 관심 | 야구, 축구 |
쇼핑 습관 | 온라인 쇼핑 |
여가 활동 | 산책, 독서 |
모바일 앱 사용 빈도 | 매일 |
휴가 빈도 | 연 12회 |
가족 중심 활동 | 주말 외식 및 가족 나들이 |
웹 활동 정보
웹 활동 정보는 고객이 브랜드의 디지털 채널(웹, 모바일 앱 등)에서 보인 행동 데이터를 포함한다. 방문 빈도, 체류 시간, 검색 키워드 등과 같은 사용자의 디지털 행동 패턴이 포함된다. 이러한 정보는 디지털 채널의 성과를 평가하고, 고객 관심사에 기반 전략 수립에 활용될 수 있다.
데이터 필드 | 정보 예시 |
웹사이트 방문 수 | 7 |
방문한 페이지 | 모델 소개, 가격표 |
페이지당 체류 시간 | 2분 30초 |
세션 시간 | 12분 10초 |
최근 방문 일자 | 45753 |
총 방문 횟수 | 15 |
라이브 채팅 이용 여부 | 아니요 |
차량 비교 기능 사용 여부 | 예 |
검색 키워드 | 전기 SUV |
열람 차량 모델 | 아이오닉 5, EV6 |
계정 로그인 빈도 | 주 2회 |
기기 종류 | 모바일 |
IP 주소 | 192.168.0.45 |
유입 경로 웹사이트 | 네이버 광고 |
데이터 소스 평가
표준화 원칙 3. 데이터 소스 평가 기준 수립
우리는 CRM 플랫폼 내 다양한 데이터 소스를 더욱 효율적으로 운영하기 위해 각 데이터 소스의 유용성을 다각도로 평가하고, 그 결과에 따라 유지 여부를 결정 할 수 있다. 기존 데이터의 관리뿐만 아니라, 신규 데이터 소스를 도입할 때도 같은 기준의 전략적인 접근이 필요하다. 이를 위해 데이터의 중요성 및 운영 등을 기준으로 우선순위를 설정하고, 가장 핵심적인 데이터부터 단계적으로 도입함으로써, 전체 데이터 운영의 효율성을 높일 수 있다.
RICE 모델 기반 데이터 소스 평가
CRM 플랫폼에서 관리되고 있는 자사 보유 데이터와 외부 데이터 소스의 유지 여부를 판단하기 위해서는 정량적인 평가 기준이 필요하다. 이를 위해 RICE 모델을 적용해 데이터 소스 대상 범위(Range), 비즈니스 기여도(Impact), 데이터의 신뢰도(Confidence), 그리고 운영 비용(Effort)을 기준으로 데이터를 일관되게 비교하고 관리 리소스를 전략적으로 배분하는 것이 핵심이다.
수집 대상 범위(Range) | 전체 고객 또는 리드 중 해당 데이터가 얼마나 많은 사용자에게 도달하는지를 평가하는 요소 e.g. 법인 내 고객 정보 보유율, 전체 방문자 대비 앱 로그인 비율 | 점수 범위 : 1~5점 |
비즈니스 기여도(Impact) | CRM 및 마케팅 활동(구매 전환, 고객 세분화 등)에 해당 데이터가 기여하는 정도를 평가하는 요소 e.g. 차량 구매 데이터, 시승 신청 이력은 높은 기여도 / 단순 클릭 로그는 낮은 기여도 | 점수 범위 : 1~5점 |
데이터 신뢰도(Confidence) | 데이터 소스의 신뢰 수준(고객이 직접 제공했는지, 시스템 기반 수집인지 등)을 평가하는 요소 e.g. 공식 계약서 정보 > 커넥티드카 주행 이력 > 웹 서베이 별점 리뷰 | 점수 범위 : 0~100% |
운영 비용(Effort) | 데이터를 수집하고 유지관리하는 데 드는 시간, 비용, 리소스를 평가하는 요소 e.g. 자동 수집 (웹로그, 앱 로그) vs. 수작업 입력 (오프라인 설문, 이벤트 현장 기록) | 점수 범위 : 1~5점 |
데이터 소스 우선순위 설정
데이터 소스를 RICE 모델 평가 점수를 기반으로 각 소스의 운영 우선순위를 ‘필수’, ‘선택’, ‘비핵심’으로 구분할 수 있다. 이러한 기준은 신규 데이터 소스를 도입할 때도 동일하게 적용되어야 하며, 이를 통해 일관된 기준 아래 효율적인 데이터 운영이 가능해진다. 평가 결과 ‘필수’로 분류된 데이터 소스는 CRM 시스템에 우선으로 도입하거나 유지하며, 중요도가 낮은 항목은 리소스 상황에 따라 단계적으로 검토되어야 한다. 이처럼 데이터 소스의 우선순위를 명확히 설정하는 과정은, 제한된 자원 내에서 CRM 활동을 효과적으로 운영하기 위한 핵심 단계이다.
필수 | CRM 운영 및 마케팅 활동에 없어서는 고객 관리, 타겟팅 등이 어려운 필수 데이터 | RICE 점수 : 17점 이상 |
선택 | 보완적 역할을 하며, 특정 캠페인이나 CRM 전략 수립 시 유용한 데이터 | RICE 점수 : 9 ~16점 |
비핵심 | 현재 CRM 또는 마케팅에 직접 활용되고 있지 않거나, 수집 비용 대비 효율이 낮은 데이터 | RICE 점수 : 8점 이하 |
관리 및 고도화
데이터 소스 업데이트
1. 데이터 소스 재평가
데이터 소스를 필수/선택/비핵심으로 RICE 기준에 따라 분류한 뒤, 동일한 소스들을 주기적으로 재평가하여 활용도가 높은 데이터부터 선별적으로 유지해야 한다. 또한 현재 보유한 데이터 소스가 운영 중인 캠페인의 목적에 부합하는지 점검하고, 필요시 적절한 데이터 소스를 평가하여 추가로 확보해야 한다.
2. 데이터 필드 통합
신규로 유입되는 데이터 소스 내 유사한 정보를 담고 있지만 명칭이 다른 필드들을 주기적으로 정리하여 일관된 형태로 통합하여 전체 데이터 필드 업데이트할 수 있다.
예) ‘관심 차종’과 ‘선호 모델’이 유사할 경우 하나의 필드로 통합하여 관리
예) ‘관심 차종’과 ‘선호 모델’이 유사할 경우 하나의 필드로 통합하여 관리
3. 데이터 필드 업데이트
데이터 수집 채널의 변화에 따라 필드 구성이나 항목이 달라질 수 있으므로, 이러한 변화를 반영해 데이터 세팅을 조정해야 한다.
예) 웹 서베이에 전기차/내연기관 선호도 항목 추가 시 데이터 필드 업데이트
예) 웹 서베이에 전기차/내연기관 선호도 항목 추가 시 데이터 필드 업데이트
데이터 품질 향상
1. 데이터 소스 불일치 항목 수정
동일 고객에 대한 데이터가 여러 소스에서 상이하게 존재할 경우 비교 분석을 통해 신뢰도 높은 소스를 기준으로 값을 설정할 수 있다.
예) ‘웹폼 서베이’의 이메일 데이터 값과 ‘시승 신청’의 이메일 값이 다를 경우, 시승 신청 정보의 신뢰도가 높아 해당 값으로 수정
예) ‘웹폼 서베이’의 이메일 데이터 값과 ‘시승 신청’의 이메일 값이 다를 경우, 시승 신청 정보의 신뢰도가 높아 해당 값으로 수정
2. 데이터 소스 정확도 평가
각 데이터가 실제 고객 전환에 미치는 영향을 기준으로 정확도를 평가하여, 보다 품질 높은 데이터를 CRM 플랫폼에 관리할 수 있도록 할 수 있다.
예) 데이터 소스 A에 긍정 반응을 보인 고객의 차량 구매 전환율이 20%인 반면, 데이터 소스 B의 동일 조건 고객은 3%에 불과한 경우, 소스 A의 데이터가 더 정확한 것으로 판단
예) 데이터 소스 A에 긍정 반응을 보인 고객의 차량 구매 전환율이 20%인 반면, 데이터 소스 B의 동일 조건 고객은 3%에 불과한 경우, 소스 A의 데이터가 더 정확한 것으로 판단
3. 데이터 품질 리포트 발행
데이터 품질 개선을 위해 CRM 플랫폼 내 주요 데이터 필드의 품질 상태를 정기적으로 리포트 형태로 발행하고, 품질 이슈가 발생한 데이터 카테고리나 소스를 지속적으로 모니터링해야 한다.
4. 데이터 클렌징
데이터 필드 내 오류 값은 CRM 플랫폼 내 데이터 처리와 분석 정확도에 부정적인 영향을 줄 수 있다. 데이터 필드에서 이러한 값이 식별될 경우 품질 확보를 위해 데이터 클렌징 작업이 수행되어야 한다.