데이터 품질 시작하기
학습 목표
이 유닛을 완료하면 다음을 수행할 수 있습니다.
- 데이터 품질을 결정하는 몇 가지 요소를 나열할 수 있습니다.
- 잘못된 데이터가 해로운 이유를 설명할 수 있습니다.
- 올바른 데이터가 유익한 이유를 설명할 수 있습니다.
잘못된 데이터의 발생
여러분은 세계 최고의 뉴미디어 기술 회사인 Gelato의 Salesforce 관리자입니다. Gelato는 스트리밍 4K Ultra HD 광고 컨텐츠를 제공하기 위한 최신 플랫폼을 개발했습니다. 이 플랫폼은 지금까지 수많은 TV 및 영화 앱과 웹사이트에서 사용되었습니다. 여러분은 B2B 분야에 있고, 여러분의 고객은 광고주, 미디어 대행사, 기타 광고 업체 등 매우 다양합니다.
Gelato의 비즈니스 성장을 위해 새로 취임한 영업 이사는 고객과 고객의 요구 사항을 더 잘 파악하고자 합니다. 여러분은 Salesforce 전문가이므로, 영업 이사는 여러분에게 Gelato 계정에 대한 완전한 정보를 요청합니다. 여러분은 자리로 가서 노트북을 열고, 시원한 음료 캔을 딴 후 몇 가지 Salesforce 보고서를 생성한 후 칭찬 세례를 받습니다.
아주 쉬울 것 같죠?
전혀 그렇지 않습니다.
보고서를 확인하면, 다음은 미국 서부 지역의 계정에 대해서만 표시되는 내용입니다.
몇 가지 문제가 눈에 확 띕니다.
레코드 누락
여러분의 회사는 캘리포니아에만 500명이 넘는 고객이 있지만, 보고서에는 서부 지역 전체에서 약 200개 계정에 대한 데이터만 표시됩니다.
중복 레코드
계정 목록을 간단히 살펴보면, 여러 위치에 있는 고객의 데이터가 여러 계정 레코드에 캡처되어 있음을 알 수 있습니다. 너무 많은 고객이 너무 많은 레코드에 나타나서 고객의 정의 기준이 무엇인지 알 수 없습니다. 정의 기준이 주소인지, 회사 이름인지 헷갈립니다.
데이터 표준 없음
지역별 분석 데이터는 87개 주의 고객을 보여줍니다. 지리 수업을 들은 지는 오래되었지만, 50개 주만 기억하고 계실 것입니다. 예를 들어 California는 CA, Calif, Cali, 그리고 친밀한 'Surfin', USA'로 표시되어 있습니다.
불완전한 레코드
서부 지역의 거의 모든 계정에 주요 데이터가 누락되었습니다. 소비자 계정에는 전화번호, 이메일과 같은 데이터가 빠져 있습니다. 비즈니스 계정에는 산업, 수익, 직원 수가 누락되었습니다.
오래된 데이터
서부 지역의 모든 계정 중 최소 절반이 지난 6개월 동안 업데이트되지 않았기 때문에 데이터 정확도를 알 수 없습니다. 또한 해당 데이터에는 Salesforce에서 캡처되지 않은 계정도 포함되지 않습니다.
이러한 종류의 데이터 문제는 보고서를 불완전하거나, 또는 최악의 경우 부정확하게 만듭니다. 따라서 걱정스러운 게 당연합니다. 여러분은 모든 영업 관리자의 의견을 구하는 Chatter 스레드를 시작합니다.
뉴욕 지역 관리자는 "Salesforce에서 제품을 찾기가 너무 어려워서 저희 팀은 Salesforce를 자주 사용하지 않아요."라고 솔직하게 말합니다.
런던의 다른 영업 관리자는 "저희 지역의 중복 데이터를 모두 정리하려고 했지만, 다른 팀이 소유하고 있었습니다."라고 설명합니다.
홍콩의 마케팅 관리자는 "저희가 생성하는 리드에 충분한 세부 사항이 없어서 다음에 무슨 조치를 취해야 할지 판단하기가 어려워요. 게다가 저희가 소유한 데이터는 금세 과거 데이터로 바뀝니다."라고 말합니다. 사실입니다. 실제로 데이터는 끊임없이 변화합니다. 평균적으로 30분마다 120개의 회사 주소가 바뀌고, 75개의 전화번호가 바뀌고, 20명의 CEO가 회사를 떠나고, 30개의 새로운 기업이 생겨납니다.
여러분은 회사의 성장과 비즈니스 결정이 Salesforce 데이터의 품질과 관련이 있다는 것을 깨닫습니다. 이제 관찰 결과를 영업 이사와 공유합니다. 영업 이사는 여러분의 예리한 통찰력에 감탄하면서도 한 가지 질문을 합니다. ‘데이터 품질이 얼마나 중요한가요?’
잘못된 데이터가 미치는 영향
데이터 품질은 비즈니스라는 빵의 효모 같은 존재임이 밝혀졌습니다. 뛰어난 데이터 품질이 없다면 성공을 거두지 못하고 미미한 수익만 거두게 될 것입니다.
간단해 말해, 데이터 품질은 매우 중요합니다. 조금만 자세히 조사하면 다음과 같은 사실을 발견할 수 있습니다.
- 부정확하거나 불완전한 데이터로 인해 생산성의 20%가 고착될 수 있으며, 이는 주당 근무일에서 하루에 해당하는 비율입니다.
- 부정확한 데이터로 인해 평균적인 회사는 수익의 12%를 잃습니다.
- 모든 비즈니스 이니셔티브의 40%가 낮은 데이터 품질로 인해 목표로 하는 이점을 얻지 못합니다.
이는 매우 잘못된 것입니다. (잘못된 데이터에 대한 자세한 내용은 리소스 섹션을 참조하세요.)
많은 임원진이 데이터 품질의 함정에 대해 경고하고 있습니다. 전 세계에 통합 영업 및 마케팅 서비스를 제공하는 선도적인 아웃소싱 제공업체 Virtual Causeway의 Rick Endrulat 사장이 데이터 품질에 대해 말하는 내용을 확인해보세요.
실제로 잘못된 데이터는 다음과 일관된 관련성이 있습니다.
- 수익 손실
- 누락되거나 부정확한 통찰력
- 시간 및 리소스 낭비
- 비효율성
- 느린 정보 검색
- 낮은 수준의 고객 서비스
- 평판 손상
- 영업 담당자의 채택률 저하
잘못된 데이터 때문에 Gelato의 Salesforce 관리자인 여러분은 영업 이사에게 회사 비즈니스에 대한 완전한 정보를 제공할 수 없습니다. 그러한 정보가 없다면 영업 이사는 어떤 잠재 고객을 목표로 하고, 어떤 영역을 조정하고, 어떤 교차 판매 기회를 추진하고, 어떤 리드를 우선시해야 할지 알 수 없습니다. 무엇보다도, 이러한 간극은 회사가 고객 요구 사항을 충족하고 비즈니스를 성장시키는 데 부정적 영향을 미칩니다. 해당 데이터에 의존하는 모든 영업 및 마케팅 프로세스를 상상해보세요. 회사가 주요 경쟁업체를 인수하고 해당 업체의 고객 데이터를 병합해야 하는 경우 어떻게 해야 할까요? 데이터가 최신 상태가 아니라면, 개인정보보호 규정(GDPR)을 포함한 개인정보보호 법규를 어떻게 계속 준수할 수 있을까요? 현재 방식을 고수한다면 악몽 같은 상황이 벌어질 것입니다!
다행히도 데이터 품질을 개선하기에 너무 늦은 때는 없습니다. 이는 여러분은 영업 이사에게 자신 있게 얘기한 내용이기도 합니다. 영업 이사는 여러분의 철저함에 만족한 듯 보이지만, 한 가지 질문이 있습니다. "올바른 데이터는 실제로 어떠한 영향을 미치나요?"
AI 데이터의 정의
데이터 품질은 AI 시스템의 결과 및 신뢰성을 형성하는 데 주요한 역할을 합니다. AI 사용 시 데이터의 품질이 저조하면 시스템의 성능이 저하되어 편향된 결과, 취약성, 윤리적 및 사회적인 영향을 초래할 수 있습니다. 정리되지 않았거나 대표성이 없는 데이터는 잘못된 비즈니스 결정으로 이어져 운영 비용을 증대시킬 수도 있습니다.
고품질의 데이터는 AI 모델이 더 정확하고 편향되지 않으며 강력한 예측을 수행할 수 있도록 지원합니다. 이를 통해 AI 모델은 실제 시나리오를 더 정확하게 예측하며 애플리케이션의 신뢰도를 높일 수 있습니다. 경제적인 관점에서도 고품질의 데이터를 사용하면 AI 이니셔티브에 대한 투자 가치를 극대화할 수 있습니다.
끊임없이 변화하는 글로벌 데이터 규정을 준수하기 위해서는 데이터 품질 규정을 지키는 것이 필수적입니다. 본질적으로, 모든 효과적인 AI 시스템의 기본은 데이터의 진실성과 품질에 달려 있습니다.
올바른 데이터가 미치는 영향
올바른 데이터는 회사에 다음의 이점을 제공합니다.
- 잠재 고객 발굴및 타게팅
- 교차 판매 및 상향 판매 기회 식별
- 계정 통찰력 확보
- 효율성 증대
- 올바른 정보를 빠르게 검색
- 고객과의 신뢰 형성
- 영업 담당자의 채택률 상승
- 향상된 영역 계획 및 조정
- 신속한 리드 점수 매기기 및 라우팅
그 외에도 매우 많은 이점이 있습니다. 여러분은 올바른 데이터의 이점에 대한 여러 사례 연구를 확인하고,
올바른 데이터가 회사에 미치는 영향을 파악합니다. 머릿속에서 슬로모션 영화 몽타주가 재생됩니다. 영업 담당자가 리드를 전환하는 데 필요한 연락처 정보에 대한 정확한 최신 레코드를 즐거운 표정으로 검색합니다. 영업 관리자는 손쉽게 영역을 조정하고 새로운 시장을 식별할 수 있음을 깨닫고 기쁨의 춤을 춥니다. 이제 모든 레코드에 완전한 산업 및 경쟁업체 정보가 들어 있기 때문입니다. 임원진은 여러분의 대시보드 중 하나를 확인한 후 여러분과 악수하기 위해 줄을 섭니다.
이러한 모든 가능성이 세계 평화를 만들어내지는 않지만, 그와 매우 가까워집니다. 여러분은 이러한 내용을 영업 이사에게 전합니다. 영업 이사는 여러분의 비전에 크게 만족하지만, 이번에도 한 가지 질문이 있습니다. "우리의 데이터 품질이 얼마나 나쁜가요?" 다음 유닛에서 이 질문에 대한 답을 찾아보세요.