데이터에 대한 인사이트 탐색
학습 목표
이 유닛을 완료하면 다음을 수행할 수 있습니다.
- 인사이트가 무엇인지 설명합니다.
- Einstein Discovery가 생성하는 데이터 인사이트의 유형을 정의합니다.
- 데이터 인사이트를 탐색 및 해석할 수 있습니다.
데이터 인사이트란?
인사이트는 데이터에서 찾은 내용입니다. 모델 버전을 만들면 Einstein Discovery가 데이터를 철저히 분석하고 분석을 토대로 인사이트를 생성합니다.
Einstein Discovery는 중립적이고 객관적이고 통계적으로 유의미한 인사이트를 번개처럼 빨리 생성합니다. 그리고 인사이트를 쉽게 이해하고 해석할 수 있도록 차트와 사실 정보가 가득한 설명을 사용합니다. 인사이트는 모델의 설명 변수와 목표의 상호 관계를 조사하는 출발점이 됩니다. 사용자는 인사이트를 훑어보면서 개선하고 싶은 성과와 가장 관련성이 높은 인사이트를 찾기만 하면 됩니다.
인사이트 유형
Einstein Discovery는 다음과 같은 종류의 인사이트를 생성합니다.
유형 |
설명 |
---|---|
서술적 |
통계 분석을 수반하는 서술적 분석을 사용해 과거 데이터에서 얻습니다. 서술적 인사이트는 데이터에서 무슨 일이 일어났는지를 나타냅니다. |
진단적 |
모델에서 얻습니다. 진단적 인사이트는 그 일이 왜 일어났는지 나타냅니다. 진단적 인사이트는 더 깊이 파고들고, 분석하는 비즈니스 성과에 가장 중요한 영향을 미치는 변수를 아는 데 도움이 됩니다. 참고: 왜라는 말은 강한 데이터 패턴을 의미하며, 인과 관계를 의미하지 않을 수 있습니다. |
비교적 |
모델에서 얻습니다. 비교적 인사이트는 특정 하위 그룹 두 개를 비교하여 성과 변수의 차이를 설명합니다. 비교적 인사이트를 사용하는 경우 요인(범주 또는 버킷)을 격리하고 성과에 미치는 영향을 다른 요인 또는 전체 평균과 비교합니다. Einstein Discovery는 이러한 비교를 시각화할 수 있게 폭포 차트를 표시합니다. |
데이터 인사이트 보기
왼쪽 패널에서 Data Insights(데이터 인사이트)를 클릭합니다. Einstein Discovery가 데이터 인사이트 화면을 표시합니다.
-
모델 요약(1)에는 모델 목표, 분석한 총 행 수, 평균 성과, 이전 버전과의 차이가 표시됩니다. Explore a Variable(변수 탐색) 버튼은 변수 패널을 토글합니다.
-
변수 패널(2)에는 모델의 설명 변수 목록이 표시되고 변수와 모델 성과의 상관 관계가 가장 높은 상관 관계부터 표시됩니다. 백분율로 표시되는 상관관계가 높을수록 통계적 관계가 더 강해집니다. 모델에서는 Opportunity Type(기회 유형)과 성공 기회의 상관 관계가 가장 높고, 이어서 Lead Source(리드 소스)와 Industry(산업)가 그 다음으로 높습니다.
-
인사이트 요약 패널(3)에는 성과 변수에 대한 상위 긍정적 및 부정적 영향이 표시됩니다. 모델에서 기회 성공률은 리드 소스가 Partner Referral(파트너 추천)이고 기회 유형이 New Business / Add On(새 비즈니스/추가)인 경우에 가장 높습니다. 기회 유형이 Existing Business(기존 비즈니스)이고 금액이 21,810 미만인 경우 성공률이 가장 낮습니다. 이 사례에서 관측된 성공률은 0.8%로, 1,000개의 기회 중 성공하는 기회가 약 8개임을 의미합니다.
다음에는 Einstein Discovery가 생성한 여러 가지 인사이트를 각각 살펴보겠습니다. 이 유닛에서는 서술적, 진단적, 비교적 인사이트에 대해 알아봅니다.
서술적 인사이트 탐색
가장 먼저 보이는 인사이트는 서술적 인사이트입니다. 서술적 인사이트는 주된 인사이트입니다. 서술적 인사이트는 데이터 집합의 통계 분석을 기반으로 결과에 기여한 요인에 대한 개요를 제공합니다. Einstein Discovery는 막대 차트를 사용하여 값의 차이, 추세 및 유의성을 표시합니다.
인사이트 요약을 지나 아래로 스크롤하여 서술적 인사이트 목록에 있는 첫 번째 인사이트를 확인하세요. 인사이트 순서는 통계적 유의성 기준입니다. 상위 인사이트는 모델 결과에 가장 강력한 영향을 미쳤습니다.
각 인사이트에는 다음이 있습니다.
- 측정 대상의 이름(1)
- 결과를 시각적으로 표시하는 차트(2)
- 결과와 데이터 집합에 있는 다른 변수와의 상호 작용에 대해 설명하는 설명 텍스트(3)
Einstein에 목표(기회 성공 극대화)를 부여했으므로, 각 인사이트는 해당 목표를 기준으로 ‘더 나았는지’ 또는 ‘더 나빴는지’를 나타냅니다. 화살표가 있는 녹색 원은 목표와 더 가까워지는 조건을 나타냅니다. 화살표가 있는 빨색 원은 목표와 더 멀어지는 조건을 나타냅니다.
이 인사이트를 보면 기회 유형 중에 새 비즈니스/추가의 성공률이 가장 높고 기존 비즈니스가 가장 낮음을 알 수 있습니다.
그래프에서 마우스 커서를 막대 위로 이동하여 기본 세부 사항을 표시하는 팝업창을 확인하세요.
설명 텍스트에서 마우스 포인터를 하이퍼링크 위로 이동하면 차트의 해당하는 막대가 다른 색으로 하이라이트됩니다.
원할 경우 아래로 스크롤하여 목록의 다른 서술적 인사이트를 검토합니다.
단일 변수(1차 인사이트)로 드릴다운
인사이트 목록을 필터링하려면 변수 패널에서 Opportunity Type(기회 유형)을 클릭합니다.
인사이트 목록에 기회 유형과 관련된 인사이트만 표시됩니다. 인사이트 위의 필터 선택기에 조사 중인 변수가 표시됩니다.
목록의 첫 번째 인사이트는 기회 유형이 성과와 어떤 관계가 있는지 표시하고, 변수와 연결된 모든 값의 요약을 나타냅니다. 서술적 인사이트의 경우, 이를 1차 인사이트라고도 합니다. 변수 하나(기회 유형)가 성과 변수(IsWon TRUE)의 변동을 어떻게 설명하는지 조사하기 때문입니다.
하위 그룹(2차 인사이트) 탐색
목록의 다음 인사이트까지 아래로 스크롤합니다.
이 인사이트는 변수 조합(하위 그룹)이 성과 변수와 어떤 관계가 있는지 나타냅니다. 이 예에서는 Phone Inquiry(전화 문의) 리드 소스가 특히 추가 기회인 경우에 다른 리드 소스보다 실적이 나쁘기 때문에 하이라이트되었습니다. 차트는 여러 기회 유형에 걸쳐 전화 문의(파란색 세로 막대)와 다른 모든 리드 소스(회색 세로 막대)의 크기가 얼마나 다른지 표시합니다. 결론은 무엇일까요? 통신 판매는 새 거래를 창출하는 효과적인 방법이 아닙니다!
원할 경우 아래로 스크롤하여 목록의 다른 인사이트를 살펴보세요. 다음에는 진단적 인사이트에 대해 자세히 알아보겠습니다.
진단적 인사이트 탐색
서술적 인사이트는 무슨 일이 일어났는지 알려주는 한편, 진단적 인사이트는 그 일이 왜 일어났는지 알려줍니다. 진단적 인사이트를 통해 성과로 이어진 요인을 자세히 살펴볼 수 있습니다. Einstein Discovery는 모델을 만드는 동안 생성하는 모델에서 진단적 인사이트를 얻습니다. Einstein은 폭포 차트를 사용하여 진단적 인사이트를 시각화합니다.
참고: 왜라는 말은 강한 데이터 패턴을 의미하며, 인과 관계를 의미하지 않을 수 있음을 기억하세요.
진단적 인사이트를 보려면 변수(Lead Source(리드 소스))를 변수 패널에서 선택한 후 Choose Value(값 선택)에서 변수 값(Partner Referral(파트너 추천))을 선택합니다.
Einstein은 선택한 값의 성능을 요약하여 표시합니다.
그런 다음 Einstein은 Lead Source(리드 소스)가 Partner Referral(파트너 추천)인 경우에 대한 진단적 인사이트를 표시합니다.
이 폭포 차트에는 정보가 많이 포함되어 있습니다. 세부적으로 살펴보겠습니다.
파란색 막대부터 시작해 보겠습니다.
- 맨 위에는 모든 변수 및 값의 평균인 Global Average(전역 평균)가 있습니다.
- 맨 아래에는 선택된 변수 및 값의 Average(평균)가 있습니다. 여기에는 이 평균을 전역 평균과 비교하면 얼마나 다른지(순 효과) 표시됩니다.
이제 중간에 있는 녹색 및 빨간색 막대를 함께 보겠습니다. 이 두 막대는 개별 요인 또는 요인 그룹이 성과와 어떤 관계가 있는지 나타내는 Specific Drivers(특정 요인), 즉 개별 요인입니다. 녹색 막대는 개선을 나타내고 빨간색 막대는 악화됨을 나타냅니다.
-
Small Terms Related(관련된 작은 항)는 이전에 표시된 다른 막대에 나타나지 않는 선택 항목과 상호작용하는 모든 항의 집계 효과입니다. 선택된 변수의 성과에 영향을 미치는 요인이 많기 때문에 차트에 모든 요인이 포함될 수는 없습니다. 가장 영향이 큰 요인만 차트에 표시됩니다. 나머지 영향은 작은 항에 그룹으로 포함됩니다. 이렇게 하는 이유는 이를 다음 두 그룹과 구별하기 위해서입니다.
-
Unexplained(설명되지 않음)는 이 모델이 다양한 요인으로 설명할 수 없었던 격차를 수량화합니다. 진단적 인사이트의 요인들은 다함께 LeadSource Partner Referral(리드 소스 파트너 추천)에 대해 관측된 성과와 전역 평균 사이의 격차를 좁힙니다. 이런 요인은 예측 모델을 사용하여 생성되는데, 완벽한 모델은 없다는 점을 기억하세요. Unexplained가 0인 경우, 이는 해당 모델이 항상 LeadSource의 성공률이 Partner Referral(파트너 추천)이라는 점을 완벽하게 예측했으며, 파트너 추천은 비현실적이고 모델이 과적합하다는 의미일 수 있습니다.
여기서 더 알아볼 수 있는 내용이 많지만(각 요인 위로 마우스를 이동하여 모든 점수를 볼 수 있음), 이제 비교적 인사이트로 넘어갈 시간입니다.
비교적 인사이트 탐색
비교적 인사이트는 진단적 인사이트의 특수 사례입니다. 진단적 인사이트는 특정 하위 그룹과 전역 평균의 차이를 기여 요인으로 구분한다는 점을 기억하세요. 비교적 인사이트는 두 개의 서로 다른 하위 그룹에 대해 이렇게 한다는 차이점이 있습니다. Einstein Discovery는 생성하는 모델에서 비교적 인사이트를 얻습니다. Einstein Discovery는 이러한 비교를 시각화할 수 있게 폭포 차트를 표시합니다.
비교적 인사이트를 보려면 변수(Lead Source(리드 소스))를 Variables(변수) 패널에서 선택합니다. Choose Value(값 선택)에서 변수의 범주(Partner Referral(파트너 추천))를 선택한 후 두 번째 범주(Phone Inquiry(전화 문의))를 선택합니다.
Einstein이 비교적 인사이트를 표시합니다.
이 화면에 있는 몇몇 정보에 대해 알아보겠습니다.
-
제목(1)은 성과를 기준으로 성능이 더 나은 범주를 표시합니다.
-
요약(2)은 각 범주가 성과와 어떤 상관 관계가 있는지 표시하고 범주 간 차이를 표시합니다.
-
부제(3)는 정확히 무엇을 비교하고 있는지 서술합니다.
-
폭포 차트(4)는 두 범주의 주된 차이점을 표시합니다.
- Lead Source(리드 소스)가 Phone Inquiry(전화 문의)인 경우의 평균(맨 위 파란색 막대)
- Lead Source(리드 소스)가 Partner Referral(파트너 추천)인 경우의 평균(맨 아래 파란색 막대)
- Phone Inquiry(전화 문의)의 성능이 더 나은 경우의 요인(빨간색 막대)
- Partner Referral(파트너 추천)의 성능이 더 나은 경우의 요인(녹색 막대)
인사이트로 수행할 수 있는 다른 작업
모델의 데이터 인사이트 검토 및 해석 외에 다음을 수행할 수 있습니다.
- 다시 보고 싶은 인사이트를 책갈피에 저장하고 인사이트 목록을 필터링하여 책갈피에 저장된 인사이트만 표시
- 데이터에 편차가 있는지 분석하는 경우 민감한 변수와 관련된 인사이트 필터링
다음 단계
이제 인사이트를 탐색했으니 모델을 배포해 보겠습니다.
리소스