데이터 분석 유형 살펴보기
학습 목표
이 유닛을 완료하면 다음을 수행할 수 있습니다.
- 데이터 분석을 통해 의사 결정을 개선하는 방법을 설명할 수 있습니다.
- 다양한 분석 유형을 정의할 수 있습니다.
- 기술적 분석에 대해 설명할 수 있습니다.
인사이트 얻기
데이터 포인트를 수집하는 것은 첫 번째 단계일 뿐입니다. 수집한 데이터로 무엇을 할 수 있을까요? 사람들이 의사 결정을 내릴 수 있도록 유용한 정보를 종합해야 합니다. 이는 바로 데이터 분석의 핵심 목표입니다. 이 모듈을 통해 다양한 유형의 데이터 분석(특히 기술적 분석)과 이러한 분석이 일반적인 비즈니스 사례에서 어떤 식으로 사용되는지 알아봅니다.
AWS의 수석 클라우드 기술자인 Rafael 'Raf' Lopes의 다음 동영상을 시청해 보세요. 이 유닛의 끝부분에는 동영상 컨텐츠에 관한 문제로 구성된 퀴즈가 마련되어 있습니다. 문제에 답변할 수 있도록 이 유닛의 끝부분에 나오는 동영상을 시청하여 필요한 정보를 얻어 보세요.
참고로, Raf는 course와 lesson이라는 용어를 여러 번 말합니다. 이 맥락에서 이 용어는 모듈을 의미합니다.
대사 보기
[Raf] 안녕하세요 데이터 분석에 관심이 있기 때문에 이 동영상을 시청해 주시는 거라고 생각합니다, 좋아요 그럼 데이터 분석의 가치 제안부터 시작해 볼게요
데이터 분석에 대해 이야기할 때 가장 먼저 생각해야 할 것은 수집된 데이터를 사용하여 향후 비즈니스 요구 사항에 유용한 정보를 생성하는 방법입니다 이 정보를 인사이트라고 하죠
머신 러닝을 포함하여 데이터를 기반으로 인사이트를 생성하는 여정은 규모가 크고 복잡할 수 있습니다 하지만 데이터 집합이 준비되어 있고 기술적인 데이터 분석만을 수행하려고 한다면 빠르고 단순하게 진행할 수 있죠 즉, 데이터 분석은 컴퓨터 시스템에서 수집한 데이터를 처리하여 유용한 인사이트를 생성함으로써 데이터 기반의 사실을 통해 의사 결정을 개선하는 과학적인 과정입니다
오늘날 데이터 분석은 이커머스와 소셜 미디어에 폭넓게 사용되고 있습니다 그러나 양질의 지식은 정보 보안, 물류, 공장 운영, 사물 인터넷 등에 적용될 수 있으며, 적용되어야 합니다
데이터 분석에는 네 가지 주요 유형이 있는데, 복잡성 순으로 말씀드리면 기술적, 진단적, 예측적, 규범적 분석이 있죠 각 유형에 대해 설명해 드리겠습니다 기술적 분석에 시간을 조금 더 할애할 텐데요, 지금 이 입문자용 과정에서 가장 많이 다룰 것이기 때문입니다
기술적 분석은 발생한 상황에 대한 정보를 제공하는 데 주로 사용되는 데이터 분석 유형입니다 시스템에서 수집한 데이터를 사용하여 무엇이 잘못되었는지, 어떤 점을 개선할 수 있는지, 또는 어떤 지표가 보고되어야 하지만 보고되지 않았는지를 식별하는 데 도움이 되죠
이러한 유형의 데이터 분석은 이해관계자에게 결과를 설명하기 위해 대규모 데이터 집합을 요약하는 데 폭넓게 사용되니 현재 진행 중인 상황을 보고하는 용도로만 생각하세요 이러한 시스템을 통해 알 수 있는 가장 관련성 높은 지표는 대부분 KPI, 즉 핵심 성과 지표로 알려져 있습니다
어떤 일이 일어났는지 확인하는 것은 일부 시장 분야에서 매우 중요할 수 있으며, 이러한 지표는 문제에 대한 추가 조사에 활용하기에도 좋을 수 있습니다 잠재적인 문제 해결을 위한 데이터 기반 의사 결정을 이해관계자에게 인지시킬 수 있도록 올바른 KPI를 식별하는 측면에서 기술적 데이터 분석이 얼마나 유용한지 예를 들어 보겠습니다
결제 처리가 처리될 때 소요되는 시간 관련 지표를 수집하는 이커머스 웹 사이트를 상상해 보세요 해당 웹 사이트에서는 구매를 완료하는 데 외부 결제 게이트웨이를 사용하고 있습니다 고객은 웹 사이트에서 제품을 구매할 때마다 해당 결제 게이트웨이로 리디렉션되며, 고객이 결제를 마치고 나면 여러분은 결제가 완료되었다는 확인을 받게 됩니다 이 경우 효과적인 기술적 분석을 수행하기 위한 관련 KPI 집합은 트랜잭션을 완료하는 데 필요한 시간, 완료된 트랜잭션 수 및 취소된 트랜잭션 수에 관한 지표가 될 수 있습니다
이제 취소된 트랜잭션 수와 트랜잭션을 완료하는 데 소요되는 시간이 모두 급증하는 경우, 이를 통해 해당 트랜잭션이 너무 오래 걸리기 때문에 취소되고 있음을 효과적으로 알 수 있습니다 이러한 KPI가 서로 관련되어 있다는 사실을 알 수 있으며, 이는 시스템 관리자와 비즈니스 소유자가 판매에 영향을 미칠 수 있는 잠재적인 문제를 해결하는 데 도움이 될 수 있습니다
트랜잭션을 완료하는 시간에도 동일한 개념이 적용됩니다 트랜잭션 시간의 각 단계를 분리하여 해당 지표를 자세히 알아보는 항목이 있는 경우, 정보를 훨씬 더 세분화하여 문제를 해결하기 위한 올바른 위치를 정확히 찾아낼 수 있죠 마지막으로 필요한 것은 소셜 미디어 피드 또는 고객 입력을 통해 시스템 오작동에 대한 정보를 얻는 것입니다 이 경우 모니터링이 매우 중요한데, 비즈니스 관련 문제를 해결하기 위해 매우 간단한 지표 집합을 사용해야 합니다
간단히 말해서 기술적인 데이터 분석은 무슨 일이 일어나고 있는지를 알려 주는 개념입니다 사용자 활동, 소셜 미디어 피드, 사물 인터넷 또는 시스템 보안 로그와 관련된 데이터가 있는 경우 기술적 데이터 분석을 수행할 수도 있습니다 말씀 드린 것처럼 사용 사례는 정말 다양하고 많은데, 한 가지는 확실합니다 기술적 데이터 분석을 수행하는 방법을 알고 나면 동일한 지식을 활용하여 다양한 데이터 집합으로 작업할 수 있으며, 그렇게 할 수 있어야 합니다
좋아요, 이제 기술적 데이터 분석에 대한 기초를 다졌습니다 그럼 나머지 세 가지 유형은 어떨까요?
예시에서 말씀 드린 것처럼 트랜잭션 시간과 실패한 트랜잭션 수에 관한 지표가 있었죠 이 경우 바로 여러분 본인이 인사이트와 아이디어를 통해두 지표를 상호 연관시켜 문제를 식별할 수 있어야 합니다 시스템은 두 지표를 연관시켜 주지는 않으며, 결제 게이트웨이의 문제 확률이라는 통합 또는 예상 지표를 제공합니다 요즘에는 일반적으로 시스템에 이러한 지표가 수백 또는 수천 개씩 있죠 진단적 분석은 단순히 정보를 제공하는 것뿐만 아니라, 잠재적으로 문제가 있을 수 있는 위치를 제안하기 위해 해당 KPI를 추가로 조사하고 상호 연관시켜 진단하는 데 도움이 됩니다 진단적 분석은 이해관계자가 문제의 발생 이유를 이해하도록 돕기 위해 시스템이 취할 수 있는 일련의 조치라고 생각하면 될 것 같아요 여기서 중요한 것은 '이유'입니다
세 번째 데이터 분석 유형은 예측적 분석입니다 예측 데이터 분석은 더 복잡한 편입니다. 이름에서 알 수 있듯이, 과거의 데이터 또는 여러 데이터 집합과 소스 간의 데이터 교차를 기반으로 미래에 어떤 일이 발생할지를 예측하기 때문입니다 간단히 말하면 과거의 행동을 기반으로 미래를 예측하려고 하는 것이죠 신경망, 회귀 및 의사 결정 트리는 진단적 분석에서 매우 일반적으로 사용되는데, 다른 과정에서 자세히 소개해 드릴게요
마지막 유형은 기본적으로 이전의 모든 항목이 결합된 규범적 분석입니다 규범적 분석은 분석을 진행하고 과거 이벤트와 결과를 기반으로 취해야 하는 가장 데이터 중심적인 결정이 무엇인지 이해관계자에게 제안할 수 있습니다 규범적 분석은 대규모 데이터 집합을 살펴보고 교차 분석하여 패턴을 발견하고 그에 따른 개선책을 찾기 위해 머신 러닝 전략을 중점적으로 활용합니다
여러분이 어떤 유형을 배우고 적용하든 관계없이, 데이터 분석은 소셜 미디어, 비즈니스 또는 산업 분야와 같은 정보 기술, 통계 및 도메인 지식 등의 모든 영역에 적용됩니다 이 과정에서는 AWS 서비스를 통해 보안 로그를 사용하여 AWS 계정에서 일어나는 일에 대한 기술적 분석을 수행하는 방법에 중점을 두겠습니다
다양한 유형의 데이터 분석을 이해했으니, 이제 데이터 분석이 현재 우리 일상에서 어디에 사용되고 있는지에 대한 몇 가지 예시를 더 알아보겠습니다
동영상을 시청하셨나요?
퀴즈에서는 이 유닛의 동영상 컨텐츠에 대한 문제가 출제됩니다. 동영상을 시청하지 않은 경우 지금 돌아가서 시청해 보세요. 그런 다음 퀴즈를 풀 수 있습니다.