좋은 질문을 통해 데이터 탐색
학습 목표
이 유닛을 완료하면 다음을 수행할 수 있습니다.
- 적절한 질문을 할 수 있습니다.
- 데이터를 효과적으로 다루기 위한 적성과 태도를 파악할 수 있습니다.
개요
매일 데이터를 더 잘 활용하여 사람들의 삶을 개선할 수 있는 수백만 가지 기회가 있습니다. 질병 연구, 교육 패턴, 산업 효율성, 환자 관리 또는 정부 지출에 관심이 있습니까? 기회는 무궁무진합니다.
데이터를 더 잘 활용하기 위해서는 데이터 리터러시의 본질적인 부분인 탐색을 고려해야 합니다. 성공적인 데이터 탐색의 핵심은 좋은 질문을 하는 것입니다. 예를 들어, 개를 사랑하고 건강에 신경을 쓴다면 첫 질문은 개를 키우는 것이 건강에 좋은가?입니다.
이 질문을 이 질문과 비교해 보세요. 미국에서 만성 질환을 앓고 있는 사람들의 건강 결과에서 견주와 견주가 아닌 사람을 어떻게 비교할 수 있을까요?
첫 번째 질문은 광범위합니다. 무엇이 건강에 좋은지에 대한 명확한 기준이 없습니다. 두 번째 질문은 훨씬 더 구체적입니다. 명확하게 정의된 용어를 사용하고 특정 모집단으로 초점을 좁힙니다. 두 번째 질문에 답하는 데이터를 탐색하는 것이 더 쉽습니다.
이유 묻기
어떤 질문에 대한 답을 탐색하기 시작하면 종종 후속 질문을 하는 스스로의 모습을 발견하게 됩니다. 보통은 원래 질문에 답한 후 멈추는 것만으로는 충분하지 않습니다. 살펴본 예시에서, 미국에서 만성 질환을 앓고 있는 사람들의 건강 결과가 견주인지 여부에 따라 다르다면, 다음 질문은 "왜?”입니다.
Toyota Motors의 창립자 Toyoda Sakichi가 개발한 5 Why 기법은 이미 확인된 문제에 대해 이유를 묻고 주어진 답변이나 설명에 대해 이유를 계속 묻는 것을 제안합니다. 이 기법의 주요 목표는 결함의 근본 원인을 파악하는 것이지만, 이 기법을 사용하여 모든 결과의 원인을 파헤칠 수 있습니다.
저명한 정보 기술자 Stephen Few는 사람들이 데이터로 효과적으로 작업하는 데 도움이 되는 특성, 즉 그가 적성과 태도라고 부르는 특성 목록을 살펴봤습니다. 이러한 특성은 또한 더 나은 질문을 하는 데 도움이 됩니다.
좋은 질문을 유도하는 적성과 태도
Stephen Few의 저서인 Now You See It: An Introduction to Visual Data Sensemaking의 허가를 받아 각색된 이러한 적성과 태도를 읽으면서 자신의 경험을 돌아보게 됩니다. 다음 중 어떤 특성을 가지고 계신가요? 다음 중 어떤 특성을 개발하고 싶으신가요? 현재의 특성이 어떻게 좋은 질문을 하는 데 도움이 될까요? 새로운 특성을 습득하는 것이 좋은 질문을 하는 데 있어 더 발전하는 데 어떻게 도움이 되나요?
좋은 질문의 가치: 예시
Florence Nightingale과 John Snow는 위에 나열된 많은 특성을 보였고, 문제 해결에 도움이 되는 좋은 질문을 던졌습니다. 각 업적에 대해 읽으면서 해당 업적에 나타난 적성과 태도에 대해 생각해 보세요.
예를 들어, 둘 다 흥미와 호기심을 나타냈습니다. Nightingale은 데이터 분석 기술을 가지고 있으며 Snow는 패턴을 파악합니다. Florence Nightingale과 John Snow가 어떻게 효과적인 데이터 분석 적성과 태도를 보였는지에 대한 다른 사례를 생각할 수 있을까요?
Florence Nightingale
1854년, Florence Nightingale은 38명의 간호사들로 구성된 팀을 이끌고 크림 전쟁 중에 입원한 병사들을 돌보았습니다. 왜 그렇게 많은 군인들이 죽어가고 있었고, 어떻게 죽음을 막을 수 있었을까요?
그녀는 전쟁의 부상이 아닌 비위생적인 헬스케어 조건에 의한 예방 가능한 질병이 이 병사들의 주요 사망 원인이었다는 것을 발견했습니다. 그녀는 급격히 사망자를 줄이는 헬스케어 개혁을 하기 시작했고 2년간의 결과를 기록했습니다.
그 후, 그녀는 극지방 다이어그램(아래 예)과 동일한 그래픽을 사용하여 비과학적인 청중에게 광범위한 헬스케어 개혁의 필요성을 보여주었습니다. 그녀의 도표에서 각 웨지는 한 달을 나타내며, 웨지의 넓이는 그 달에 죽은 군인의 수를 나타냅니다. 다른 색깔은 다른 죽음의 원인을 나타냅니다.
이 이야기와 이미지는 영국 과학 박물관 웹사이트 Florence Nightingale’s Work의 Florence Nightingale 페이지에서 각색되었습니다.
John Snow
콜레라는 1831년에서 1832년, 그리고 1848년에서 1849년 사이에 런던에서 발생한 전염병으로 많은 사망자를 발생시킨 급성 장질환입니다. 당시 많은 사람들은 콜레라가 부패한 유기물에서 비롯된 나쁜 공기에 의한 것이라고 믿었습니다. 이들은 샅샅이 살펴보는 등 예방 조치를 통해 질병을 퇴치할 수 있다고 믿었고, 이에 따라 미생물학의 보다 순수한 과학적 접근법을 따르지 않았습니다. 영국의 의사 John Snow는 오염된 공기, 즉 Miasma 이론에 의문을 제기했습니다.
콜레라가 세균에 의한 것이라면? Snow는 콜레라가 아직 확인되지 않은 생식 세포에 의한 것이라고 보았습니다. 그는 식수를 통해 세균이 퍼지고 있다고 추론했습니다. 그의 생각(콜레라가 오염된 공기가 아니라 물 속의 세균과의 접촉을 통해 감염된다는)을 테스트하기 위해 Snow는 총독부로부터 콜레라로 죽은 런던 사망자에 대한 데이터를 받았습니다.
Snow는 도시의 지도에 사망자를 표시하고, 도시에 물을 공급하는 수도 펌프의 위치를 표시했습니다. 그는 결국 콜레라로 사망한 희생자들이 브로드 스트리트 펌프에서 물을 섭취했다고 판단했습니다.
John Snow의 이야기는 근본적인 생물학적 원인에 대한 지식 없이 통계적 방법을 통해 건강 문제를 해결한 중요한 예입니다. 그는 콜레라 세균의 특정한 생물학적 특성이 무엇인지 알지 못했지만 문제의 근원을 발견했습니다.
여기의 이야기와 이미지는 UCLA 전염병학과 웹사이트 John Snow 's work의 John Snow 페이지에서 각색되었습니다.
리소스
- Tableau 블로그: Find hidden insights in your data: Ask why and why again
- 저서: Few, S.(2021). Now You See It: An Introduction to Visual Data Sensemaking(개정판) Analytics Press, 29-32.
- 웹사이트: Florence Nightingale: The Pioneer Statistian
- 웹사이트: Father of Modern Epidemiology
이제 좋은 질문과 데이터 탐색의 관계를 이해할 수 있습니다. 데이터를 효과적으로 활용하려면 양질의 질문을 하는 데 도움이 되는 적성과 태도에 초점을 맞춥니다.