Skip to main content

데이터 기본 사항 알아보기

학습 목표

이 유닛을 완료하면 다음을 수행할 수 있습니다.

  • 데이터란 무엇인지 설명할 수 있습니다.
  • 다양한 유형의 데이터 소스를 설명할 수 있습니다.

개요

데이터 리터러시가 데이터를 탐구하고, 이해하고, 소통하는 능력이라는 것을 배웠습니다. 그런데 데이터란 정확히 무엇인가요?

데이터는 개별적인 사실, 통계 또는 정보 항목입니다. 데이터의 컬렉션은 사실의 컬렉션입니다. 보다 구체적으로, 이 확장된 정의를 고려해 보세요. 존스 홉킨스 블룸버그 공중보건대학의 교수로 일하고 있는 데이터 과학자 Jeffrey Leek은 위키피디아의 데이터 정의에서 시작하여 데이터 정의를 확장하여 직접 정의를 만들었습니다.

데이터는 일련의 항목에 속하는 정성적 또는 정량적 변수의 [sic] 값으로 구성됩니다. 

세부적으로 살펴보고 항을 정의해 보겠습니다.

용어
정의

소계

때로는 모집단이라고도 불리지만, 관심있어 하는 개체의 그룹이기도 합니다.

변수

(변하지 않는, 파이와 같은 일정한 측정과는 대조적으로) 변하거나 변할 수 있는 항목의 측정, 속성 또는 특성입니다.

정성적 변수

정성적 변수는 출신 국가, 성별, 이름 또는 모발 색상과 같은 자질 또는 특성을 설명합니다.

정량적 변수

정량적 변수는 높이, 체중 또는 온도와 같은 측정 가능한 특성을 설명합니다.

이해도를 확인할 준비가 되셨나요? 다음 활동에서는 각 특성이 정성적 변수인지 정량적 변수인지 확인합니다.

참고: 이 모듈에서는 단어 데이터를 복수가 아닌 단수로 처리합니다. 그러나 이 단어가 단수인지 복수인지에 대해서는 논쟁이 계속되고 있습니다. 예를 들어, 케임브리지 사전은 데이터를 단수 및 복수 모두로 지정합니다.

데이터는 어떻게 수집되나요?

Salesforce는 설문지, 인터뷰, 관찰, 문서 분석, 웹 스크래핑 및 기계 측정과 같은 데이터 수집을 위한 다양한 도구와 기술을 보유하고 있습니다. 수신 또는 수집된 데이터를 원시 데이터라고 합니다. 원본 데이터 또는 기본 데이터로도 알려진 원시 데이터는 어떤 방식으로도 처리되지 않았습니다. 즉, 소프트웨어를 통해 실행되거나, 변수가 수정되거나, 데이터가 제거되거나, 요약된 적이 없습니다. 원시 데이터는 데이터가 제거되거나 요약되지 않았기 때문에 가장 포괄적인 데이터 분석을 허용합니다.

원시 데이터의 예는 다음과 같습니다.

  • 현미경으로 본 박테리아 표본
  • 측정 기계에 의해 생성된 바이너리 파일
  • 서식 없는 스프레드시트 파일
  • X API에서 스크랩된 JSON 데이터
  • 수동으로 수집하고 기록한 숫자

데이터 소스 유형

데이터 소스에는 탐사, 이해 및 통신에 사용되는 데이터가 포함되어 있습니다. 예를 들어 Tableau의 모든 차트에는 데이터를 제공하는 연결된 데이터 소스가 있습니다. 이러한 대화형 플래시 카드를 사용하여 몇 가지 일반적인 데이터 소스에 대해 알아보세요. 

각 카드의 용어를 읽은 다음 카드를 클릭하면 용어 설명이 표시됩니다. 오른쪽 화살표를 클릭하면 다음 카드로 이동하고, 왼쪽 화살표를 클릭하면 이전 카드로 돌아갑니다. 

리소스

이제 데이터 리터러시가 무엇을 의미하는지, 얼마나 중요한 질문인지, 어떤 특성이 데이터를 효과적으로 다루는 데 유용한지 이해할 수 있습니다. 또한 데이터 정의 방법, 수집 방법 및 위치도 알 수 있습니다.

계속해서 무료로 학습하세요!
계속 진행하려면 계정을 가입하세요.
얻을 수 있는 이점
  • 커리어 목표에 대한 개인화된 권장 사항 제공받기
  • 실습 과제 및 퀴즈를 통해 스킬 연습
  • 진행 상황을 추적하고 고용주에게 공유
  • 멘토십과 커리어 기회에 연결