부호화(coding, 코딩)
: 수집된 설문지의 응답결과나 관측결과 등을 통계적 분석이 가능하도록 일정한 원칙에 따라 각 응답에 숫자를 부여하는 과정
: 연속형 변수는 관측된 값이 숫자이기 때문에 그대로 입력 가능
: 여러 사람이 부호화 작업에 참여할 때는 부호화의 일관성이 유지되도록 부호화 지침서를 만들어 사용함
데이터 코딩 설계
: 조사/실험을 통해서 얻은 데이터를 입력할 때 어떻게 입력해야 더 간편하고, 효과적으로 분석할 수 있는지를 구상하는 것
ex) 지방자치제도가 지역발전에 미친 영향을 살펴보기 위해서 표본 조사를 실시하는 사례
1, 4번문항 : 순서척도
2, 5번문항 : 명목척도
설문지에 대한 부호화 지침이다.
부호화 지침서는 한글, 스프레드시트 등의 파일로 만들 수 있다.
텍스트 파일
: ASCll 코드형식으로 저장된 파일로 아스키 파일이라고도 함
: 한글 2018에서 일정한 양식으로 데이터 입력 후, 파일 - 다른 이름으로 저장을 선택하고, 파일 형식을 '텍스트 파일'로 저장
: 자유형식과 고정형식 구분
-자유형식 : 변수와 변수 구분은 공란으로 구분
-고정형식 : 각 변수가 위치할 열(칼럼)을 정한 후 입력
자유형식과 고정형식의 예시. 좌측이 자유형식, 우측이 고정형식이다.
스프레드시트나 데이터베이스 파일
: 엑셀 등에서 간편한 데이터 입력이 가능함
: 열은 변수를 나타내고, 행은 케이스를 나타냄
SPSS에서 데이터 입력
: 직접 데이터를 입력하거나 텍스트 파일, 엑셀 파일 등을 읽을 수 있음
SAS에서 데이터 입력
: SAS 편집기에 데이터를 직접 입력하거나 외부 입력 파일을 읽어 옴
S-link에서 데이터 입력
: 직접 S-link 워크시트에 데이터를 입력하거나 외부의 텍스트 파일이나 엑셀 파일을 읽을 수 있음
'방통대 > 데이터정보처리' 카테고리의 다른 글
3-1 국가 통계 정보 (0) | 2024.03.05 |
---|---|
2-4 데이터의 점검 (2) | 2024.02.27 |
2-2 측정의 수준과 데이터 종류 (0) | 2024.02.27 |
2-1 데이터(data) (0) | 2024.02.27 |
1-7 R Studio 설치 (0) | 2024.02.21 |