본문 바로가기
방통대/데이터정보처리

1-6 R read.csv 예제

by 꿈꾸는 몽나 2024. 2. 21.
728x90

 

1. 엑셀을 이용한 데이터분석

2000년부터 2008년도까지의 연도별 총출생성비가 다음과 같다. 연도별 출생성비(여아 100명당 남아의 수)를 시계열도표로 그려보자

 

1) 데이터 입력

-첫 번째 행은 변수(필드) 이름

 

2) 차트 그리기

-데이터 영역을 선택한 후, 메뉴 삽입 - 분산형에서 원하는 차트 선택

 

3) 차트 수정

-마우스로 왼쪽 축을 선택

-마우스 오른쪽 단추를 눌러 나온 pop-menu에서 축서식 선택

-축의 최소, 최대값을 변경

축 서식에서 변경하면

 

그래프의 최소값과 최대값이 변경된 걸 알 수 있다.

 

 

2. R을 이용한 데이터분석

a <- c(1:10)  : 1부터 10까지의 값을 담은 배열을 a라는 이름에 담아라.

a/3  : a의 값들을 3으로 나눠라.

 

 

 

예제) 다음은 어느 고등학교 학생 10명을 임의로 뽑아서 수학과 물리 성적을 기록한 것이다. 두 변수 간의 산점도를 그리고, 두 변수 간의 상관계수를 알아보도록 하자.

 

다음과 같은 데이터가 입력된 엑셀 파일을

 

ex1-2라는 이름으로 저장한다.

*파일형식은 CSV 또는 CSV(utf-8)로 저장

 

 

R에서 다음과 같은 명령을 입력한다.

ex12 <- read.csv("경로")  : "경로"의 csv파일을 읽은 다음 ex12라는 이름에 저장한다.

head(ex12) : ex12의 데이터를 확인한다.

 

 

 

명령어 :

plot(ex12$math, ex12$physics, pch=19, col="BLUE")     

: ex12의 math와 physics를 파란(col="BLUE") 점(pch=19)으로 나타내어라.
title("\n Scatter Plot of (math, physics)\n")

: 제목

 

실행 : 

 

 

 

 

728x90