728x90 정처기5 4-1 연속형 자료의 정리 중심측도 : 평균 -중심위치의 측도 : 평균, 중앙값, 최빈값 등이 있는데 이 중 가장 많이 사용되는 것이 평균임 -평균 : 평균은 어느 한 자료값이 다른 값들보다 아주 크거나 작은 특이값의 영향을 많이 받음. ex) 중심측도 : 절사평균 -절사평균 : 예를 들어, 10% 절사평균은 표본에서 가장 작은 값 10%와 가장 큰 값 10%를 빼고 계산된 평균 중심측도 : 중앙값 -중앙값 : 자료를 크기 순서로 나열할 때 중앙에 놓이는 값 -자료의 수를 n이라 할 때 (n+1)/2번째의 값이 중앙값 중심측도 : 최빈값 -최빈값: 자료 중 가장 빈도가 많은 값 -최빈값은 이산형 자료일 경우 도수분포표만 살펴보면 쉽게 구할 수 있음 -연속형 자료일 경우 : 자료를 몇 개의 계급구간으로 나누어 가장 도수가 높은 계급.. 2024. 3. 12. 2-1 데이터(data) 데이터(data) : 어떤 관심 있는 주제에 대해서 수집된 구조화된 정보 : 일반적인 의미의 데이터는 수치, 문자, 그림 등의 표현양식과 관계없이 어떤 주제에 대한 구조화된 정보를 뜻함 데이터의 특징 : 어떤 관심 있는 주제에 대하여 얻어진 것 : 분석에 알맞은 일정한 규칙과 형태로 수집되고 정리됨 : 분석과정을 통해서 유용한 정보로 변환 : 조사나 실험을 통해서 수집되어 알맞은 형태로 변환 통계적 데이터 : 수치적 계산과 통계적 분석에 알맞은 데이터 데이터 분석의 목적 : 자연 및 사회현상에 대한 정확한 현상(집단의 특징) 파악 : 왜 그런 현상이 나타나게 되었는지(인과관계) 규명 : 경제, 사회현상 속에 숨어 있는 법칙성 발견 -> 미래상황 예측으로 합리적이 의사결정 도움 2024. 2. 27. 1-4 데이터분석 소프트웨어 R 다운 받는 방법 https://www.r-project.org/ R: The R Project for Statistical Computing www.r-project.org 에 들어갑니다. CRAN 클릭 Korea의 링크 클릭 Window 다운로드 버전 클릭! base 클릭! Download R for Windows 클릭 2024. 2. 20. 1-2 데이터분석 절차 #데이터분석 절차 문제의 정의 -> 조사,실험의 계획 -> 데이터의 수집 -> 데이터의 정리, 분석 -> 분석결과의 평가 2024. 2. 20. 1-1 지식정보화 사회 정보화 사회 : 빅데이터, 딥러닝, AI 시대 정보화 사회에서는 정보의 수집, 수집된 정보의 가치판단, 정보 활용 능력 등이 필수적으로 요구된다. 이러한 의미에서 지금은 지식정보화 사회라고 한다. 지식정보화 사회에서 데이터를 효율적으로 처리하고 분석하기 위해 컴퓨터의 활용 및 데이터 분석 능력이 필수적이다. #지식정보화 사회에서 필수적인 요구사항 -컴퓨터의 활용방법을 알고 있어야 함 -인터넷을 효율적으로 활용할 수 있도록 함 -정보를 제대로 이해하고, 문제를 파악하고 판단하기 위한 통계적인(논리적인) 사고가 요구됨 -데이터 분석에 대한 기본 개념과 방법론들을 숙지 -데이터로부터 유용한 정보를 추출하고, 합리적인 의사결정을 하기 위해서는 데이터분석 소프트웨어를 잘 활용할 수 있도록 함 2024. 2. 20. 이전 1 다음 728x90