본문 바로가기

R16

[R] 기술통계 - 실전예제 기술통계¶ 실전예제¶ 전국 연령별 평균 월급 조사(2013년)¶ In [1]: # 데이터 로드 # 통계청 2013년 발표 연령, 남녀, 경력별 평균월급 데이터 셋 df 영문으로 바꾸기 colnames(df) colnames(df) 2020. 7. 8.
[R] 기술통계 기술통계¶ 통계로 개념 이해하기¶ 기술통계¶ 데이터를 수학으로 기술하는 것 수치로 특징을 말하는 이유는 정확하기 때문 어떤 사실을 말할 때, 높은 설득력 평균(mean)¶ 모집단 vs 표본 모평균 vs 표본평균 모분산 vs 표본분산 모표준편차 vs 표본표준편차 기술통계에서 말하는 값들은 모두 표본에 해당하는 값 아웃라이어(outlier)¶ 평균을 크게 변하게 만드는 값 아웃라이어를 찾기 위한 그래프 boxplot() 무조건 제거 대상이 아닌 1차적 분석대상 왜 발생했는지와 데이터에 어떤 영향을 미치는지 등 파악 중앙값(median)¶ outlier에 의해 데이터 대표값(평균 등)이 많이 변하는 점 보완 범위¶ 수치형 연속변수에서 최소값과 최대값 사이 범위는 특별한 의미를 가지는 경우가 별로 없음 아웃라이.. 2020. 7. 8.
[R] 데이터 개념 이해하기 (2-2) 데이터 개념 이해하기¶ 예제로 이해하기¶ hflights 패키지 - 20만건 이상의 데이터 예제 패키지¶ In [1]: # 패키지 설치 install.packages('hflights') package 'hflights' successfully unpacked and MD5 sums checked The downloaded binary packages are in C:\Users\205\AppData\Local\Temp\RtmpgfiuHx\downloaded_packages In [2]: # 공통 패키지 로드 (그림 그려주는 곳) library(ggplot2) Warning message: "package 'ggplot2' was built under R ver.. 2020. 7. 8.
[R] 데이터 개념 이해하기(2) 데이터 개념 이해하기¶ 벡터 만들기¶ In [1]: a1 2020. 7. 3.