
tidyverse 패키지 설치
콘솔창에 다음의 R코드를 입력합니다.
install.packages("tidyverse")
학습목표
이번시간에 배울 것은 2개의 테이블을 사용해서 하나의 테이블로 합치는 (merge) 동사들을 배워볼 예정입니다. 영어로는 Two table verbs라고 합니다!
left_join()
right_join()
full_join()
inner_join()
semi_join()
anti_join()
함수들을 배울 예정이죠! 첫시간에 이어서 mutate() 함수 고급 사용법과 함께 그룹 데이터의 개념을 학습합니다. 갈길이 멀군요! 그래도 저와 함께 재미있게 배우셨으면 좋겠습니다. :)
학습목표
SQLite의 기본 사용법을 학습합니다.
dplyr와 데이터베이스를 연결하는 방법에 대하여 학습합니다.
dbplyr의 사용법과 존재 이유를 이해합니다.
학습목표
ggplot2 레이어 개념을 이해합니다.
ggrepel을 사용한 조건부 레이블링을 할 수 있도록 합시다!
학습목표
파이차트를 통한 ggplot2의 깊은 이해
qplot() 시스템을 이해합니다.
extension들을 알아봅시다.
gganimate 패키지를 사용하여 움직이는 bar 차트를 만들어보겠습니다.
이번 강의에서는 pivoting 관련 함수들을 파헤쳐 보겠습니다.
pivot_longer
pivot_wider
separate
unite
함수 정복하러 가시죠.
Missing data를 처리하는 방법 대표적인 3가지 함수들을 공부합니다!
drop_na()
fill()
replace_na()
Nested 구조 데이터를 마음대로 조물락 거릴 수 있는 함수!
nested_longer()
nested_wider()
함수를 정복합니다! 구글맵api를 사용해서 데이터 시각화를 연습해봅시다.
기본 베이스 패키지에서 제공하는 문자열 함수와 비교하여 tidyverse에서 제공하는 stringr 패키지들의 장점을 이해합니다. 문자열 데이터를 다루는 것에 자신감을 갖도록 합니다.
Yelp 데이터의 store 정보를 이용해서 구글 맵에 시각화, 워드클라우드 생성 연습을 하도록 하겠습니다!
강의 목표
tibble 객체의 장점을 이해하자!
위 3개 함수를 어느 경우에 사용하는지 이해하자!
기본 R 강의에서 배웠던 apply() 함수와 aggregate() 함수 내용을 복습하고, tidyverse 스럽게 바꾸는 방법을 알아봅니다.
purrr 패키지의 사용방법을 익힙니다.
첨부파일 설명
seoul_moving.zip 파일을 다운 받으시고, 압축을 풀어주세요!
lec1-intro-to-tidyverse.html 강의안을 이용하시면, 첨부된 코드를 끊기지 않고 드래그 하실 수 있습니다.
본 강의는 21년 10월 6일부터 매주 목요일 업데이트 됩니다!
✏️ 데이터 분석의 기초를 잡아드립니다.
R로 하는 데이터 분석의 기초가 되는 tidyverse 패키지에 대한 전반적인 이해와 패키지가 지향하는 데이터 분석의 방향에 맞는 프로그래밍을 할 수 있도록 실력을 길러드립니다. 강의 수강 후 데이터 분석에 가장 기본적으로 필요한 함수들을 모두 이해하고, 혼자서 응용할 수 있는 수준으로 만들어 드립니다.
✏️ 본 강의에서 다루는 패키지들은 다음과 같습니다.
* dplyr: 데이터를 다루는 기본적인 함수들을 제공합니다.
* ggplot2: 데이터 분석의 기반이 되는 시각화 패키지 입니다.
* tibble: tidy한 데이터 자료형을 나타내는 패키지이며, tidyverse 데이터 분석의 기반을 이루는 패키지입니다.
* tidyr: tidy하지 못한 데이터들을 tidy형식으로 바꾸는데 필요한 핵심적인 함수들을 모아놓은 함수 패키지 입니다.
* purrr: tidyverse식의 함수형 프로그래밍을 가능하게 해주는 패키지 입니다.
✏️ 공부하며 알게 된 것들을 나눕니다.
공부라는 것은 어찌보면 참 고되고 힘든 길 입니다. 하면 할 수록 주변에는 관심이 겹쳐지는 사람이 줄어들고, 결국 몇 안되는 사람들만이 자신과 관심사가 같아지는 힘든 길이죠. 저 역시도 학창시절 같은 것을 공부하고, 깨달으며 얻은 즐거움을 공유하고 싶었던 친구가 필요했던 적이 많았던 것 같습니다.
✏️ 왜 하시나요?
통계를 오랫동안 공부해오고 좋아하는 사람의 입장에서, 한국어로 된 좋은 R관련 자료들이 많이 없기에 제가 가진 지식들로 조금은 보탬이 되고자 만들어 보았습니다. 저의 강의가 R tidyverse로 데이터분석을 시작하는 몇몇 분들에게 도움이 된다면 좋겠습니다.
✏️ 마치며
Anyone can learn anything. 저의 홈페이지 문구이기도 하고, 저의 모토이기도 한 말입니다. 통계를 공부하면서, 아니면 일반적으로 공부를 하면서, 이해가 되지 않는 것들에 좌절하는 순간들이 자주 올 것입니다. 자책하지 마세요. 자신의 머리가 나빠서, 공부를 못해서가 아니라, 아마도 그것은 올바른 공부 순서를 밟지 않았기 때문일 가능성이 큽니다. 나는 안되는구나 하는 생각보다는 자신의 공부 중 어느 부분이 비어있는지를 알고, 메워나가 보세요. 건승을 기원합니다.