데이터분석
-
R 프로그래밍 9 - dplyr을 활용하여 깔끔한 코드로 데이터 전처리하기(filter, arrange, mutate, select, summarise, group_by, %>%)데이터분석/R 2021. 12. 14. 23:58
https://kbkb456.tistory.com/62 R 프로그래밍 8 - R 데이터 프레임을 피벗 테이블 처럼 활용하기(dcast, melt) 오늘은 R의 데이터 프레임을 피벗테이블처럼 활용하는 법에 대해서 알아보도록 하겠습니다. 여러분 피벗테이블은 왜 쓸까요? 바로 데이터프레임을 원하는 데로 길게(long format)하거나 넓게(wide fo kbkb456.tistory.com 저번 시간에는 reshape2를 활용해서 데이터를 피봇팅 하는 방법에 대해서 알아봤습니다. 오늘은 r 데이터 전처리에서 널리 활용되는 dplyr에 대해서 알아보도록 하겠습니다. dplyr 패키지? reshape2 패키지와 마찬가지로 데이터 전처리에 특화된 R패키지입니다. 현재는 tidyverse 패키지 묶음에 포함되어 있는..
-
pandas 데이터 분석 - group by를 이용한 집계(sum, count, min, max, mean, median, std, var, quantile, describe, agg)데이터분석/파이썬 2021. 12. 11. 12:34
https://kbkb456.tistory.com/86 pandas 데이터 분석 4 - apply, map를 활용해서 컬럼 연산해보기 https://kbkb456.tistory.com/85 pandas 데이터 분석 3 - 데이터 합치기(merge, append, inner join, left outer join, right outer join, full outer join) https://kbkb456.tistory.com/84 pandas 데이터 분석 2.. kbkb456.tistory.com 오늘은 dataframe에서 group by를 통해서 데이터를 집계하는 법에 대해서 배워보도록 하겠습니다. 1. group by는 어떤 상황에서 활용하는 걸까요? 바로 그룹별 어떤 집계연산(sum, count, ..
-
pandas 데이터 분석 4 - apply, map를 활용해서 컬럼 연산해보기데이터분석/파이썬 2021. 12. 5. 23:54
https://kbkb456.tistory.com/85 pandas 데이터 분석 3 - 데이터 합치기(merge, append, inner join, left outer join, right outer join, full outer join) https://kbkb456.tistory.com/84 pandas 데이터 분석 2 - 데이터 프레임 슬라이싱(loc, iloc), 데이터 필터링(isin) https://kbkb456.tistory.com/76 pandas 데이터 분석 1 - csv, 엑셀파일, json을 데이터 프레임.. kbkb456.tistory.com 오늘은 apply와 map 함수를 통해서 칼럼을 연산하는 법에 대해서 알아보도록 하겠습니다. 1. series와 dataframe apply..
-
pandas 데이터 분석 3 - 데이터 합치기(merge, append, inner join, left outer join, right outer join, full outer join)와 컬럼명 바꾸기(rename)데이터분석/파이썬 2021. 12. 4. 22:05
https://kbkb456.tistory.com/84 pandas 데이터 분석 2 - 데이터 프레임 슬라이싱(loc, iloc), 데이터 필터링(isin) https://kbkb456.tistory.com/76 pandas 데이터 분석 1 - csv, 엑셀파일, json을 데이터 프레임으로 불러오기(read_csv, read_excel, read_json) 오늘은 파이썬의 pandas 라이브러리를 활용을 해서 데이터를 불러.. kbkb456.tistory.com 샘플 데이터 오늘은 데이터 프레임끼리 합치는 법에 대해서 배우도록 하겠습니다. 이런 경우 매우 유용한 함수라고 보시면 됩니다. 1. 엑셀이든 csv든 같은 칼럼명으로 여러 파일로 쪼개진 경우 2. 특정키로 어떤 값을 찾거나 조인해야되는 경우(엑..
-
pandas 데이터 분석 2 - 데이터 프레임 슬라이싱(loc, iloc), 데이터 필터링(isin)데이터분석/파이썬 2021. 12. 4. 13:22
https://kbkb456.tistory.com/76 pandas 데이터 분석 1 - csv, 엑셀파일, json을 데이터 프레임으로 불러오기(read_csv, read_excel, read_json) 오늘은 파이썬의 pandas 라이브러리를 활용을 해서 데이터를 불러오는 법에 대해서 알아보도록 하겠습니다. 이번 환경도 colab을 이용해서 데이터를 분석을 할건데요. 사전에 colab에 데이터를 업로 kbkb456.tistory.com 샘플 데이터 저번 시간에는 pandas에서 csv, 엑셀, json 파일을 데이터 프레임으로 가져오는 법에 대해서 배웠습니다. 오늘은 데이터 프레임을 슬라이싱 하고 데이터를 필터링해서 가져오는 법을 알아보도록 하겠습니다. 데이터 슬라이싱? 데이터 슬라이싱이란 데이터 프레..
-
pandas 데이터 분석 1 - csv, 엑셀파일, json을 데이터 프레임으로 불러오기(read_csv, read_excel, read_json)데이터분석/파이썬 2021. 11. 21. 23:19
오늘은 파이썬의 pandas 라이브러리를 활용을 해서 데이터를 불러오는 법에 대해서 알아보도록 하겠습니다. 이번 환경도 colab을 이용해서 데이터를 분석을 할건데요. 사전에 colab에 데이터를 업로드를 해야 합니다. 샘플 파일 colab에 데이터는 어떻게 올려? 1. 좌측 파일 탭에 원하는 데이터를 드레그해서 넣기 2. 잘 들어갔는지 확인 데이터가 준비가 되었다면 이제 pandas의 함수를 통해서 데이터를 데이터 프레임 형식으로 하나씩 불러오도록 하겠습니다. 데이터 프레임은 뭐야? 데이터 분석에서 많이 사용되는 데이터 형태로, 행과 열로 구성된 사각형 모양의 표 pandas 불러오기 import pandas as pd pandas를 pd라는 이름으로 불러오겠다는 코드 1. read_csv read_c..
-
파이썬 프로그래밍(python) 6 - 예외처리와 라이브러리활용(try, except, import)데이터분석/파이썬 2021. 11. 19. 10:00
https://kbkb456.tistory.com/72 파이썬 프로그래밍(python) 5 - 함수와 클래스(def, class) https://kbkb456.tistory.com/68 파이썬 프로그래밍(python) 4 - 조건문, 반복문과 할당연산자(if, elif, else, for, while, break, continue, range https://kbkb456.tistory.com/66 데이터 분석을 위한 파이썬(3.. kbkb456.tistory.com 저번 시간에는 함수와 클래스에 대해서 알아봤습니다. 클래스의 메서드 활용은 이따 라이브러리에서 해당 라이브러리 함수 활용에서 비슷한 문법을 가지니 잘 이해해두면 좋습니다. 오늘 알려드릴건 예외처리와 라이브러리 활용인데요. 1. 예외처리? 프로..
-
파이썬 프로그래밍(python) 5 - 함수와 클래스(def, class)데이터분석/파이썬 2021. 11. 15. 23:09
https://kbkb456.tistory.com/68 파이썬 프로그래밍(python) 4 - 조건문, 반복문과 할당연산자(if, elif, else, for, while, break, continue, range https://kbkb456.tistory.com/66 데이터 분석을 위한 파이썬(3) - 변수값의 형태 -2(리스트, 튜플, 딕셔너리, boolean, set) https://kbkb456.tistory.com/63 데이터 분석을 위한 파이썬(2) - 변수값의 형태 - 1(.. kbkb456.tistory.com 저번시간에는 조건문과 반복문을 활용하는 법에 대해서 배웠습니다. 오늘 배울것은 프로그래밍의 꽃인 함수와 클래스입니다. 함수와 클래스를 활용하면 정말 무궁무진한 프로그래밍이 가능해집니..