데이터분석
-
파이썬 프로그래밍(python) 4 - 조건문, 반복문과 할당연산자(if, elif, else, for, while, break, continue, range)데이터분석/파이썬 2021. 11. 14. 10:32
https://kbkb456.tistory.com/66 데이터 분석을 위한 파이썬(3) - 변수값의 형태 -2(리스트, 튜플, 딕셔너리, boolean, set) https://kbkb456.tistory.com/63 데이터 분석을 위한 파이썬(2) - 변수값의 형태 - 1(숫자형과 문자열) 파이썬의 변수를 다룸에 있어서 변수값의 형태는 매우 중요합니다. 이런 형태를 잘 이해하고 다루는 kbkb456.tistory.com 저번 시간까지 변수 선언과 변수 타입에 대해서 알아봤습니다. 오늘부터 소개드릴 것은 파이썬을 함에 있어서 정말 정말 편하게 만들어주는 조건문과 반복문입니다. 간단한 게 조건문과 반복문을 설명하자면 이렇습니다. - 조건문: 조건에 맞게 코드를 실행시켜주는 코드 블록 - 반복문: 원하는 수..
-
파이썬 프로그래밍(python) 3 - 변수값의 형태 -2(리스트, 튜플, 딕셔너리, boolean, set)데이터분석/파이썬 2021. 11. 13. 02:39
https://kbkb456.tistory.com/63 데이터 분석을 위한 파이썬(2) - 변수값의 형태 - 1(숫자형과 문자열) 파이썬의 변수를 다룸에 있어서 변수값의 형태는 매우 중요합니다. 이런 형태를 잘 이해하고 다루는 것에 따라서 코딩이 정말 편리해지기 때문입니다. 변수값의 형태는 크게 1. 숫자형 2. 문자열 kbkb456.tistory.com 저번 시간에 이어서 변숫값의 형태에 대 해어 이어가도록 해보겠습니다. 3. 리스트(list) - 리스트는 원소의 모음으로써 대괄호로 표현된 일종의 배열(array)이라고 보시면 됩니다. - []로 둘러 싸서 표현하며 값의 생성, 삭제, 수정 등이 가능합니다. - 서로 다른 타입의 원소도 안에 넣는 것이 가능합니다. - 리스트 끼리 안에 리스트를 또 넣는..
-
파이썬 프로그래밍(python) 2 - 변수값의 형태 - 1(숫자형과 문자열)데이터분석/파이썬 2021. 11. 8. 21:25
파이썬의 변수를 다룸에 있어서 변수값의 형태는 매우 중요합니다. 이런 형태를 잘 이해하고 다루는 것에 따라서 코딩이 정말 편리해지기 때문입니다. 변수값의 형태는 크게 1. 숫자형 2. 문자열 3. 리스트, 튜플, 딕셔너리 4. bolean(불 형태) 5. 집합(set) 이렇게 있습니다. 오늘은 숫자형과 문자열에 대해서 알아보도록 하겠습니다. 1. 숫자형(integer, double, float ...) 숫자형은 정수, 실수, 8진수, 16진수등 숫자를 나타낼때 활용하는 자료형입니다. 각 숫자형을 표현하는 방법 # 정수형 a = 1 # 실수형 b = 3.14 c = -3.14 # 8진수: 숫자가 0o 또는 0O 으로 시작 d = 0o156 # 16진수: 숫자가 0x로 시작 e = 0x8AA f = 0xAB..
-
R 프로그래밍 8 - R 데이터 프레임을 피벗 테이블 처럼 활용하기(dcast, melt)데이터분석/R 2021. 11. 7. 15:11
오늘은 R의 데이터 프레임을 피벗테이블처럼 활용하는 법에 대해서 알아보도록 하겠습니다. 여러분 피벗테이블은 왜 쓸까요? 바로 데이터프레임을 원하는 데로 길게(long format)하거나 넓게(wide format)하거나 하고 싶어서입니다. R에서도 이런 게 가능합니다. R에는 패키지라는 개념이 있습니다. 남이 만들어둔 함수를 내가 가져다가 쓸 수 있는 개념이라고 보시면 됩니다. R에 reshape2 패키지를 이용해서 데이터 프레임을 자유자재로 길게 하거나 넓게 하거나 하는 것이 가능합니다. 일단 패키지를 설치해봅시다. #reshape2 설치하기 install.packages("reshape2") #reshape2 불러오기 library(reshape2) 이런 식으로 남이 만들어둔 패키지를 가져다가 내 컴..
-
파이썬 프로그래밍(python) 1 - 변수 선언데이터분석/파이썬 2021. 11. 7. 14:22
오늘은 변수 선언에 대해서 알아보려고 합니다. 프로그래밍에서 변수는 무엇일까요? 변수란? 내가 원하는 값을 담는 그릇 같은 개념이라고 보시면 됩니다. - 원하는 값을 담는 다. - 어떤 변하는 값을 담는다. 우리도 어떤 그릇에 음식을 담고나서 버리고 다른 음식도 담을 수 있는 것처럼 파이썬 변수도 어떤 그릇에 내가 원하는 값을 넣고 버리고 다시 넣고 가 가능하다는 개념입니다. 1. 변수는 어떻게 선언하는가? 하나의 변수를 선언하는 법 a = "hello" print(a) #hello를 출력함 변수는 =(등호)를 이용해서 선언할 수 있으며 print() 함수를 이용해서 값을 출력해볼 수 있습니다. a에 hello 라는 변수를 삽입한 뒤에 print() 함수를 이용해서 출력해보면 hello가 출력이 됩니다...
-
python 실습을 위한 colab 노트북 생성하기데이터분석/파이썬 2021. 11. 3. 21:48
python 데이터 분석 관련 포스팅을 하기에 앞서 실습을 위한 환경 셋팅에 대해서 고민해본 결과 colab으로 셋팅하기로 했습니다. 1. colab이 무엇인가요? 구글 코랩은 구글 colaboratory의 줄임말로 별도의 설치없이 python을 이용할 수 있습니다. 기본적으로 클라우드 기반의 주피터 노트북 환경이며 GPU 연산이 가능해 본인의 컴퓨터가 저사양인 경우 추천하고 있습니다. 2. colab의 장점 - 일단 공짜임 (GPU도 활용이 가능한데 공짜다..) - 별도로 데이터 분석에 필요한 패키지는 기본으로 설치되어 있습니다.(pandas, sklearn, matplotlib...) - 주피터 노트북 기반이라 분석하는 사람입장에서 편하다. - git 연동이 가능해서 코드 푸쉬가 가능합니다 -> 다른..
-
R 프로그래밍 7 - 패키지와 샘플데이터(packages, sample data)데이터분석/R 2021. 11. 3. 21:15
R에는 패키지와 샘플데이터라는 것이 있습니다. 1. 패키지? 패키지는 많은 R 유저들이 각자 특수한 목적으로 코드를 만들어둔 집합을 의미하는 것으로 특정 주제에 대해서 완성도가 높고 설계가 잘되어 있어 제삼자가 재사용하기 쉽게 만들어 둔 것을 의미합니다! 패키지는 CRAN이란곳에서 공유되고 있고 install.packages() 함수를 통해서 설치가 가능합니다. #하나의 패키지를 설치하는 법 install.packages("reshape2") #여러개의 패키지를 설치하는 법 install.packages(c("reshape2","dplyr")) #패키지를 실행하는 법 library(reshape2) 이런 식으로 기본 R에 설치되지 않은 함수를 활용할 수 있도록 도와주는 것이 패키지입니다. 2. 샘플데이터..
-
구글 스프레드 시트 22 - 막대차트와 원형차트데이터분석/스프레드시트 2021. 3. 21. 07:31
안녕하세요! 오늘은 막대차트와 원형차트에 대해서 알아보도록 하겠습니다! 1. 막대차트와 원형차트는 각각 무엇인가요? - 막대차트: 범주 데이터를 요약하는 방법중 하나로 같은 크기의 막대를 사용하여 데이터를 표현하며, 각 막대에서는 데이터의 범주를 나타냅니다. - 원형차트: 범주 데이터를 요약하는 방법중 하나로 원형으로 되어 각 데이터의 비중을 표현하는 그래프 방식입니다. 2. 어떨때 사용하면 좋을까요? - 막대차트: 시간에 따른 데이터 + 범주가 많을때 ex) 월별 지역별 판매량 - 원형차트: 각 카테고리별 비중 ex) 지역별 판매량 이런 데이터 셋이 있다고 가정해 봅시다. 막대차트 그려보기 1. 일반 막대차트 단순 월별 사과 판매량을 보는 것과 같은 단순한 지표를 보기에 좋습니다. 2. 누적 막대차트 ..