데이터 분석(13)
-
[Python.TimeSeries] Date와 DateTime 심화 - Rolling and Shift
0. 이전 포스트 2021/02/22 - [Python과 머신러닝/TimeSeries & DateTime] - [Python.TimeSeries] Date와 DateTime 2021/02/23 - [Python과 머신러닝/TimeSeries & DateTime] - [Python.TimeSeries] Date와 DateTime 심화 - Resample, Groupby 1. Data Input In [1]:import pandas as pd import os In [2]:df = pd.read_csv('bike_demand_train.csv', parse_dates=['datetime']) df.set_index('datetime', inplace=True) df Out[2]: 시계열 데이터를 분석하다 보..
2021.02.24 -
[Python.MatPlotLib] Scatter Plot 실습
0. 지난 포스트 2020/12/31 - [Python과 머신러닝/MatPlotLib 데이터 시각화] - [Python.MatPlotLib] MatPlotLib으로 그래프 그리기, 시각화, subplot/axes, figure 2021/01/01 - [Python과 머신러닝/MatPlotLib 데이터 시각화] - [Python.MatPlotLib] 그래프 꾸미기 I - 색깔 / 제목 / 선형태 지정하기와 latex식 표현하기 2021/01/02 - [Python과 머신러닝/MatPlotLib 데이터 시각화] - [Python.MatPlotLib] 그래프 꾸미기 II - 범례(Legend) / X,Y축 Label, 텍스트 및 화살표 / grid / ylim/ savefig 2021/01/03 - [Pyth..
2021.01.04 -
[Python.Pandas] DataFrame / Series 간 Operation 이해
0. 이전 포스트 2020/12/15 - [Python과 머신러닝/Pandas 데이터 분석] - [Python.Pandas] Pandas 기본 - DataFrame, Series, Index의 이해 2020/12/16 - [Python과 머신러닝/Pandas 데이터 분석] - [Python.Pandas] DataFrame Series 추출, loc/iloc 이해하기 [Python.Pandas] Pandas 기본 - DataFrame, Series, Index의 이해 1. 판다스란? 판다스란 구조화된 데이터의 처리를 지원하는 python 라이브러리이다. Python 계의 엑셀이라고 표현하면 가장 정확한 표현이라고 생각한다. NumPy와 통합하여 강력한 스프레드시트 처리 coding-grandpa.tisto..
2020.12.17 -
[Python.NumPy] Boolean Index와 Fancy Index
1. Boolean Index In [1]:import numpy as np In [2]:test_a = np.array([1,4,0,2,3,8,9,7], float) test_a Out[2]:array([1., 4., 0., 2., 3., 8., 9., 7.]) In [3]:test_a > 3 # test_a 중에서 각 요소별로 3보다 큰지 작은지에 대한 boolean 값이 담김 Out[3]:array([False, True, False, False, False, True, True, True]) In [4]:test_a[test_a > 3] Out[4]:array([4., 8., 9., 7.]) test_a > 3이라고 하면 각 요소가 3보다 큰지에 대한 Boolean 값을 반환한다고 이미 정리한 바..
2020.12.13 -
[Python.NumPy] Array 간의 연산과 Broadcasting
0. 요약 Array 간의 연산을 수행할 때, 두 Array의 크기가 같은 경우에는 어떻게 연산이 될까? 그렇다면 크기가 다를 경우에는 어떻게 될까? Array에 Scalar값이나 vector를 더하려고 해도 정상적으로 수행될까? 그렇다면 어떤 결과가 나올까? 이를 이해하기 위해서는 Broadcasting이라는 개념을 이해해야 하는데, 자세히 하나씩 정리해보자. 1. Array와 Array 간의 연산 In [1]:import numpy as np In [2]:test_a = np.array([[1,2,3], [4,5,6]], float) test_a Out[2]:array([[1., 2., 3.], [4., 5., 6.]]) In [3]:test_a + test_a Out[3]:array([[ 2., 4..
2020.12.10 -
[Python.NumPy] ones_like, zeros_like, empty_like 함수 - Creation Function II
0. 요약 지난 포스트에서는 arange/zeros/empty에 대해서 배웠고, Creation Function에 대해서 정리했다. 2020/12/04 - [Python과 머신러닝/Python 데이터 수집] - NumPy arange/zeros/empty 함수의 차이 - Creation Function I 그렇기 때문에 이 포스트에서는 Creation Function에 대해서는 설명하지 않고, Creation function 중 ones_like/zeros_like/empty_like에 대해서 알아보자. In [1]:test_matrix = np.arange(30).reshape(5,-1) Out[1]:array([[ 0, 1, 2, 3, 4, 5], [ 6, 7, 8, 9, 10, 11], [12, 1..
2020.12.05