파이썬 독학(43)
-
[Python.Pandas] DataFrame / Series 간 Operation 이해
0. 이전 포스트 2020/12/15 - [Python과 머신러닝/Pandas 데이터 분석] - [Python.Pandas] Pandas 기본 - DataFrame, Series, Index의 이해 2020/12/16 - [Python과 머신러닝/Pandas 데이터 분석] - [Python.Pandas] DataFrame Series 추출, loc/iloc 이해하기 [Python.Pandas] Pandas 기본 - DataFrame, Series, Index의 이해 1. 판다스란? 판다스란 구조화된 데이터의 처리를 지원하는 python 라이브러리이다. Python 계의 엑셀이라고 표현하면 가장 정확한 표현이라고 생각한다. NumPy와 통합하여 강력한 스프레드시트 처리 coding-grandpa.tisto..
2020.12.17 -
[Python.Pandas] Pandas 기본 - DataFrame, Series, Index의 이해
1. 판다스란? 판다스란 구조화된 데이터의 처리를 지원하는 python 라이브러리이다. Python 계의 엑셀이라고 표현하면 가장 정확한 표현이라고 생각한다. NumPy와 통합하여 강력한 스프레드시트 처리 기능을 제공하는 라이브러리이다. 2. 용어 정리 DataFrame : 전체 데이터를 데이터 프레임이라고 칭한다. Series : 하나의 Column을 Series라고 한다. Series란 Column vector 하나를 표현하는 object이다. list 형태로 데이터를 담아줄 수 있는 특징이 있다. NumPy의 List는 값만 출력이 된다면, Series는 자동으로 index도 함께 출력된다. 즉, Series는 Index/Data/Data type으로 구성된다. Index의 특징 일반적인 Index..
2020.12.15 -
[Python.NumPy] 텍스트 데이터를 읽기 저장하기 - np.loadtxt/np.savetxt/np.load/np.save
1. np.loadtxt와 np.savetxt 예시 (텍스트 데이터 읽기 / 저장하기) In [1]:import numpy as np In [2]:a = np.loadtxt("./populations.txt", delimiter='\t') a Out[2]:array([[123., 234.], [345., 456.], [567., 678.]]) In [3]:a_int = a.astype(int) a_int Out[3]:array([[123, 234], [345, 456], [567, 678]]) In [4]:np.savetxt('int_data.csv', a_int, fmt='%.2e', delimiter=',') np.loadtxt : 123~678이라는 값을 가진 populations.txt에서 tab..
2020.12.14 -
[Python.NumPy] Boolean Index와 Fancy Index
1. Boolean Index In [1]:import numpy as np In [2]:test_a = np.array([1,4,0,2,3,8,9,7], float) test_a Out[2]:array([1., 4., 0., 2., 3., 8., 9., 7.]) In [3]:test_a > 3 # test_a 중에서 각 요소별로 3보다 큰지 작은지에 대한 boolean 값이 담김 Out[3]:array([False, True, False, False, False, True, True, True]) In [4]:test_a[test_a > 3] Out[4]:array([4., 8., 9., 7.]) test_a > 3이라고 하면 각 요소가 3보다 큰지에 대한 Boolean 값을 반환한다고 이미 정리한 바..
2020.12.13 -
[Python.NumPy] Array 비교 연산자와 논리 연산자
0. 요약 일반 scalar 값의 대소 비교를 하듯 Array에도 대소 비교가 필요하다. NumPy에는 대소비교 뿐만 아니라, 논리 연산 (AND/OR)을 지원하는 함수들을 제공한다. np.logical_and, np.logical_or, np.where, np.all, np.any, np.isnan, np.isfinite과 같이 다양한 함수들의 용법과, 각 함수가 반환하는 데이터에 대해서 이해해보자. 1. Array와 Array의 비교 In [1]:import numpy as np In [2]:test_a = np.array([1,3,0], float) test_a Out[2]:array([1., 3., 0.]) In [3]:test_b = np.array([5,2,1], float) test_b Ou..
2020.12.11 -
[Python.NumPy] Array 간의 연산과 Broadcasting
0. 요약 Array 간의 연산을 수행할 때, 두 Array의 크기가 같은 경우에는 어떻게 연산이 될까? 그렇다면 크기가 다를 경우에는 어떻게 될까? Array에 Scalar값이나 vector를 더하려고 해도 정상적으로 수행될까? 그렇다면 어떤 결과가 나올까? 이를 이해하기 위해서는 Broadcasting이라는 개념을 이해해야 하는데, 자세히 하나씩 정리해보자. 1. Array와 Array 간의 연산 In [1]:import numpy as np In [2]:test_a = np.array([[1,2,3], [4,5,6]], float) test_a Out[2]:array([[1., 2., 3.], [4., 5., 6.]]) In [3]:test_a + test_a Out[3]:array([[ 2., 4..
2020.12.10