Python과 머신러닝(62)
-
[Python.Pandas] Selection과 Drop
0. 이전 포스트 2020/12/15 - [Python과 머신러닝/Pandas 데이터 분석] - [Python.Pandas] Pandas 기본 - DataFrame, Series, Index의 이해 2020/12/16 - [Python과 머신러닝/Pandas 데이터 분석] - [Python.Pandas] DataFrame Series 추출, loc/iloc 이해하기 2020/12/17 - [Python과 머신러닝/Pandas 데이터 분석] - [Python.Pandas] DataFrame / Series 간 Operation 이해 [Python.Pandas] Pandas 기본 - DataFrame, Series, Index의 이해 1. 판다스란? 판다스란 구조화된 데이터의 처리를 지원하는 python 라..
2020.12.18 -
[Python.Pandas] DataFrame / Series 간 Operation 이해
0. 이전 포스트 2020/12/15 - [Python과 머신러닝/Pandas 데이터 분석] - [Python.Pandas] Pandas 기본 - DataFrame, Series, Index의 이해 2020/12/16 - [Python과 머신러닝/Pandas 데이터 분석] - [Python.Pandas] DataFrame Series 추출, loc/iloc 이해하기 [Python.Pandas] Pandas 기본 - DataFrame, Series, Index의 이해 1. 판다스란? 판다스란 구조화된 데이터의 처리를 지원하는 python 라이브러리이다. Python 계의 엑셀이라고 표현하면 가장 정확한 표현이라고 생각한다. NumPy와 통합하여 강력한 스프레드시트 처리 coding-grandpa.tisto..
2020.12.17 -
[Python.Pandas] DataFrame Series 추출, loc/iloc 이해하기
0. 이전 포스트 2020/12/15 - [Python과 머신러닝/Pandas 데이터 분석] - [Python.Pandas] Pandas 기본 - DataFrame, Series, Index의 이해 [Python.Pandas] Pandas 기본 - DataFrame, Series, Index의 이해 1. 판다스란? 판다스란 구조화된 데이터의 처리를 지원하는 python 라이브러리이다. Python 계의 엑셀이라고 표현하면 가장 정확한 표현이라고 생각한다. NumPy와 통합하여 강력한 스프레드시트 처리 coding-grandpa.tistory.com 1. Dict Data를 Pandas로 변환하기 In [1]:from pandas import Series, DataFrame import pandas as ..
2020.12.16 -
[Python.Pandas] Pandas 기본 - DataFrame, Series, Index의 이해
1. 판다스란? 판다스란 구조화된 데이터의 처리를 지원하는 python 라이브러리이다. Python 계의 엑셀이라고 표현하면 가장 정확한 표현이라고 생각한다. NumPy와 통합하여 강력한 스프레드시트 처리 기능을 제공하는 라이브러리이다. 2. 용어 정리 DataFrame : 전체 데이터를 데이터 프레임이라고 칭한다. Series : 하나의 Column을 Series라고 한다. Series란 Column vector 하나를 표현하는 object이다. list 형태로 데이터를 담아줄 수 있는 특징이 있다. NumPy의 List는 값만 출력이 된다면, Series는 자동으로 index도 함께 출력된다. 즉, Series는 Index/Data/Data type으로 구성된다. Index의 특징 일반적인 Index..
2020.12.15 -
[Python.NumPy] 텍스트 데이터를 읽기 저장하기 - np.loadtxt/np.savetxt/np.load/np.save
1. np.loadtxt와 np.savetxt 예시 (텍스트 데이터 읽기 / 저장하기) In [1]:import numpy as np In [2]:a = np.loadtxt("./populations.txt", delimiter='\t') a Out[2]:array([[123., 234.], [345., 456.], [567., 678.]]) In [3]:a_int = a.astype(int) a_int Out[3]:array([[123, 234], [345, 456], [567, 678]]) In [4]:np.savetxt('int_data.csv', a_int, fmt='%.2e', delimiter=',') np.loadtxt : 123~678이라는 값을 가진 populations.txt에서 tab..
2020.12.14 -
[Python.NumPy] Boolean Index와 Fancy Index
1. Boolean Index In [1]:import numpy as np In [2]:test_a = np.array([1,4,0,2,3,8,9,7], float) test_a Out[2]:array([1., 4., 0., 2., 3., 8., 9., 7.]) In [3]:test_a > 3 # test_a 중에서 각 요소별로 3보다 큰지 작은지에 대한 boolean 값이 담김 Out[3]:array([False, True, False, False, False, True, True, True]) In [4]:test_a[test_a > 3] Out[4]:array([4., 8., 9., 7.]) test_a > 3이라고 하면 각 요소가 3보다 큰지에 대한 Boolean 값을 반환한다고 이미 정리한 바..
2020.12.13