PANDAS(16)
-
[Python.Pandas] DataFrame Series 추출, loc/iloc 이해하기
0. 이전 포스트 2020/12/15 - [Python과 머신러닝/Pandas 데이터 분석] - [Python.Pandas] Pandas 기본 - DataFrame, Series, Index의 이해 [Python.Pandas] Pandas 기본 - DataFrame, Series, Index의 이해 1. 판다스란? 판다스란 구조화된 데이터의 처리를 지원하는 python 라이브러리이다. Python 계의 엑셀이라고 표현하면 가장 정확한 표현이라고 생각한다. NumPy와 통합하여 강력한 스프레드시트 처리 coding-grandpa.tistory.com 1. Dict Data를 Pandas로 변환하기 In [1]:from pandas import Series, DataFrame import pandas as ..
2020.12.16 -
[Python.Pandas] Pandas 기본 - DataFrame, Series, Index의 이해
1. 판다스란? 판다스란 구조화된 데이터의 처리를 지원하는 python 라이브러리이다. Python 계의 엑셀이라고 표현하면 가장 정확한 표현이라고 생각한다. NumPy와 통합하여 강력한 스프레드시트 처리 기능을 제공하는 라이브러리이다. 2. 용어 정리 DataFrame : 전체 데이터를 데이터 프레임이라고 칭한다. Series : 하나의 Column을 Series라고 한다. Series란 Column vector 하나를 표현하는 object이다. list 형태로 데이터를 담아줄 수 있는 특징이 있다. NumPy의 List는 값만 출력이 된다면, Series는 자동으로 index도 함께 출력된다. 즉, Series는 Index/Data/Data type으로 구성된다. Index의 특징 일반적인 Index..
2020.12.15 -
[Python.NumPy] Y값 모델링 및 모델 평가 방법론
0. 요약 Boston Housing Data를 가지고 Y값을 예측해보는 실습을 해보자. Data를 웹으로부터 읽어 들이고, 벡터 곱을 하기 전 전처리를 수행하고, 벡터 곱을 통해 예측 Y값을 계산한 뒤에 실제 Y값과 비교하는 실습을 해보려고 한다. 총코드는 다음과 같다. import pandas as pd # 데이터 불러오기 & Column header 추가 data_url = 'https://archive.ics.uci.edu/ml/machine-learning-databases/housing/housing.data' # Data URL df_data = pd.read_csv(data_url, sep='\s+', header=None) # csv 타입 데이터 로드 print(df_data.values..
2020.11.30 -
[Python.ML] Pandas로 데이터 불러오기
0. 요약 Pandas란 무엇이고, Pandas를 통해 어떤 데이터를 읽어 들일 수 있는지 보려고 한다. 실제 예제를 통해서 어떻게 csv 형태의 데이터를 읽어 들일 수 있는지도 볼 계획이다. 2020/11/27 - [Python과 머신러닝/웹 데이터 추출] - [Python.ML] Python & Machine Learning Overview 2020/11/28 - [Python과 머신러닝/웹 데이터 추출] - [Python.ML] Feature, 독립변수, input 값 알아보기 [Python.ML] Python & Machine Learning Overview 요약 Machine Learning을 쉽게 설명하면, 컴퓨터에게 무한반복의 학습을 통해 하나의 task를 잘하도록 교육하는 것이다. Mach..
2020.11.30