Python과 머신러닝/NumPy 데이터 분석(16)
-
[Python.NumPy] ndarray.reshape - 크기 변환하기
0. 요약 ndarray의 형태를 바꿔야 하는 경우는 생각보다 많다. 그래서 NumPy는 ndarray 배열의 재배치를 지원하는 .reshape 함수를 제공한다. 이 함수를 어떻게 사용할 수 있는지, 그 외의 -1 indexing과 .flatten() 함수의 용도를 알아보자. 관련 글 2020/11/30 - [Python과 머신러닝/Python 데이터 수집] - NumPy의 ndarray 이해하기 2020/11/30 - [Python과 머신러닝/Python 데이터 수집] - NumPy의 ndarray indexing과 slicing 1. 기본 데이터를 ndarray로 입력하고, .shape을 통해 기대한 값이 나오는지 확인 import numpy as np test_matrix = [[1, 2, 3, 4..
2020.11.30 -
[Python.NumPy] ndarray 이해하기
0. 요약 이번에는 ndarray란 무엇이고, 왜 필요한지 배워보려고 한다. ndarray를 어떻게 만들 수 있는지 배워보고, ndarray의 property는 어떤 것들이 있고, 어떻게 활용되는지 간단한 예제들을 통해서 배워보자. 1. ndarray 란 NumPy의 N차원 배열 객체이다. Python의 list와 가장 큰 차이점은, 하나의 데이터 타입만 넣을 수 있다는 점이다. (Python List는 Dynamic typing을 지원하지만, ndarray는 지원하지 않는다) C로 프로그래밍을 한 사람이라면, C의 Array와 동일하다고 이해하면 가장 쉽다. 2. int 타입의 ndarray 생성하기 # a의 list를 int 타입의 ndarray로 생성하여 a_ndarray 변수에 담는다. a = [..
2020.11.30 -
[Python.NumPy] Y값 모델링 및 모델 평가 방법론
0. 요약 Boston Housing Data를 가지고 Y값을 예측해보는 실습을 해보자. Data를 웹으로부터 읽어 들이고, 벡터 곱을 하기 전 전처리를 수행하고, 벡터 곱을 통해 예측 Y값을 계산한 뒤에 실제 Y값과 비교하는 실습을 해보려고 한다. 총코드는 다음과 같다. import pandas as pd # 데이터 불러오기 & Column header 추가 data_url = 'https://archive.ics.uci.edu/ml/machine-learning-databases/housing/housing.data' # Data URL df_data = pd.read_csv(data_url, sep='\s+', header=None) # csv 타입 데이터 로드 print(df_data.values..
2020.11.30 -
[Python.NumPy] 벡터/행렬 선언하기 및 벡터곱 연산하기
0. 요약 NumPy란 무엇인지 배우고, 왜 NumPy가 업계의 표준이 되었는지 이해한다. NumPy를 통해 Vector/행렬 선언을 어떻게 하고, 곱 연산까지 하는 방법을 예제를 통해 알아보자. 1. NumPy란 Numerical Python의 약자이다. 파이썬의 고성능 과학계산용 기초 패키지이다. Matrix와 Vector와 같은 Array 연산의 표준으로 인정받는 패키지이다. 이유는, 반복문 없이 데이터 배열에 대한 처리를 지원하기 때문에 일반 list에 비해 빠르고, 메모리 사용도 효율적이기 때문이다. 선형대수와 관련된 다양한 기능도 제공하고, C/C++/Fortran 등의 언어와 통합도 가능해서 사실상의 표준으로 자리매김하였다. 2. NumPy를 통한 Array 선언 및 Array 곱 계산 예제..
2020.11.30