파이썬(34)
-
[Python.Pandas] DataFrame.apply, DataFrame.applymap
0. 이전 포스트 2020/12/19 - [Python과 머신러닝/Pandas 데이터 분석] - [Python.Pandas] Lambda함수와 Map함수 이해하기 - Series.map 2020/12/20 - [Python과 머신러닝/Pandas 데이터 분석] - [Python.Pandas] Map 함수 실전편 + .replace함수 사용하기 [Python.Pandas] Lambda함수와 Map함수 이해하기 - Series.map 1. Lambda란? In [1]:def f1(x,y): return x+y In [2]:f1(1,2) Out[2]:3 In [3]:f2=lambda x,y:x+y In [4]:f2(1,2) Out[4]:3 Lambda란 함수를 한 줄로 표현하는 익명 함수 기법이다. lisp ..
2020.12.21 -
[Python.Pandas] Map 함수 실전편 + .replace함수 사용하기
0. 이전 포스트 2020/12/19 - [Python과 머신러닝/Pandas 데이터 분석] - [Python.Pandas] Lambda함수와 Map함수 이해하기 - Series.map [Python.Pandas] Lambda함수와 Map함수 이해하기 - Series.map 1. Lambda란? In [1]:def f1(x,y): return x+y In [2]:f1(1,2) Out[2]:3 In [3]:f2=lambda x,y:x+y In [4]:f2(1,2) Out[4]:3 Lambda란 함수를 한 줄로 표현하는 익명 함수 기법이다. lisp 언어에서 시작된 기법으.. coding-grandpa.tistory.com 1. wget으로 데이터 다운로드하여 .unique로 데이터 종류 분석하기 In [1..
2020.12.20 -
[Python.NumPy] 텍스트 데이터를 읽기 저장하기 - np.loadtxt/np.savetxt/np.load/np.save
1. np.loadtxt와 np.savetxt 예시 (텍스트 데이터 읽기 / 저장하기) In [1]:import numpy as np In [2]:a = np.loadtxt("./populations.txt", delimiter='\t') a Out[2]:array([[123., 234.], [345., 456.], [567., 678.]]) In [3]:a_int = a.astype(int) a_int Out[3]:array([[123, 234], [345, 456], [567, 678]]) In [4]:np.savetxt('int_data.csv', a_int, fmt='%.2e', delimiter=',') np.loadtxt : 123~678이라는 값을 가진 populations.txt에서 tab..
2020.12.14 -
[Python.NumPy] array 붙이기 hstack, vstack, concatenate - Operation Function II
0. 요약 여러 소스로부터 데이터를 받고 나면 이를 합치는 동작이 필요하다. 데이터를 입력받아 배열로 만들었다는 가정 하에, hstack/vstack과 concatenate 함수를 통해서 배열을 연결하는 동작을 배워보자. 1. hstack과 vstack In [1]:a = np.arange(1,4) a Out[1]:array([1, 2, 3]) In [2]:b = np.arange(4,7) b Out[2]:array([4, 5, 6]) In [3]:np.hstack((a,b)) Out[3]:array([1, 2, 3, 4, 5, 6]) In [4]:np.vstack((a,b)) Out[4]:array([[1, 2, 3], [4, 5, 6]]) hstack은 horizontal stack의 약자로 두 개의..
2020.12.09 -
[Python.NumPy] 차원별 sum 합, std 표준편차 구하기 - Operation Function I
0. 요약 여태까지는 주로 2차원 배열을 사용했지만, 실제 데이터는 3차원 이상의 데이터도 많다. 2차원 데이터의 합/평균 등을 구하는 방법을 이해해보자. 그리고 3차원 이상의 데이터가 되면 차원이 어떻게 변하는지 이해하고, 각 차원의 합을 구하는 방법도 정리해보자. 1. 2차원 배열에서 sum 함수 사용하기 In [1]:import numpy as np In [2]:test_array = np.arange(1,13).reshape(3,4) test_array Out[2]:array([[ 1, 2, 3, 4], [ 5, 6, 7, 8], [ 9, 10, 11, 12]]) In [3]:test_array.sum() Out[3]:78 1~12까지의 값을 갖는 test_array를 생성한다. 대부분의 라이브러..
2020.12.08 -
[Python.NumPy] Identity 행렬, eye, diag 함수 이해하기 - Creation Function III
0. 요약 이전 Creation Function에 관한 포스트를 보면 Creation function이 뭔지 더 쉽게 이해할 수 있다. 2020/12/04 - [Python과 머신러닝/Python 데이터 수집] - NumPy arange/zeros/empty 함수의 차이 - Creation Function I 2020/12/05 - [Python과 머신러닝/Python 데이터 수집] - NumPy ones_like, zeros_like, empty_like 함수 - Creation Function II 이번 포스트에서는 identity 행렬을 NumPy로 만드는 방법, 그리고 eye함수 diag 함수는 어떻게 사용할 수 있는지 보자. 1. Identity 행렬 만들기 #identity 행렬 만들기 (대각..
2020.12.06