Python과 머신러닝(62)
-
[Python.Web] 정규표현식을 이용한 웹 데이터 파싱 - urllib, regular expression
웹사이트에서 원하는 형태의 데이터를 긁어오는 방법을 알아보자. 0. 요약 1. 원하는 URL을 정한다. 2. URL로부터 모든 text를 string으로 읽어온다. 3. 내가 찾고자 하는 string을 regular expression 형태로 정의한다. 4. re 라이브러리를 사용해서 원하는 text 부분들을 모두 추출한다. import re from urllib import request url="http://www.itemmania.com/notice/view.html?pub=PORTAL&type=all&nowPage=1&id=1542" html_str=str(request.urlopen(url).read()) #print(html_str) results = re.findall(r"\w+\*{3}",..
2020.11.13 -
보일러 플레이트(Boiler Plate) 이해하기
요약 BoilerPlate 코드란 모든 코드를 작성하기 위해 항상 필요한 부분을 의미한다. BoilerPlate는 다음 4가지로 구성되어 있다. Import : 필요한 코드를 불러들이는 부분 Component : 현 페이지를 구현하는 코드 StyleSheet : 페이지의 객체를 꾸미기 위한 style Export : 현 Javascript 코드를 타 Javascript에서 접근하기 위한 부분 용어 정의 코딩을 배우는 방법이 여러 가지 있겠지만, 그중 가장 쉽고 빠르게 결과를 만들 수 있는 방법은 바로 모방일 것이다. 간혹 전문서적을 보며 공부하시는 분들도 봤지만, 대부분의 경우는 블로그, 유튜브, 스펙 문서 등을 참고하여 '무작정' 짜다 보면 많은 부분을 이해하지 못하더라도 내가 원하는 대로 동작하게 만..
2020.10.31