[Python.JSON] Python으로 JSON 데이터 파싱 - 이론편
2020. 11. 24. 05:00ㆍPython과 머신러닝/웹 데이터 추출
요약
- JSON이란 무엇이고, Python으로 왜 JSON 데이터를 추출해야 할지 배워보자.
- 2020/11/13 - [Python과 머신러닝/웹 데이터 추출] - [Python.Web] 정규표현식을 이용한 웹 데이터 파싱 - urllib, regular expression
- 2020/11/17 - [Python과 머신러닝/웹 데이터 추출] - [Python.Web] wget으로 웹 데이터 다운로드 및 파싱 - wget.download
- 2020/11/18 - [Python과 머신러닝/웹 데이터 추출] - [Python.Web] 실시간 금융 데이터 파싱하기 추출
- 2020/11/20 - [Python과 머신러닝/웹 데이터 추출] - [Python.Web] BeautifulSoup으로 하는 웹크롤링, 데이터 스크레이핑
- 2020/11/23 - [Python과 머신러닝/웹 데이터 추출] - [Python.Web] BeautifulSoup과 wget 으로 웹크롤링, 데이터 스크레이핑
1. JSON이란
- JSON이란 JavaScript Object Notation의 줄임말이다.
- 웹 언어인 JavaScript의 데이터 객체를 표현하는 방식/언어이다.
- 간결하기 때문에 기계나 사람 모두가 이해하기 편하다.
- 데이터 용량이 적고 Code로의 전환이 쉽다는 장점이 있어서 XML을 대체하여 활용되고 있다.
- 간단한 예시를 보자.
{
"employees":[
{
"firstName":"John",
"lastName":"Doe"
},
{
"firstName":"Anna",
"lastName":"Smith"
},
{
"firstName":"Peter",
"lastName":"Jones"
}
]
}
2. JSON의 특징
- Python의 Dict 타입과 유사하다(Key:Value 쌍으로 데이터를 표현)
- JSON 모듈을 사용하여 간편한 Parsing 및 저장이 가능하다
- 데이터 저장 및 읽기는 Dict type과 상호 호환이 가능하다
- 웹에서 제공하는 API는 대부분 정보교환 시 JSON을 활용한다 (Facebook, Twitter, Github 등)
- 각 사이트의 Developer API를 확인하여 개발할 수 있다.
3. 관련 포스트
- 2020/11/25 - [Python과 머신러닝/웹 데이터 추출] - [Python.JSON] Python으로 JSON 데이터 읽기 - 실전편
- 2020/11/26 - [Python과 머신러닝/웹 데이터 추출] - [Python.JSON] Python으로 JSON 데이터 저장 및 전달 - 실전편
'Python과 머신러닝 > 웹 데이터 추출' 카테고리의 다른 글
[Python.JSON] Python으로 JSON 데이터 저장 및 전달 - 실전편 (0) | 2020.11.26 |
---|---|
[Python.JSON] Python으로 JSON 데이터 읽기 - 실전편 (0) | 2020.11.25 |
[Python.Web] BeautifulSoup과 wget 으로 웹크롤링, 데이터 스크레이핑 (0) | 2020.11.23 |
[Python.Web] BeautifulSoup으로 하는 웹크롤링, 데이터 스크레이핑 (0) | 2020.11.20 |
[Python.Web] 실시간 금융 데이터 파싱하기 추출 (0) | 2020.11.18 |