json to pandas

Published by onesixx on

JSON과 Dictionary의 차이

JSON은 데이터를 교환하기 위한 형식으로, Dictionary는 자료형 중 하나

json.dump()를 하면, 데이터가 str타입으로 되기 때문에,
json(str)을 dictionary로 변환후, Key를 활용해 접근하는 방법이 일반적.

Python

JSON을 Pandas DataFrame로 변환하는방법

  1. json_normalize()를 사용
  2. read_json()을 사용
  3. DataFrame.from_dict()

JSON(JavaScript Object Notation)

중첩 된 목록과 사전의 조합

JSON

json_normalize() 사용

json_normalize()함수는 중첩 된 JSON 문자열을 읽고 DataFrame을 반환하는 데 매우 널리 사용됩니다. 이 함수를 사용하려면 먼저 Python의 JSON 라이브러리에있는json.loads()함수를 사용하여 JSON 문자열을 읽어야합니다. 그런 다음이 JSON 객체를json_normalize()에 전달하면 필요한 데이터가 포함 된 Pandas DataFrame이 반환됩니다.

Python

json_normalize은 그 내용이 json인지 알지 못한다. 미리 load해서 알려주고 시작

Python

read_json()

read_json()에는 많은 매개 변수가 있으며,
그중orient는 JSON 문자열의 형식을 지정합니다.

단점은 중첩된 JSON 문자열과 함께 사용하기 어렵다는 것입니다.
따라서read_json()을 사용하기 위해 아래와 같이 훨씬 더 간단한 예제를 사용합니다.

Python

JSON 문자열 fromat이 패턴과 {index: {column: value}}와 일치하기 때문에
orient'index'로 설정합니다.

DataFrame.from_dict()

pd.DataFrame.from_dict(data, orient="index")
key를 index로 활용하여 DataFrame을 만든다.
해당하는 orient 파라미터는 columns으로 세팅하면 key를 column으로 사용

index/ columns/ tight

Python

JSON 문자열 fromat이 패턴과 {index: {column: value}}와 일치하기 때문에
orient'index'로 설정합니다.

Python
Categories: pandas

onesixx

Blog Owner

Subscribe
Notify of
guest

0 Comments
Inline Feedbacks
View all comments
0
Would love your thoughts, please comment.x
()
x