json to pandas
JSON과 Dictionary의 차이
JSON은 데이터를 교환하기 위한 형식으로, Dictionary는 자료형 중 하나

json.dump()를 하면, 데이터가 str타입으로 되기 때문에,
json(str)을 dictionary로 변환후, Key를 활용해 접근하는 방법이 일반적.
JSON을 Pandas DataFrame로 변환하는방법
json_normalize()
를 사용read_json()
을 사용- DataFrame.from_dict()
JSON(JavaScript Object Notation)
중첩 된 목록과 사전의 조합
json_normalize() 사용
json_normalize()
함수는 중첩 된 JSON 문자열을 읽고 DataFrame을 반환하는 데 매우 널리 사용됩니다. 이 함수를 사용하려면 먼저 Python의 JSON 라이브러리에있는json.loads()
함수를 사용하여 JSON 문자열을 읽어야합니다. 그런 다음이 JSON 객체를json_normalize()
에 전달하면 필요한 데이터가 포함 된 Pandas DataFrame이 반환됩니다.
json_normalize은 그 내용이 json인지 알지 못한다. 미리 load해서 알려주고 시작
read_json()
read_json()
에는 많은 매개 변수가 있으며,
그중orient
는 JSON 문자열의 형식을 지정합니다.
단점은 중첩된 JSON 문자열과 함께 사용하기 어렵다는 것입니다.
따라서read_json()
을 사용하기 위해 아래와 같이 훨씬 더 간단한 예제를 사용합니다.
JSON 문자열 fromat이 패턴과 {index: {column: value}}
와 일치하기 때문에orient
를'index'
로 설정합니다.
DataFrame.from_dict()
pd.DataFrame.from_dict(data, orient="index")
key를 index로 활용하여 DataFrame을 만든다.
해당하는 orient 파라미터는 columns으로 세팅하면 key를 column으로 사용
index/ columns/ tight
JSON 문자열 fromat이 패턴과 {index: {column: value}}
와 일치하기 때문에orient
를'index'
로 설정합니다.