Data Visualization

데이터 사이언스 – 데이터 시각화

데이터 시각화 데이터 전처리 1. 바이올린 플롯(Viloin Plot) 특징 ex) df_space의 Age를 바이올린 플롯으로 출력합니다. ex) df_space에서 중심축 좌우를 Transported로 구분하고 x축은 HomePlanet으로, y축은 Age로 하여 바이올린 플롯으로 출력합니다. 2. …

data scientist

데이터 사이언스 – 데이터 분류

데이터의 종류에는 어떤 것들이 있는지 정리해봅니다. 1.데이터의 종류 정형 데이터(Structured Data) ex) CSV 파일, 관계형 DB 테이블 정형 데이터의 분류 df_titanic = pd.read_csv(‘data/titanic.csv’)df_titanic.head() df_titanic[[‘Survived’, ‘Pclass’, ‘Sex’, ‘Embarked’]].apply( lambda x: x.loc[x.notna()].unique().tolist() …