많이 봐왔던 타이타닉 데이터로 사용한다. 데이터의 70퍼센트가 비어있다면 탈락시키는 방법이다. 80프로는 채워져있고, 비어있는 값은 중앙 값으로 채워줄 수 있다. 대다수의 값으로 채우는 방법도 있다! 전처리를 재활용할 수 있도록 함수로 만드는 방법이 효과적이다. Exploratory Data Analysis 카테고리별로 데이터를 묶는다. 시각화를 보고 데이터를 파악한다. nun을 전부 28을 넣었기 때문에 28이 엄청 많아졌다. 다양하게 데이터들끼리 묶어서 확인해 볼 수 있다. Feature Engineering sex_to_id에선 male = 0, female =1로 가져서 위와 같은 과정을 거치면 010101로 바꿀 수 있게 된다. 함수를 만들어서 관리한다! 실행하면 지금은 성별에 대한 정보만 남는..