반응형 타이타닉 데이터 분석1 타이타닉 데이터로 알아보는 승객 정보와 생존률 1. 목적 실제로 여성이 남성보다 생존률이 높을까? 실제로 1등석 승객이 3등석 승객보다 생존률이 높을까? 그 당시 티켓의 가격은 어땠을까? 어떤 사람들이 배에 승선했을까? 타이타닉 영화를 보며 궁금해지는 과거의 상황을 유추해보고 의사결정나무로 분류 분석 모델을 만들어보자. 2. 분석 대상 데이터 타이타닉에 탑승한 891명의 승객 데이터 3. 분석 결과 클래스과 생존률의 관계는 상관이 있다. 성별과 생존률의 관계는 상관이 있다. 나이와 생존률의 관계는 상관이 있다. 결론: 3등선, 20대&30대&40대 남자가 많은 희생을 당했다. 모델 성능 Accuracy (정확도): 0.8379 전체 테스트 데이터 중 올바르게 예측한 비율로, 약 83.8%의 정확도를 보인다. Classification Report (.. 2024. 1. 10. 이전 1 다음