Excel Pivot Table
컴활 따기 귀찮아서 엑셀 실력은 사실 거의 과제용 실력이 전부이지만 .. 피벗 테이블에 대해 간단히 배워보겠습니다.
예제 파일은 kaggle의 타이타닉 승선 승객 명단을 사용했습니다.
피벗 테이블은 데이터가 저장된 엑셀 파일에서 범위를 지정한 후, 데이터->피벗 테이블을 선택해 주면 됩니다.
문제 1. 승선한 항구(Embarked)에 따른 평균 요금(Fare) 나타내기
≫ 행에 Embarked, 열은 선택하지 않고 값에 Fare을 Average로 넣어주었습니다.
문제 2. 승선한 항구(Embarked)에 따른 성별(Sex)별 인원 수 나타내기
≫ 행에 Embarked, 열에 Sex, 값에 Passenger ID를 COUNTA로 넣어주었습니다.
* COUNT와 COUNTA는 둘다 범위에서 셀의 갯수를 구하는 함수이지만 COUNT는 숫자만, 문자는 미 포함 / COUNTA는 숫자와 문자 포함하여 셀의 갯수를 셉니다.
문제 3. 승선한 항구(Embarked)에 따른 성별(Sex)별 생존자 수 나타내기
≫ 행에 Embarked, 열에 Sex, 값에 Survived를 SUM로 넣어주었습니다.
문제 4. 티켓 등급(Pclass)에 따른 사망자 수, 생존자 수 나타내기
≫ 행에 Pclass, 열에 Survived, 값에 Passengerid를 COUNTA로 넣어주었습니다.
문제 5. 티켓 등급(Pclass)에 따른 생존율 계산하기
≫ 문제 4에서 만든 테이블의 E 행에 계산 행을 삽입합니다.
* 가장 생존율이 높은 티켓 등급은? - 통계만 본다면 1등급일 것입니다.
문제 6. 각 성별(Sex)별 생존율 계산하기
≫ 행으로 성별, 열에 Survived, 값에 Survived의 COUNTA를 입력했습니다. 그 후 E열에 계산식을 작성했습니다.
문제 7. 각 항구(Embarked)별 생존율 계산하기
≫ 행으로 항구, 열에 Survived, 값에 Survived의 COUNTA를 입력했습니다. 그 후 E열에 계산식을 작성했습니다.
위의 문제들에서 생각해 봅시다.
* 여성의 생존률이 더 높습니까? - 위 데이터만 봤을때, 그렇습니다.
* 승선한 항구가 생존 가능성에 영향을 준다고 볼 수 있습니까? - 어렵습니다.
* 전체 탑승자의 생존율은 얼마입니까?
Challenge 1 - 각 티켓 등급에 따른 성별별 생존 가능성 예측
Rows - Pclass, Sex
Columns - Survived
Values - Survived COUNTA