본문 바로가기
기초통계

[기초]사분위수와 백분위수 이해하기

by Boggi 2024. 2. 22.
반응형
데이터 분석을 할 때, ADsP공부를 할 때  사분위수에 대한 내용을 알 수 있다. 그럼 사분위수는 데이터 분석을 할 때 중요하게 적용이 된다는건데 25%, 50%, 75% 사분위수 구하기 공식을 그냥 외웠던 사람이라면 이 시간 사분위수의 쌩기초를 익혀보자.

 

1. 사분위수 이해하기

 

분위수(quantile)란?

데이터를 순서대로 늘어 놓았을 때 이를 균등한 가격으로 나누는 기준점

 

그럼, 사분위수는?

데이터 전체를 4등분했다는 것!

그래서 데이터 통계값을 구할 수 있는 describe함수에서는 25%값, 50%값, 75%값을 구하게 된다.

 

25%에 해당하는 값 = 제1사분위수

50%에 해당하는 값 = 제2사분위수

75%에 해당하는 값 = 제3사분위수

 

파이썬으로 사분위수 구하기

 

1) 기술통계를 보여주는 describe함수

남산도서관 데이터를 ns_book7변수에 담아 head로 확인

 

 

2) quantile()메서드

 

quantile메서드는 하나씩 혹은 원하는 분위수를 소숫점으로 지정해서 확인할 수 있다.

 

백분위수 이해하기

복습해보자!

 

분위수(quantile)란?

데이터를 순서대로 늘어 놓았을 때 이를 균등한 가격으로 나누는 기준점

 

사분위수는?

데이터 전체를 4등분했다는 것!

 

 

그럼, 백분위수(percentile)는?

전체 데이터를 100개 구간으로 나누면 백분위수가 된다.

 

파이썬으로 백분위 구해보기

ns_book7대출건수 10이 위치한 백분위를 찾아보자

 

1. '대출건수'열의 값이 10보다 작은지 비교하여 불리언 배열 만들기

 

불리언 배열이란 True, False값으로 이루어진 배열을 의미한다.

불리열 배열로 변환한 borrow_10_flag 변수에서 True의 개수를 모두 헤아린 후 전체 데이터 개수로 나누면 10보다 작은 대출건수의 비율을 얻을 수 있다.

 

2. mean() 메서드로 평균구하기

 

mean() 메서드로 평균을 구하면 10보다 작은 값이 차지하는 비율을 얻을 수 있다.

10에 대한 백분위는 0.65가 되는 걸 알 수 있다.

 

3. quantile() 메서드로 백분위 확인하기

 

 

출처:

'기초통계' 카테고리의 다른 글

최빈값(mode) 구하기  (0) 2024.02.23
표준편차(standard deviation) 구하기  (0) 2024.02.23
분산구하기  (0) 2024.02.23