데이터 분석을 할 때, ADsP공부를 할 때 사분위수에 대한 내용을 알 수 있다. 그럼 사분위수는 데이터 분석을 할 때 중요하게 적용이 된다는건데 25%, 50%, 75% 사분위수 구하기 공식을 그냥 외웠던 사람이라면 이 시간 사분위수의 쌩기초를 익혀보자.
1. 사분위수 이해하기
분위수(quantile)란?
데이터를 순서대로 늘어 놓았을 때 이를 균등한 가격으로 나누는 기준점
그럼, 사분위수는?
데이터 전체를 4등분했다는 것!
그래서 데이터 통계값을 구할 수 있는 describe함수에서는 25%값, 50%값, 75%값을 구하게 된다.
25%에 해당하는 값 = 제1사분위수
50%에 해당하는 값 = 제2사분위수
75%에 해당하는 값 = 제3사분위수
파이썬으로 사분위수 구하기
1) 기술통계를 보여주는 describe함수
2) quantile()메서드
quantile메서드는 하나씩 혹은 원하는 분위수를 소숫점으로 지정해서 확인할 수 있다.
백분위수 이해하기
복습해보자!
분위수(quantile)란?
데이터를 순서대로 늘어 놓았을 때 이를 균등한 가격으로 나누는 기준점
사분위수는?
데이터 전체를 4등분했다는 것!
그럼, 백분위수(percentile)는?
전체 데이터를 100개 구간으로 나누면 백분위수가 된다.
파이썬으로 백분위 구해보기
ns_book7대출건수 10이 위치한 백분위를 찾아보자
1. '대출건수'열의 값이 10보다 작은지 비교하여 불리언 배열 만들기
불리언 배열이란 True, False값으로 이루어진 배열을 의미한다.
불리열 배열로 변환한 borrow_10_flag 변수에서 True의 개수를 모두 헤아린 후 전체 데이터 개수로 나누면 10보다 작은 대출건수의 비율을 얻을 수 있다.
2. mean() 메서드로 평균구하기
mean() 메서드로 평균을 구하면 10보다 작은 값이 차지하는 비율을 얻을 수 있다.
10에 대한 백분위는 0.65가 되는 걸 알 수 있다.
3. quantile() 메서드로 백분위 확인하기
출처:
'기초통계' 카테고리의 다른 글
최빈값(mode) 구하기 (0) | 2024.02.23 |
---|---|
표준편차(standard deviation) 구하기 (0) | 2024.02.23 |
분산구하기 (0) | 2024.02.23 |