pandas.cut
pandas.cut(x, bins, right=True, labels=None, retbins=False, precision=3, include_lowest=False, duplicates='raise', ordered=True)
- 데이터 값을 구간으로 나누어 세분화하고 정렬해야 할 때 사용한다.
- 연속형 변수를 범주형 변수로 변환할 때 유용하다.
Parameters
x : 배열
- 구간으로 나눌 배열. 단, 1차원 배열만 가능
bins : int, squence of scalars, IntervalIndex
- bins을 정의하는 기준
- int : x의 범위 내에서 동일한 폭의 bin의 수를 정의한다. x의 범위는 0.1%씩 증가하여 x의 최솟값과 최댓값을 포함한다.
- sqeuence of scalars : 비균일한 폭에 대해 bin의 가장자리를 정의한다. bins가 intervalIndex인 경우, 무시한다. x의 범위는 확장되지 않는다.
- IntervalIndex : 정확한 bin을 정의한다. IntervalIndex로 정의된 bin은 겹치지 않아야 한다.
right : bool, 기본값 true
- 구간의 끝을 포함하는 여부를 나타낸다.
- right = True인 경우, bins [1, 2, 3, 4]는 (1, 2], (2, 3], (3.4]으로 구간이 나눠진다. 즉, 시작값 초과 끝값 이하로 구간이 나눠진다.
추가 설명
- (a, b) : a 초과 b 미만 구간
- [a, b] : a 이상 b 이하 구간
- (a, b] : a 초과 b 이하 구간
- [a, b) : a 이상 b 미만 구간
Ref.
1. 공식 문서 / https://pandas.pydata.org/docs/reference/api/pandas.cut.html#pandas.cut
* 잘못된 부분에 대해 댓글 남겨주시면 감사하겠습니다! 😀
'Python' 카테고리의 다른 글
[Python/Selenium] 네이버 메일 전송 자동화 (0) | 2023.12.04 |
---|---|
[Python/Selenium] 네이버 로그인 (0) | 2023.12.03 |
[Python] bisect - 배열 이진 분할 알고리즘 (0) | 2023.05.25 |
[Python] map에 대하여 (0) | 2023.02.21 |
[Python] 리스트 컴프리헨션 (0) | 2023.02.13 |
pandas.cut
pandas.cut(x, bins, right=True, labels=None, retbins=False, precision=3, include_lowest=False, duplicates='raise', ordered=True)
- 데이터 값을 구간으로 나누어 세분화하고 정렬해야 할 때 사용한다.
- 연속형 변수를 범주형 변수로 변환할 때 유용하다.
Parameters
x : 배열
- 구간으로 나눌 배열. 단, 1차원 배열만 가능
bins : int, squence of scalars, IntervalIndex
- bins을 정의하는 기준
- int : x의 범위 내에서 동일한 폭의 bin의 수를 정의한다. x의 범위는 0.1%씩 증가하여 x의 최솟값과 최댓값을 포함한다.
- sqeuence of scalars : 비균일한 폭에 대해 bin의 가장자리를 정의한다. bins가 intervalIndex인 경우, 무시한다. x의 범위는 확장되지 않는다.
- IntervalIndex : 정확한 bin을 정의한다. IntervalIndex로 정의된 bin은 겹치지 않아야 한다.
right : bool, 기본값 true
- 구간의 끝을 포함하는 여부를 나타낸다.
- right = True인 경우, bins [1, 2, 3, 4]는 (1, 2], (2, 3], (3.4]으로 구간이 나눠진다. 즉, 시작값 초과 끝값 이하로 구간이 나눠진다.
추가 설명
- (a, b) : a 초과 b 미만 구간
- [a, b] : a 이상 b 이하 구간
- (a, b] : a 초과 b 이하 구간
- [a, b) : a 이상 b 미만 구간
Ref.
1. 공식 문서 / https://pandas.pydata.org/docs/reference/api/pandas.cut.html#pandas.cut
* 잘못된 부분에 대해 댓글 남겨주시면 감사하겠습니다! 😀
'Python' 카테고리의 다른 글
[Python/Selenium] 네이버 메일 전송 자동화 (0) | 2023.12.04 |
---|---|
[Python/Selenium] 네이버 로그인 (0) | 2023.12.03 |
[Python] bisect - 배열 이진 분할 알고리즘 (0) | 2023.05.25 |
[Python] map에 대하여 (0) | 2023.02.21 |
[Python] 리스트 컴프리헨션 (0) | 2023.02.13 |