URL의 점 개수를 세보자.

[❌] 이와 같이 하면 점의 개수가 아닌 문자열의 길이가 출력된다.

[⭕] 아래와 같이 해야 제대로 된 값이 출력된다. (1번째 줄 또는 2번째 줄)

Why?
pandas.Series.str.count는 각 문자열 요소에서 특정 정규식 패턴이 반복되는 횟수를 계산하는 데 사용된다.
- 정규식에서 마침표(.)는 정규식을 구성하는 특수문자로 줄바꿈 문자인 \n을 제외한 모든 문자와 매치됨을 의미한다.
- 마침표(.) 자체를 표현하려면 앞에 백슬래시 기호를 추가하거나 [ ] 안에 넣어줘야 한다. → \. or [.]
- 정규식에서 [ ]는 '[ ] 사이에 있는 문자들과 매치'라는 의미를 갖는다.
Ref.
1. https://stackoverflow.com/questions/59704959/pandas-count-dots-in-a-string-same-as-length
2. https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.str.count.html
'Python' 카테고리의 다른 글
[Python/Selenium] 네이버 로그인 (0) | 2023.12.03 |
---|---|
[Python] bisect - 배열 이진 분할 알고리즘 (0) | 2023.05.25 |
[Python] map에 대하여 (0) | 2023.02.21 |
[Python] 리스트 컴프리헨션 (0) | 2023.02.13 |
[Python] 리스트 정렬 (0) | 2023.02.01 |
URL의 점 개수를 세보자.

[❌] 이와 같이 하면 점의 개수가 아닌 문자열의 길이가 출력된다.

[⭕] 아래와 같이 해야 제대로 된 값이 출력된다. (1번째 줄 또는 2번째 줄)

Why?
pandas.Series.str.count는 각 문자열 요소에서 특정 정규식 패턴이 반복되는 횟수를 계산하는 데 사용된다.
- 정규식에서 마침표(.)는 정규식을 구성하는 특수문자로 줄바꿈 문자인 \n을 제외한 모든 문자와 매치됨을 의미한다.
- 마침표(.) 자체를 표현하려면 앞에 백슬래시 기호를 추가하거나 [ ] 안에 넣어줘야 한다. → \. or [.]
- 정규식에서 [ ]는 '[ ] 사이에 있는 문자들과 매치'라는 의미를 갖는다.
Ref.
1. https://stackoverflow.com/questions/59704959/pandas-count-dots-in-a-string-same-as-length
2. https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.str.count.html
'Python' 카테고리의 다른 글
[Python/Selenium] 네이버 로그인 (0) | 2023.12.03 |
---|---|
[Python] bisect - 배열 이진 분할 알고리즘 (0) | 2023.05.25 |
[Python] map에 대하여 (0) | 2023.02.21 |
[Python] 리스트 컴프리헨션 (0) | 2023.02.13 |
[Python] 리스트 정렬 (0) | 2023.02.01 |