범위
[ ] : 내부에 해당하는 문자열의 범위 중 한 문자만 선택함
→ 내부에서는 위에서 사용했던 대표문자가 사용할 수 없거나 의미가 다르게 사용됨
- 소음자 모음만 탐색
▶️ 소문자 모음에는 a, e, i, o, u가 존재함
→ 대괄호 내에 소문자를 모두 넣어줌
→ source에서 a, e, i, o, u를 찾으라는 의미
다음 전화번호 세 개를 모두 출력하려면?
▶️ 숫자가 한개 이상이고 공백, -가 있거나 없는 패턴의 전화번호 3개를 source에 저장함
▶️ \d+ : 숫자가 한 개 이상
▶️ [ -]? : 공백, -가 있거나 없거나
다음 전화번호 네 개를 모두 출력하려면?
▶️ 숫자가 한개 이상이고 공백, -, .이 있거나 없는 패턴의 전화번호 3개를 source에 저장함
▶️ \d+ : 숫자가 한 개 이상
▶️ [ -.]? : 공백, -, .이 있거나 없거나
알파벳 26글자를 탐색하려면?
▶️ 새로 저장된 source는 위와 같음
▶️ 소문자 모음만 탐색하기 위해서 [a, e, i, o, u]를 지정했던것과 마찬가지로 [abcdefghijklmnopqrstuvwxyz] 모두 작성해도 알파벳 26글자를 모두 탐색할 수 있음
- -를 이용해서 범위를 지정해줄 수 있음 → [ - ]
⇒ 범위는 유니코드 기반으로 정할 수 있음
▶️ [abcdefghijklmnopqrstuvwxyz] 대신 [a-z]로 편리하게 작성 가능
- ^(caret) : 제외
→ 범위 밖에서 사용할 때는 '시작'을 의미했지만 범위 내에서는 '제외'를 의미함
숫자를 제외하고 출력해라
▶️ [^0-9] : 0부터 9를 제외하고 출력하라
= 숫자를 제외하고 출력하라는 것과 같은 의미
알파벳 소문자만 탐색해라.
▶️ [a-z]+ : 소문자 a부터 z까지로 시작하는 한 자리 이상의 단어를 탐색해라
알파벳 대소문자 모두 탐색해라
▶️ [a-zA-Z]+ : 소문자 a부터 z까지, 대문자 A부터 Z까지로 시작하는 한 자리 이상의 단어를 탐색해라
어느 알파벳이 먼저인지 판단하기 어려울 때?
→ 구글에 유니코드 검색
알파벳 i가 먼저인지 p가 먼저인지 확인해라
▶️ 범위 i-p를 분석하면 올바르게 출력됨
▶️ 범위 p-i를 분석하면 범위가 잘못 되었다는 오류가 발생함
⇒ i가 p보다 유니코드 기준 순서가 먼저임
한글의 유니코드 기준은?
→ 구글에 유니코드 검색
ord 함수
▶️ ord 함수를 이용하면 유니코드 순서를 알려줌
▶️ 영어와 한글 모두 ord 함수를 통해 유니코드 순서를 알 수 있음
→ 어떤게 먼저인지 파악하기 편리함
▶️ hello 변수에 '안녕하세요'를 저장함
▶️ [가-힣] : 한글의 유니코드 순서 기준 각각 첫 번째값과 마지막 값
⇒ 전체를 찾으라는 말과 동일함
'Data Analysis' 카테고리의 다른 글
데이터 추출 연습 (0) | 2021.09.09 |
---|---|
[ Python ] 그룹(Groups) (0) | 2021.09.09 |
[ Python ] 수량자 (0) | 2021.09.09 |
[ Python ] 이스케이프 (0) | 2021.09.09 |
용돈 분석 및 출력 (0) | 2021.09.09 |