Data Analysis

[ Python ] 범위

곽수진 2021. 9. 9. 18:19
반응형

범위

[ ] : 내부에 해당하는 문자열의 범위 중 한 문자만 선택함

→ 내부에서는 위에서 사용했던 대표문자가 사용할 수 없거나 의미가 다르게 사용됨

 

  • 소음자 모음만 탐색

▶️ 소문자 모음에는 a, e, i, o, u가 존재함

→ 대괄호 내에 소문자를 모두 넣어줌

→ source에서 a, e, i, o, u를 찾으라는 의미

 

 

다음 전화번호 세 개를 모두 출력하려면?

 

▶️ 숫자가 한개 이상이고 공백, -가 있거나 없는 패턴의 전화번호 3개를 source에 저장함

 

 

▶️ \d+ : 숫자가 한 개 이상

▶️ [ -]? : 공백, -가 있거나 없거나

 

 

다음 전화번호 네 개를 모두 출력하려면?

 

▶️ 숫자가 한개 이상이고 공백, -, .이 있거나 없는 패턴의 전화번호 3개를 source에 저장함

 

 

▶️ \d+ : 숫자가 한 개 이상

▶️ [ -.]? : 공백, -, .이 있거나 없거나

 

 

알파벳 26글자를 탐색하려면?

 

▶️ 새로 저장된 source는 위와 같음

 

 

▶️ 소문자 모음만 탐색하기 위해서 [a, e, i, o, u]를 지정했던것과 마찬가지로 [abcdefghijklmnopqrstuvwxyz] 모두 작성해도 알파벳 26글자를 모두 탐색할 수 있음

 

 

  • -를 이용해서 범위를 지정해줄 수 있음 → [ - ]

⇒ 범위는 유니코드 기반으로 정할 수 있음

 

▶️ [abcdefghijklmnopqrstuvwxyz] 대신 [a-z]로 편리하게 작성 가능

 

 

  • ^(caret) : 제외

→ 범위 밖에서 사용할 때는 '시작'을 의미했지만 범위 내에서는 '제외'를 의미함

 

 

숫자를 제외하고 출력해라

 

▶️ [^0-9] : 0부터 9를 제외하고 출력하라

= 숫자를 제외하고 출력하라는 것과 같은 의미

 

 

알파벳 소문자만 탐색해라.

 

▶️ [a-z]+ : 소문자 a부터 z까지로 시작하는 한 자리 이상의 단어를 탐색해라

 

 

알파벳 대소문자 모두 탐색해라

 

▶️ [a-zA-Z]+ : 소문자 a부터 z까지, 대문자 A부터 Z까지로 시작하는 한 자리 이상의 단어를 탐색해라

 

 

어느 알파벳이 먼저인지 판단하기 어려울 때?

→ 구글에 유니코드 검색

 

 

알파벳 i가 먼저인지 p가 먼저인지 확인해라

 

▶️ 범위 i-p를 분석하면 올바르게 출력됨

 

 

▶️ 범위 p-i를 분석하면 범위가 잘못 되었다는 오류가 발생함

 

⇒ i가 p보다 유니코드 기준 순서가 먼저임

 

 

한글의 유니코드 기준은?

→ 구글에 유니코드 검색

 

ord 함수

 

▶️ ord 함수를 이용하면 유니코드 순서를 알려줌

 

 

▶️ 영어와 한글 모두 ord 함수를 통해 유니코드 순서를 알 수 있음

→ 어떤게 먼저인지 파악하기 편리함

 

 

▶️ hello 변수에 '안녕하세요'를 저장함

▶️ [가-힣] : 한글의 유니코드 순서 기준 각각 첫 번째값과 마지막 값

전체를 찾으라는 말과 동일함

반응형

'Data Analysis' 카테고리의 다른 글

데이터 추출 연습  (0) 2021.09.09
[ Python ] 그룹(Groups)  (0) 2021.09.09
[ Python ] 수량자  (0) 2021.09.09
[ Python ] 이스케이프  (0) 2021.09.09
용돈 분석 및 출력  (0) 2021.09.09