Knowledge Map
파이썬 한글 정규표현식 본문
출처 http://pwnbit.kr/48
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 | # -*- coding: utf-8 -*- import re def test(): s='韓子는 싫고, 한글은 nice하다. English 쵝오 -_-ㅋㅑㅋㅑ ./?!' hangul = re.compile('[^ ㄱ-ㅣ가-힣]+') # 한글과 띄어쓰기를 제외한 모든 글자 # hangul = re.compile('[^ \u3131-\u3163\uac00-\ud7a3]+') # 위와 동일 # hangul = re.compile('[^ \.\,\?\!a-zA-Z0-9\u3131-\u3163\uac00-\ud7a3]+') # 한글과 영어 숫자 몇몇 부호, 띄어쓰기 제외(2) result = hangul.sub('', s) # 한글과 띄어쓰기를 제외한 모든 부분을 제거 print (result) result = hangul.findall(s) # 정규표현에 일치되는 부분을 리스트 형태로 저장 print (result) >> 출력 결과 는 싫고 한글은 하다 쵝오 ㅋㅑㅋㅑ ['韓子', ',', 'nice', '.', 'English', '-_-', './?!'] >> (2) 출력 결과 는 싫고, 한글은 nice하다. English 쵝오 ㅋㅑㅋㅑ .?! ['韓子', '-_-', '/'] | cs |
나중에 다시 보기
그런데 일치되지 않는 부분을 저장하는데... 흠...
'PYTHON' 카테고리의 다른 글
텍스트 파일 읽어오기 및 슬라이싱 (0) | 2016.04.10 |
---|---|
파이썬 강의 필기 2일차 (0) | 2016.04.10 |
파이썬 강의 필기 1일차 (0) | 2016.04.03 |
python2 & python3 설치 (0) | 2016.03.19 |
크롤링 lxml (0) | 2016.03.13 |
Comments