Knowledge Map

파이썬 한글 정규표현식 본문

PYTHON

파이썬 한글 정규표현식

2016. 4. 5. 11:25

출처  http://pwnbit.kr/48




1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
# -*- coding: utf-8 -*-
import re
 
 
def test():
    s='韓子는 싫고, 한글은 nice하다. English 쵝오 -_-ㅋㅑㅋㅑ ./?!'
 
    hangul = re.compile('[^ ㄱ-ㅣ가-힣]+'# 한글과 띄어쓰기를 제외한 모든 글자
    #    hangul = re.compile('[^ \u3131-\u3163\uac00-\ud7a3]+')  # 위와 동일
    #    hangul = re.compile('[^ \.\,\?\!a-zA-Z0-9\u3131-\u3163\uac00-\ud7a3]+') # 한글과 영어 숫자 몇몇 부호, 띄어쓰기 제외(2)
 
    result = hangul.sub('', s) # 한글과 띄어쓰기를 제외한 모든 부분을 제거
    print (result)
 
    result = hangul.findall(s) # 정규표현에 일치되는 부분을 리스트 형태로 저장
    print (result)
        
>> 출력 결과
는 싫고 한글은 하다  쵝오 ㅋㅑㅋㅑ 
['韓子'',''nice''.''English''-_-''./?!']
        
>> (2) 출력 결과
는 싫고, 한글은 nice하다. English 쵝오 ㅋㅑㅋㅑ .?!
['韓子''-_-''/']
cs



나중에 다시 보기

그런데 일치되지 않는 부분을 저장하는데... 흠...

'PYTHON' 카테고리의 다른 글

텍스트 파일 읽어오기 및 슬라이싱  (0) 2016.04.10
파이썬 강의 필기 2일차  (0) 2016.04.10
파이썬 강의 필기 1일차  (0) 2016.04.03
python2 & python3 설치  (0) 2016.03.19
크롤링 lxml  (0) 2016.03.13
Comments