반응형

파이썬 문자열에서 한글 초성 얻어내기 

 

<참조> http://smlee729.github.io/python/natural%20language%20processing/2015/12/29/korean-letter-processing-search.html

 

 

글. 수알치 오상문 sualchi@daum.net

 

원래 파이썬2로 작성된 코드를 파이썬3에서 동작하도록 수정한 코드입니다. 

원래 코드는 앞에 있는 참조 링크로 이동하면 볼 수 있습니다.

 

    

def getChosung(text):

    CHOSUNG_START_LETTER = 4352

    JAMO_START_LETTER = 44032

    JAMO_END_LETTER = 55203

    JAMO_CYCLE = 588

    

    def isHangul(ch):

        return ord(ch) >= JAMO_START_LETTER and ord(ch) <= JAMO_END_LETTER

    

    result = ""

    for ch in text:

        if isHangul(ch): #한글이 아닌 글자는 걸러냅니다.

            # python2: result += unichr((ord(ch) - JAMO_START_LETTER)/JAMO_CYCLE + CHOSUNG_START_LETTER)

            result += chr(int((ord(ch) - JAMO_START_LETTER)/JAMO_CYCLE + CHOSUNG_START_LETTER))      

    return result

 

# 사용 예 

print(getChosung("우리나라 만세!"))      #  출력: o ㄹ ㄴ ㄹ ㅁ ㅅ 

 

<이상> 

 

 

반응형

+ Recent posts