한자-한글 변환기에서 사용되는 모듈입니다.
pip install hanja
>>> from hanja import hanja, hangul
>>> hangul.separate(u'가') (0, 0, 0) >>> hangul.separate(u'까') (1, 0, 0)
튜플(tuple)의 마지막 원소가 0이면 종성이 없는 글자라고 판단할 수 있다.
>>> hangul.separate(u'한') (18, 0, 4)
'ㅎ'은 19번째 자음, 'ㅏ'는 첫번째 모음, 'ㄴ'은 다섯번째 자음이라는 것을 알 수 있다.
>>> hangul.build(0, 0, 0) u'uac00' >>> print Hangul.build(0, 0, 0) 가
>>> hangul.is_hangul(u'가') True >>> hangul.is_hangul(u'a') False
리스트가 아닌 제네레이터(generator)를 반환한다.
>>> '은 이다.
>>> [x for x in hanja.split_hanja(u'大韓民國은 **共和國이다.')] [u'u5927u97d3u6c11u570b', u'uc740 ', u'u6c11u4e3bu5171u548cu570b', u'uc774ub2e4.']
>>> hanja.is_hanja(u'韓') True
>>> hanja.is_hanja(u'한') False
치환 모드 변환:
>>> hanja.translate(u'大韓民國은 **共和國이다.', 'substitution') 대한민국은 민주공화국이다.
혼용 모드 변환:
>>> hanja.translate(u'大韓民國은 **共和國이다.', 'combination') <span class="hanja">大韓民國</span><span class="hangul">(대한민국)</span>은 <span class="hanja">**共和國</span><span class="hangul">(민주공화국)</span>이다.