• 제목/요약/키워드: Unicode

검색결과 68건 처리시간 0.03초

Unicode의 UTF-8 부호화 방식의 HDB-3 스크램블링 방식과의 적합성 (Compatibility of UTF-8 Encoding System to HDB-3 Scrambling Method)

  • 홍완표
    • 한국전자통신학회논문지
    • /
    • 제8권2호
    • /
    • pp.227-240
    • /
    • 2013
  • 본 논문에서는 국내 표준규격인 HDB-3 스크램블링 방식을 기준으로 유니코드(Unicode)의 한글낱자 및 호환용 한글낱자 부호와 이 부호가 UTF-8 부호체계로 변환되었을 때 원천부호화 규칙에 얼마나 부합되는지 여부를 분석하였다. 연구결과 유니코드 한글낱자 및 호환용 한글 낱자 부호체계와 UTF-8부호체계내에 문자의 원천 부호화 규칙에 위배되는 부호가 상당히 존재하는 것으로 나타났다. 특히 UTF-8로 변환함에 따라 그 위배율이 증가하는 것으로 분석되었다.

Unicode 기반 다국어 명함인식기 개발 (A Development of Unicode-based Multi-lingual Namecard Recognizer)

  • 장동협;이재홍
    • 정보처리학회논문지B
    • /
    • 제16B권2호
    • /
    • pp.117-122
    • /
    • 2009
  • 명함을 이용한 전세계적인 고객 관리 시스템을 구축하기 위해 다국어 명함인식기를 개발하였다. 먼저 다양한 언어의 문자인식 및 학습을 위해 Unicode 기반 문자 이미지 DB를 구축하였으며, 다양한 입력 장치를 통해 획득한 명함 영상에 대하여 정확한 데이터를 얻기 위한 다양한 컬러영상 처리 기술이 적용되었다. 다음에 다층 퍼셉트론 신경망, 언어 유형별 개별 문자인식, 각 언어별 명함에 사용된 필드별 키워드 DB를 이용한 후처리를 적용하여 명함 인식률을 향상시켰다.

데이터통신 전송효율과 라틴어 부호 체계 고찰 (A study on Code System of Latin Character to Improve Transmission Efficiency in Data Communications)

  • 홍완표
    • 한국전자통신학회논문지
    • /
    • 제7권4호
    • /
    • pp.761-776
    • /
    • 2012
  • 본 논문은 국제표준 문자부호 체계인 유니코드(Unicode) 3.0에 포함된 라틴어 문자에 관한 새로운 부호 체계를 제시하였다. 이 연구의 시작 배경은 Unicode 3.0의 라틴어 부호 체계가 데이터통신의 전송효율 측면에서 적정한가에 대한 것이었다. 데이터통신을 할 때, 4개 또는 8개 이상의 연속 "0"의 비트가 단말 정보기기로 부터 회선부호화 장치에 입력 될 수 있다. 이 경우에 그 비트열은 스크램블링 과정을 거쳐 연속 "0"이 아닌 비트열로 변경된다. 그러므로 단말 정보기기에서 처리되는 0 문자, 기호 등의 부호 체계에 따라서 데이터통신의 회선부호기 운용이 달라지게 된다. 즉, 데이터통신의 전송효율에 영향을 주게 된다. 이러한 관점에서 본 논문은 [1]에서 제시된 ($4{\times}4$)hexa 원천 부호화 규칙과 영어 문자의 사용빈도 통계를 적용하여 유니코드와 UTF-8의 라틴어 부호 체계에 대한 개선방안을 제시하였다. 그 결과 본 연구에서 제시한 개선된 유니코드와 UTF-8 라틴어 부호 체계를 적용할 경우, 회선부호기의 스크램블러 운용효율이 유니코드를 통신용으로 사용할 경우 최소 3645%에서 최대 31400%, 제시된 UTF-8 부호 체계를 적용할 경우 최소 480%에서 최대 1700%까지 개선되는 것으로 나타났다.

유니코드 환경에서의 올바른 한글 정규화를 위한 수정 방안 (Correction for Hangul Normalization in Unicode)

  • 안대혁;박영배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권2호
    • /
    • pp.169-177
    • /
    • 2007
  • 현재 유니코드에서 한글텍스트의 정규화 기법은 완성형 현대한글 음절과 옛한글을 표현하는 조합형 한글 그리고 호환 자모등과 같이 사용할 경우 원래의 글자와는 전혀 다른 글자의 조합을 만들어내는 문제점이 있다. 이러한 문제점은 호환 한글 자모 및 기호들의 잘못된 정규화 변환과 유니코드의 한글자모 조합 규칙에서 자모와 완성형 현대한글 음절을 다시 조합하여 한글음절로 사용 할 수 있게 허용한 때문이다. 이는 정규화 형식을 처음 작성할 당시 옛한글의 사용을 고려하지 않았거나, 한글에 대한 올바른 이해가 부족한 상태에서 작성 된데 따른 결과라 하겠다. 따라서 본 연구에서는 유니코드 환경에서의 한글 코드와 특히 최근 들어 Web을 비롯하여 XML과 IDN에서 필연적으로 사용하는 정규화에 따른 문제점을 파악하고 이들을 올바르게 처리하기 위한 정규화의 수정 방안과 조합형 한글의 조합 규칙에 대한 수정 방안을 제안한다.

유니코드 한자 검색의 문제점 및 개선방안 (Problems with Chinese Ideographs Search in Unicode and Solutions to Them)

  • 이정현
    • 정보화정책
    • /
    • 제19권3호
    • /
    • pp.50-63
    • /
    • 2012
  • 본고는 국내 한국학 관련 데이터베이스, 국내 도서관, 국내 학술 데이터베이스, 해외 도서관의 한자 검색 현황을 분석하여 문제점을 파악하고 개선 방안을 도출해 보고자 하였다. 유니코드 환경에서 한자 검색이 문제가 되는 주요한 이유를 '다중코드자', '간체자'와 '이체자'로 정리하고, 각각 3글자를 샘플로 검색하여 현황을 정리하였다. 한국학 관련 데이터베이스 13개, 국내 도서관 데이터베이스 5개, 국내 학술 데이터베이스 4개, 해외 도서관 데이터베이스 2개의 한자검색 현황을 조사하였다. 다중코드자에 대한 검색을 지원하기 위해서는 유니코드 컨소시엄에 공개된 소스를 적용해야 한다. 간체자와 이체자에 대한 검색 기능을 개선하기 위해서는 신뢰할 수 있는 매칭테이블을 표준화하여 유니코드 컨소시엄에 제안해야 한다.

  • PDF

A Phonological Process Code in Unicode for the Standardization of Hangul(Korean Alphabet) Pronunciation

  • Min, Cheong-Sick
    • 한국컴퓨터정보학회논문지
    • /
    • 제20권12호
    • /
    • pp.145-152
    • /
    • 2015
  • In this paper, a standardized phonological rule should be embodied for all people who want to use Hangul beyond nationality. This researcher suggested a phonological process protocol in unicode for the purpose of developing a computer system-based program as one of methods to pronounce Hangul correctly. First of all, to solve a problem of standardizing Hangul pronunciation, it is necessary to develop a phonological process system. In other words, when a mobile phone or a keyboard is used, inputted strings should be changed exactly by an automatic device made according to the phonological rule. For this, a phonological process table is the most important and unicode which digitalizes Hangul is the most effective. Therefore, the purpose of this study is to complete a phonological process table, suggest an algorithm by the table, and develop a computer program pursuing correct Hangul pronunciation. For the methodology of this study, the features of unicode was used to solve a problem of coding each syllable by phonemes after strings were inputted from the phonological process program. This study suggested a protocol that sounds of inputted strings were automatically changed via recombination using a phonological process table. The ultimate purpose of the study was to help pronounce Hangul correctly according to the pronunciation rule.

Unicode 한글낱자의 UTF-8 부호화에 따른 HDB-3 스크램블링 발생빈도 (Scrambling Occurrence Frequency in HDB-3 in UTF-8 Coding of UNICODE Hangul Jamo)

  • 홍완표
    • 한국항행학회논문지
    • /
    • 제19권2호
    • /
    • pp.153-160
    • /
    • 2015
  • 본 논문은 국제적 문자부호체계인 유니코드 내에 있는 한글낱자와 호환용 한글낱자 부호를 통신망에 전송하기 위해 UTF-8부호로 변환할 때 회선부호기에서 발생하는 스크램블링의 발생빈도를 연구하였다. 본 논문에서 적용한 회선부호기의 스크램블링 방식은 ITU 및 한국의 표준전송방식인 HDB-3방식으로 하였다. 각 한글낱자부호에서 발생하는 스크램블링을 분석하기 위해 원천 부호화규칙을 적용하였다. 스크램블링 발생량은 각 한글낱자에서 발생하는 스크램블링의 발생횟수와 각 한글낱자의 사용빈도에 의한 발생 빈도율을 추출하였다. 연구결과 한글낱자의 부호에 대한 스크램블링 발생은 유니코드 체계내에서 24번, 52%, UTF-8체계 내에서 148번, 228%발생하였다. 호환용 한글낱자 부호에서는 유니코드 체계내에서 10번, 14%, UTF-8 체계 내에서 83번, 131%발생하였다. 즉, 유니코드체계의 한글낱자와 호환용 한글낱자는 UTF-8체계로 변환하면서 스크램블링 발생 빈도율이 각각 340%, 851%증가하는 것으로 나타났다.

데이터전송효율을 고려한 유니코드의 한글글자마디에 대한 연구 (A Study on the Hangul Syllables of Unicode System considering Data Transmission Efficiency)

  • 홍완표
    • 한국전자통신학회논문지
    • /
    • 제10권1호
    • /
    • pp.39-46
    • /
    • 2015
  • 본 논문은 유니코드 한글글자마디부호를 사용할 때 스크램블링으로 인하여 회선부호기의 데이터 전송효율에 미치는 영향을 연구하였다. 회선부호기의 스크램블링은 원천부호의 문제를 해결하기 위한 것이다. 본 논문은 장거리전송에 사용되는 AMI회선부호화에 적용하는 국제표준방식인 HDB-3 스크램블링 방식을 토대로 하였다. 본 연구에 필요한 한글글자마디와 이에 대한 사용빈도는 국립국어원의 한국어자료를 분석한 데이터를 사용하였다. 연구결과 유니코드 한글글자마디에서 평균 24%의 스크램블링이 발생하였다. 유니코드 한글글자마디부호에 참고된 한글글자마디를 적용할 경우에 평균 27%의 스크램블링이 발생하였다. 유니코드 총 11,172개의 한글글자마디에서 스크램블링이 발생하지 않는 글자마디는 총 8,928개였다. 그러므로 참고된 한글글자마디 총1,540자를 스크램블링이 발생하지 않는 부호영역에 수용하여 스크램블링이 발생되지 않는 원천부호체계를 만드는 것이 가능하다는 결론을 도출하였다. 새로운 한글글자마디 부호체계를 적용할 경우, 27%의 스크램블링을 완전히 제거할 수 있다. 또한 물리계층의 회선 부호화기에서 발생하는 스크램블링을 표현계층에서 소프트웨어 적으로 수행하게 되어, 회선부호기의 데이터전송처리 효율을 최소 27%이상 제고시킬 수 있다.

송본(宋本) "상한론(傷寒論)"의 한중(韓中) Code 비교(比較) 비교대어송본(比較對於宋本)"상한론(傷寒論)"적한국화중국지(的韓國和中國之)Code

  • 이병욱;신상우;김은하
    • 대한한의학원전학회지
    • /
    • 제18권4호통권31호
    • /
    • pp.83-92
    • /
    • 2005
  • 도금일(到今日), 동양의학재한중일삼국수저자기적특색이연구발전이래(東洋醫學在韓中日三國隨著自己的特色而硏究發展而來). 이차저한중일삼국위료동양의학적세계화(而且這韓中日三國爲了東洋醫學的世界化), 과학화부단지재진행협조화노력(科學化不斷地在進行協助和努力). 유우동양의학이경주상료세계화(由于東洋醫學已經走上了世界化), 저삼국재소용적의학술어화기유적나사문헌자료적교류수요취월래월고료(這三國在所用的醫學述語和旣有的那些文獻資料的交流需要就越來越高了). 가시재문헌교류화의학용어적표준화과정중발현료일개흔대적장애, 저개장애취시(這個障碍就是)unicode. 당연(當然)unicode시위료재국가지간사적저사정보령활교류이제정작성적(是爲了在國家之間使的這些情報靈活交流而制定作成的). 가시(可是)unicode제정지전(制定之前), 각국이경위료각각적수구이연발료적합자기적한자계통(各國已經爲了各各的需求而硏發了適合自己的漢子系統). 현재적(現在的)unicode취시용나사기유적한자(就是用那些旣有的漢子)code제정적(制定的). 유우(由于)unicode피저양제정종이산생불소계통상적모순문제(被這樣制定終而産生不少系統上的矛盾問題). 저사문제불근영향도료계통지외(這些問題不僅影響到了系統之外), 이차우조애료한의학정보적령활교류(而且又阻碍了韓醫學情報的靈活交流). 위료해결저사문제(爲了解決這些問題). 본인이상한론위연구대상래비교료일하한국화중국적한자(本人以傷寒論爲硏究對象來比較了一下韓國和中國的漢子)code차이(差異).

  • PDF

유니코드의 한글 인코딩 표준안 (Hangul Encoding Standard based on Unicode)

  • 안대혁;박영배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권12호
    • /
    • pp.1083-1092
    • /
    • 2007
  • 현재 유니코드에서 한글 텍스트의 인코딩 기법은 '완성형 현대한글 음절'과 주로 옛한글을 표현하는데 사용되는 '자모 조합형 한글'로 나뉘고 있다. 그러나 정규화 변환과 유니코드의 한글자모 조합 규정에서 자모와 완성형 현대한글 음절을 다시 조합하여 한글음절로 사용할 수 있게 허용했기 때문에, 구현하는 사람마다 각기 서로 다르게 한글 인코딩을 하고 있다. 이는 인코딩과 정규화 형식을 처음 작성할 당시 옛한글의 확장 사용을 고려하지 않았거나, 한글에 대한 올바른 이해가 부족한 상태에서 작성된 데 따른 결과라 하겠다. 결과적으로 한 개의 한글음절에 대한 여러 가지 표현 방법이 존재함으로써 한글 문자열의 검색, 비교, 정렬에 문제점이 발생한다. 따라서 본 연구에서는 현재 사용되고 있는 한글 인코딩 방법을 중심으로 정규화에 의한 부작용 등의 문제점을 분석하고, 이들을 올바르게 처리하기 위한 효율적인 단일 한글 인코딩 표준 방안을 제안한다.