Extending the MARTIF and TEI for Korean Lexical Entities

한국어사전 인코딩체계의 확장에 관한 연구: MARTIF와 TEI를 중심으로

  • 백지원 (이화여자대학교 대학원) ;
  • 최석두 (이화여자대학교 문헌정보학과)
  • Published : 2001.06.01

Abstract

The purpose of this study is to present a scheme to encode all possible lexical entities in dictionaries, glossaries, encyclopedias, and thesaurus, etc. First, it discussed the nature and structure of dictionaries. Second, two current major terminological data encoding schemes, MARTIF and TEI were analyzed in terms of their flexibility for extension to encompass all lexical entities. Third, an integrated microstructure of dictionaries was presented and compared with the MARTIF and TEI for print dictionaries. Then, the need and 17 suggestions for extended MARTIF and TEI formats were addressed with specific cases, which combined with the suggestions from two studies concerning MARTIF and TEI DTD modification for the markup of Korean dictionary entries.

본 연구는 사전이 가지는 특징과 구조를 분석하고, 모든 한국어 사전항목을 손실 없이 인코딩 할 수 있는 마크업체계를 제안하는 데 목적이 있다. 이를 위하여 국제표준인 MARTIF와 용어데이터의 상세한 인코딩형식을 제공하는 TEI를 분석하였다. TEI는 용어데이터베이스용 형식과 인쇄사전용 형식은 확연히 다른 형식이었다. 그리고 실제 사전 및 용어 관련 자료를 분석하여 한국어사전의 종합적인 미시구조를 파악하고, 그 미시구조를 MARTIF와 인쇄사전용 TEI에 대응시켜 적용가능성을 시험하였다. 그 결과, 두 형식 모두 한국어사전의 미시구조와 정확하게 매핑되지 않았으나 확장에 따라 두 형식 모두 사용가능 하다는 결론을 얻게 되었으며, 한국어사전의 특징을 살릴 수 있도록 하기 위하여 파악된 한국어사전의 미시구조 내용을 포함시켜서 새로운 두 가지 확장형식을 제안하였다.

Keywords

References

  1. 인지과학 v.7 no.4 우리말 용어를 위한 전문용어 교환형식 김성혁
  2. 숙명여자대학교 대학원 석사학위논문 XML을 이용한 문헌정보학용어사전의 구조화 및 브라우저 설계 김진희
  3. 언어학 v.11 언어사전 정의의 구성과 유형에 대하여 김현권
  4. 제3차년도 연구보고서 21세기 세종계획: 전자사전 개발 문화관광부
  5. 국어 정보화 연구 인력양성 사업 최종보고서 한국어 말뭉치의 활용(교재)의 개발 문화관광부
  6. 수학대사전 박을용
  7. 우리 말글 연구회. 국어학 강좌: 한국어 사전의 문제 서상규
  8. 사전편찬학연구 v.4 한국어 전자 사전 원형의 설계 및 구현 양단희
  9. 부산대학교 대학원, 석사학위논문 독 · 한 기계번역을 위한 전자사전 시스템에 관한 고찰 오현주
  10. 상명대산업과학연구 v.5 범용 한국어 전자사전 구축을 위한 정보 필드 구조의 설계에 관한 연구 윤성희
  11. 전북대학교 대학원, 석사학위 논문 영-한 기계번역을 위한 전자사전 작성 및 관리도구의 설계 및 구현 이상곤
  12. 연세논총 v.28 전자 사전 구현을 위한 어휘 데이터베이스의 설계와 국어정보 분석 도구의 개발 이상섭;송만석
  13. 인지과학 v.7 no.4 텍스트 및 전자사전 관리시스템을 위한 표준 사전 표기언어의 설계 이재성;최병진;이운재;최기선
  14. 한국어 데이터베이스의 설계 및 응용을 위한 기초 연구 정광;이기용;김홍규;임해창;강범모
  15. 부산대학교 대학원, 석사학위논문 다국어지원 전자사전 개발을 위한 환경구축 정휘웅
  16. 第13回 言語情報 硏鑽會 發表論文集: 21世紀의 辭典과 國語敎育 辭典 編纂의 專門化에 對하여 조재수
  17. 인지과학 v.7 no.2 기계가독형 사전 구축을 위한 사전항목의 논리 구조 최병진;이운재;이재성;최기선
  18. 知識處理硏究 v.1 no.1 專門用語學의 內容과 課題 崔錫斗
  19. 용어/사전편찬용 자기테이프 교환 형식 한국정보통신기술협회
  20. 정보통신 용어사전(제4판) 한국정보통신기술협회
  21. Ph.D. diss., Brigham Young University An Experiment in Blind Terminology Interchange: Developing and Testing Conversion Algorithms for Externally Supplied Data Alder, Aaron D.
  22. Blind MARTIF data categories, maximal set
  23. Accessibility of multilingual terminological resoruces-Current problems and prospects for the future Budin, Gerhard;Alan K. Melby
  24. Computers and the Humanities v.29 no.1 Encoding dictionaries Ide, Nancy M.;Jean Veronis
  25. ISO 6156:1987 Magnetic Tape Exchange Format for Terminology
  26. ISO/DIS 12200:1999 Machine-readable Terminology Interchange Format(MARTIF) -- Negotiated Interchange
  27. Computers and the Humanities v.31 no.1 Modifing the TEIDTD: The case of Korean dictionaries Kang, Beom Mo
  28. Proceedings of TKE'96, Terminology and Knowledge Engineering Importing terminology from multiple sources in three phases: inspection, adjustment and adoption Melby, Allen;Daniel Hardman
  29. TSTT'97 Proceedings. 2nd International Conference on Terminology, Standardization and Technology Transfer Terminology interchange - needs, approaches, solutions, problems Schmitz, Klaus-Dirk;Sue Ellen Wright
  30. Guidelines for Electronic Text Encoding and Interchange v.1-2 TEI
  31. ISO/DIS 12620:1999 Computer Applications in Terminology -- Data Categories