DOI QR코드

DOI QR Code

A Study of Disassembling Major Indication Terms into Minimum Meaning Units and Linking to Diseases

의미 단위 분해를 통한 주치와 병증 용어 연계 연구

  • Kim, Anna (Informatics Development & Management Group, Korea Institute of Oriental Medicine) ;
  • Oh, Yongtaek (Informatics Development & Management Group, Korea Institute of Oriental Medicine) ;
  • Kim, Sangkyun (Informatics Development & Management Group, Korea Institute of Oriental Medicine) ;
  • Kim, Sanghyun (Informatics Development & Management Group, Korea Institute of Oriental Medicine) ;
  • Jang, Hyunchul (Informatics Development & Management Group, Korea Institute of Oriental Medicine)
  • 김안나 (한국한의학연구원, 정보개발운영그룹) ;
  • 오용택 (한국한의학연구원, 정보개발운영그룹) ;
  • 김상균 (한국한의학연구원, 정보개발운영그룹) ;
  • 김상현 (한국한의학연구원, 정보개발운영그룹) ;
  • 장현철 (한국한의학연구원, 정보개발운영그룹)
  • Received : 2013.10.21
  • Accepted : 2013.11.04
  • Published : 2013.12.30

Abstract

Objectives : Ontology is a good tool to represent the knowledge and has developed for Traditional Korean Medicine(TKM) in Korea Institute of Oriental Medicine. There are a lot of TKM terms, which have a complex meaning, especially major indication terms of medicinal treatment and terms of symptom and disease. These complex meaning terms result in the low linkage between major indication terms of medicinal treatment and terms of symptom and disease in TKM ontology. We studied to enhance the percentage of the linkage among those data in TKM ontology. Methods : We disassembled major indication terms of medicinal treatment into minimum meaning units and then linked them to enhance the percentage of the linkage among medicinal material, formula and disease ontology based on Traditional Korean Medicine. To retain objectivity, several experts of Korean Medicine used a web-based tool that supports users in refining terms and disassembling them into the minimum meaning efficiently. Results : The outcome shows that the percentage of the linkage among medicinal material, formula and disease ontology increased. By linking disassembled major indication terms to symptoms and diseases, the amount of information for medicinal materials and formulas also increased quantitatively in comparison with given formula for diseases in disease ontology. Conclusions : By this study, disassembled data increases the percentage of linkage between diseases and medicinal treatments. And the applicability of TKM ontology is also increased.

Keywords

Ⅰ. 서 론

온톨로지는 용어와 용어 사이의 관계를 컴퓨터가 이해할 수 있는 형태로 정의한 것으로 지식을 공유하고 새로운 지식이 추가되었을 경우 기존 지식과의 연계를 유연하게 할 수 있는 장점을 제공한다 1). 한의학 분야의 경우 한국한의학연구원에서 약재, 처방, 병증, 경혈, 침구를 중심으로 한의학 지식을 모델링하고 OWL 형태의 온톨로지로 구축한 한의학 온톨로지2, 3)가 연구되고 있다. 온톨로지는 많은 논문에서 밝히고 있는 것처럼 정보를 저장하고 이용하는데 좋은 도구이며 또한 온톨로지 내 지식 간의 연계를 통해서 다양한 새로운 지식을 추론하기 좋은 도구이다4).

한편, 한의학 지식의 경우 관련 문헌들에서 대부분 한자로 기록되어 있고, 의학 용어이므로 사용되는 용어 체계가 방대하며, 오랜 세월 경험적 지식이 추가되는 형태로 지식이 계승되어 왔기 때문에 기술된 용어가 상당히 복잡한 특징을 지닌다. 이러한 지식을 온톨로지와 같은 IT기술을 기반으로 데이터베이스화 하고 실용화 시스템에서 활용하기 위해서는 전문가들 이 직관적으로 이해하던 지식을 분해하고 구조화하는 연구가 필요하다5). 예를 들어, 한의사가 문헌 내의 처방의 주치 정보를 활용할 때에는 적용하고자 하는 상황에 따라 전문지식을 활용하여 대상 병, 증상, 병인, 병기, 효능 등의 복합적인 주치내용을 정제, 분석을 한 후 관련 병증과 연계하는 일련의 과정을 직관적으로 종합 판단한다. 그런데 이러한 주치정보를 문헌의 원문 그대로 데이터베이스로 구축하고 활용하고자 하면, 복합 구조의 주치 용어와 병증 용어 간 문자열 일치율이 낮기 때문에, 처방과 관련된 병이나 증상과의 연계율이 떨어지게 되므로 처방의 주치 정보를 의미단위로 정제하고 분해하는 연구가 필요하게 된다. 즉, 문헌 내 주치 정보를 의미단위로 정제, 분해하고 각각 하위 세부 개념으로 분석하면, 주치 정보를 가지는 약재, 처방 온톨로지와 이와 관련된 병, 증상 온톨로지의 연계율을 높일 수 있어 서적에서 각병의 치방으로 명세되어 있지 않은 약재, 처방 정보에 대해 확장 지식을 얻을 수 있고, 향후 한의학 지식을 단순한 문자열 기반 연계의 한계를 넘어, 의미 기반으로의 지식 연계 및 추론을 통한 지식 확장의 기반으로 활용 할 수 있기 때문에, 한의학 전문가가 이러한 주치 데이터를 의미 단위로 정제, 분해하는 연구는 온톨로지 지식의 활용도를 높일 수 있다.

한의학 지식에 대하여 용어를 정제, 분해하고, 각 관련 지식 간 연계율을 높이기 위한 연구는 꾸준히 있어왔다 6-8). 오6,7)등의 연구는 약재와 병증 간의 연계율을 높이기 위한 연구라는 점에서 맥락을 같이하나, 주로 효능과 치법의 관점에서 접근하여 복합 의미의 효능과 치법 용어를 정제, 분해하고 이를 연결함으로 써 약재와 병 온톨로지 간의 연계율을 높이기 위한 것이다. 주치 용어는 효능, 치법 용어와 같이 치료 방법과 병증 간을 연결하는 중요 고리 중 하나 이면서, 효능 및 치법 용어와는 구조가 다르고, 좀 더 복합적인 특징이 있다. 또 이 8)의 연구는 병의 수반 증상 용어를 정제, 분해한 것으로 병증 용어 연구라는 점에서 맥락을 같이 하나, 약재와 처방의 주치 용어를 정제, 분해하고 이를 병증 연계에 적용한 본 연구와는 다른 점이 있다.

따라서 본 연구에서는 온톨로지와 같은 IT기술을 기반으로 데이터베이스화할 때 지식간의 연계율을 높여 그 활용성을 높이기 위한 일환으로, 약재와 처방 온톨로지 내 주치용어를 의미 단위로 정제, 분해하고 이를 치료대상인 병증용어와 그 외의 비병증용어 그룹으로 구분한 후 병증그룹을 온톨로지에 적용하여 약재 및 처방 온톨로지와 병, 증상 온톨로지간의 연계율을 높이는 연구를 수행하였다.

 

Ⅱ. 재료 및 방법

1. 연구 대상 및 방법

약재와 처방의 주치용어는 한국한의학연구원에서 구축한 약재 온톨로지와 처방 온톨로지 내의 데이터를 활용하였다. 약재 주치의 경우 『본초학』9)을 기준으로 『임상본초학』10), 『신씨본초학』11)이 참고되어 구축된 주치 데이터를 대상으로 하였다 12). 이는 해당 서적의 각론에서 각 본초의 주치항목의 내용을 추출한 것으로 총 1744 건이 존재한다. 처방 주치의 경우 『방제학』13), 『동의방제와 처방해설』 14)에 수록된 처방을 기준으로 구축된 데이터 15)를 연구대상으로 하였다. 『방제학』의 경우, 각론에서 소개된 각 처방의 주치항목의 내용과 附方의 서술형 설명에서 주치에 해당하는 내용을 추출한 데이터이고, 『동의방제와 처방해설』의 경우 각 처방의 기본방편에 수록된 주치항목의 내용과 연계방, 임상활용처방의 원문수록 내용에 서 주치에 해당하는 내용을 추출한 데이터로 처방관련 주치는 총3879 건이 존재한다. 이렇게 수집된 약재와 처방의 주치용어를 각각 주치 건당 정제를 거친 후 중복된 문자열을 제거하고 난 총 6067 건의 용어에 대하여 최소의미단위로 분해하였으며, 그 분해 결과 중 약재와 처방의 치료대상인 병, 증상, 변증명 등의 병증용어 그룹을 한의학연구원에서 구축한 온톨로지에 적용하여 주치용어의 분해 전과 분해후의 약재, 처방과 병증간의 연계율을 살펴보았다.

2. 연구내용

2-1. 주치용어의 정제

수집된 주치용어는 내용에 영향을 미치지 않는 조사 등은 삭제하고, 한글 서술형 주치의 경우에는 원문을 찾아 다시 내용을 훼손하지 않는 범위 내에서 실제 원문을 찾아 용어를 추가하거나 혹은 일반적으로 통용되는 한자 명사형으로 바꾸었으며, 한자 서술형의 경우 띄어쓰기 가능한 형태로 분리하는 등 주치용어를 최소의미단위로 분해하기 전 단계로서의 정제 작업을 하였다(표1). [table 1]

Table 1.Examples of Term Refinement

2-2. 복합 주치용어의 의미 단위 분해

주치용어의 경우 주치병증에 대한 내용이 주를 이루지만, 治心肺氣不足 咳嗽喘促 肢體痿弱 脚軟眼黑 津液枯固 또는 治少陽病 半表半裏 往來寒熱 能和其內熱 解其外邪 傷寒方之 王道也16)에서 볼 수 있듯이 주치정보내에 병, 증상, 병인, 병기, 효능, 치법 용어 등을 다양하게 포함하고 있고, 문자열이 같더라도 문맥에 따라, 혹은 데이터의 활용용도에 따라 최소의미단위의 해석이 다를 수 있으므로, 전문가의 합의에 기반한 객관적인 용어 분해 결과를 얻기 위해, 다수 전문가가 서로의 분해 결과를 상호 참조, 검증하면서 동시에 작업할 수 있도록 웹기반의 용어분해 지원 시스템5)을 개발하여 활용하였다.

용어 분해는 두 개 이상의 의미를 갖는 복합구조의 주치용어를 최소 의미단위로 분해하는 것을 기본으로, 상이한 분해 결과 등의 이슈사항은 셋 이상의 전문가 합의를 통해 처리하였으며, 분해된 의미단위는 병증용어와 비병증용어로 분류하고, 비병증용어는“/”로 구분한 후 비병증 용어로 분류하였다. 주치분해의 내용은 표 2 와 같다. [table 2]

Table 2.Examples of Disassembled Data from Major Indication Terms

기본적으로 주치분해를 통한 의미단위용어가 치료대상인 증상이나 병인 경우 병증용어로 분류하였으며, 의미단위가 변증인 경우에는 치료대상병증인 경우 병증용어로, 병인병기로 사용된 경우에는 비병증 용어로 분류하였다. 이 병증용어는 병증 온톨로지내의 병, 수반증상, 변증용어와 문자열 일치를 통한 연계에 활용하기 위한 목적의 그룹핑이므로, 병, 증상 용어의 구분이 다소 명확하지 않더라도 병증용어로 대분류가 되면 온톨로지간 연계율에는 비교적 영향을 미치지 않는다. 양상, 발병조건, 발병시기, 병인, 병기, 효능, 치법, 사람 등 치료대상이 아닌 주치 내 의미단위용어는 비병증요소로 분류되었다. 분해된 병증 용어를 중심으로 원 주치의 유형을 살펴보면 표3 과 같다. [table 3]

Table 3.Case of Major Indication Terms Related Disassembled Diseases and Symptoms

 

Ⅲ. 결 과

주치용어의 분해 결과 최소의미단위의 개념용어를 총10072 건을 얻었으며, 이를 중복제거 한 결과 병증 용어 3455 건과 비 병증용어 1979 건으로 총 5434 건의 최소의미단위용어를 얻을 수 있었다. 이 중 병증용어 그룹은 실제 활용도를 보기위해 병증온톨로지로 구축된 5 계내과학17-21) 및 병리학22), 진단요건표준화연구23) 의 병, 변증 및 수반증상과 연계하였다.

그 결과 주치분해 전 약재처방 주치용어가 병, 변증 및 수반증상과 각각 연계된 건수는 592 건이고, 주치분해 후 연계 건수는 4453 건으로 본 연구 후 전체 연계 건수가 증가하였다.

 

Ⅳ. 고 찰

한의학지식은 그 함축적이고 복잡한 의학지식의 특성상 서적그대로의 내용을 데이터로 구축 시 낮은 문자열 일치율을 보여 지식검색의 활용도가 떨어지게 된다. 본 연구에서는 약재, 처방 온톨로지와 병증 온톨로지간의 연계율을 높이기 위하여 복합의미의 약재 처방 주치용어를 최소 개념별로 분해하고 이를 병증과 연계하는 연구를 시행하였다. 본 연구결과를 적용한 결과 주치-병증의 path증가로 인해 온톨로지 간 연계가 증가하였으며, 이러한 path의 증가는 직접적인 연계에 따른 지식활용도를 제고할 뿐만 아니라 명세되어 있지 않은 지식의 확장 및 향후 추론연구 등의 기반을 마련한 의의가 있다.

즉, 주치 분해 전 원본 주치와 병증 온톨로지 내의병, 변증명, 수반증상과의 연계는 592 건이었으며, 주치분해 후 연계는 4453 건으로 약 7 배 정도 전체 연계건수가 증가한 것을 볼 수 있다. 이에 관해 온톨로지를 시각화하여 보여주는 gruff 프로그램(ver. 4.1.5)24)을 사용하여 구체적으로 살펴 보면, 그림1 은 菊花茶調散, 牛黃淸心元 등의 처방의 주치인 頭目眩暈과 頭目眩暈을 수반 증상으로 갖는 병증인 肝腎不足振顫, 痰濕內阻痞滿과 太陽水氣上逆證과의 연결을 보여준다. 이는 본 연구 결과를 적용하기 전의 원 서적의 내용 그대로 구축한 데이터이므로 주치와 수반증상 중에 頭目眩暈으로 문자열이 일치하는 경우에 대해서만 연계가 가능하여, 주치 頭目眩暈은 증상 頭目眩暈과의 단 1 건의 path만 존재하며 증상 頭目眩暈은 이를 수반증상으로 갖는 세 개의 병증과 연결되어 있다. 각 노드의 DI, PA, SY, TT, FO, MM은 각각 병(disease), 변증(pattern), 증상(symptom), 주치(treatment target), 처방(formula), 약재(Medicinal material)을 구분하기 위한 온톨로지 내 클래스 식별자를 의미한다. [Figure 1]

Figure 1.A graph for a major indication term, "頭目眩暈" and its related formulas, diseases without disassembled link

그림 2 는 복합용어인 주치 頭目眩暈을 頭暈, 目眩으로 분해 한 후 관련 병증을 연계한 것이다. 頭目眩暈은 최소의미단위인 頭暈, 目眩으로 분해됨으로써 원 주치인 頭目眩暈과 문자열이 일치하는 증상 頭目眩暈 뿐만 아니라 증상 頭暈과 目眩과도 추가로 연결되어 1 차적인 path의 수가 3 개로 늘어났으며, 頭暈과 目眩을 각각, 또는 둘 다 수반증상으로 갖는 병증들과도 2 차적인 path로 확장 연계된 것을 볼 수 있다. [Figure 2]

Figure 2.A graph for a major indication term, "頭目眩暈" and its related formulas, diseases with disassembled link

그림3 의 경우는 증상용어 目眩을 중심으로, 관련된 주치들이 주치분해 된 후 증상 目眩과 연계된 것을 다시 살펴본 것이다. 주치분해 전이라면 주치 目眩와의 1 개의 path만 존재했겠지만, 주치분해 결과를 적용하면 그림3 의 경우와 같이 문자열이 일치되는 주치 目眩뿐만 아니라 그림 2 에서 연계된 주치 頭目眩暈을 비롯하여 頭目昏眩, 頭目眩冒, 頭暈目眩, 目眩髮落, 目眩鼻塞, 頭痛目眩, 耳聾目眩 등 다양한 주치와 연계됨으로써 주치분해를 통해 주치와 병, 변증, 수반증상의 문자열을 기반으로 한 path가 증가하였고, 결과적으로 약재, 처방 온톨로지와 병증 온톨로지 간의 연계율이 높아진 것을 알 수 있다.[Figure 3]

Figure 3A graph for a symptom, "目眩" and its related major indication terms with disassembled link

한편 주치분해는 주치용어와 병, 변증, 증상용어 등과 1 차적인 연계를 증가시킬 뿐 만 아니라 확장 연계된 병증과 그에 따른 정보들이 2 차적으로 연계됨으로 써 path 및 노드들이 증가하게 되어, 지식확장 및 이를 통한 추론 기반으로의 활용이 가능하다. 예를 들어 그림 4 에서와 같이 증상 요통의 경우 요통을 수반 증상으로 갖는 병증들의 치방들과 연결이 되어 있다. 이 치방들은 각 서적에 명세되어 있는 지식으로 요통 뿐 만 아니라 이를 수반한 병증의 치방이므로 다른 수반증상들의 치료와도 연관이 되어 있을 수 있다. 증상 요통은 문헌에서 관련병증의 치방으로 수록되어 있는 처방들 외에 약재 및 처방온톨로지를 통해 문자열이 일치하는 주치 요통을 갖는 처방 3 개와 5 개의 약재정도가 더 연계되어 질 수 있다.[Figure 4]

Figure 4.A linkage of diseases and formulas without disassembled link

그림 5 는 그림4 에 본 연구결과인 주치분해를 통한 최소의미단위를 적용한 것으로, 증상 요통과 문자열 단순 일치만으로는 검색이 되지 않았던 腰脚冷痛, 腰膝疼痛, 腰背痛 등의 11 개의 주치와 추가 연계 되었으며, 이 주치들을 갖는 약재 및 처방들과 확장 연계될 수 있으므로, 증상 요통은 5 계내과학에 직접 명세되어 있는 치방 외에 온톨로지 간 연계를 통한 주치 요통을 갖는 처방과 약재뿐만 아니라, 복합의미의 관련 주치를 갖는 약재 및 처방군이 확장 연계되어 증상 요통에 추가로 고려되어 질 수 있는 약재처방 지식이 물리적으로 확장됨을 알 수 있다. [Figure 5]

Figure 5.A gragh for expanded knowledge of diseases and formulas with disassembled link

본 연구에서는 병증의 동, 유의어가 적용되지 않았기 때문에 최소개념단위로 분해한 주치용어라 할지라도 문자열이 일치하지 않으면 지식연계가 되지 않는 한계가 있다. 따라서 좀 더 정교한 병증연계를 위하 여 병증의 동, 유의어 및 상하위 관계에 관한 연구가 향후 적용되어야 할 필요성이 있다. 또한 본 연구는 온톨로지 활용성 제고를 위해 약재처방의 주치와 병증의 연계율을 높이기 위하여 치방 - 병증 - 증상 -주치 - 약재, 처방 간의 일련의 단순한 path만을 고려한 한계가 있으나, 추후 병증의 생리, 병리적 요소 혹은 성미 귀경 효능 치법과 같은 속성이 고려된 다양한 추론방법 연구를 위한 기반을 마련한 것으로, 의료정보 분야의 기초연구로 가치가 있다고 판단된다.

 

Ⅴ. 결 론

본 연구에서는 한의지식의 활용 및 확장성을 높이기 위해 복합의미의 약재‧처방의 주치용어를 최소개념단위용어로 분해하여 병증용어와의 연계율을 높이는 연구를 시행 하였다. 약재, 처방의 주치 중 중복된 문자열을 제거하고 정제를 한 6067 건에 대하여 두 개 이상의 복합의미를 갖는 용어를 의미단위로 분해한 결과, 치료대상으로 분류된 병, 변증, 증상 등의 병증 용어 3455 건과 양상, 발병조건, 발병시기, 병인, 병기, 효능, 치법, 사람 등의 비병증용어 1979 건을 포함하여 총 5434 건의 최소의미단위 개념 용어를 얻을 수 있었다. 본 연구 결과를 한국한의학연구원에서 구축 중인 온톨로지에 적용한 결과, 병증 온톨로지 내의 병, 변증, 수반증상과 약재, 처방 온톨로지의 주치 간의 분해 전 592 건이던 연계건수가, 분해 후 4453 건이 되어 연계된 정보의 양이1 차적으로 증가함을 알 수가 있었다. 또한, 주치와 병증용어가 추가 연계됨으로써 2 차적으로 확장 연계되는 노드의 수가 증가함에 따라 문헌에서 명세되어 있지 않은 지식확장 및 새로운 지식 추론과 같은 온톨로지의 활용 여건도 개선되었으며 문자열 일치를 기반으로 한 본 연구의 한계를 극복하기 위하여 병증의 동, 유의어 및 상하위 관계 등의 연구가 향후 추가된다면 온톨로지의 활용 여건은 더욱 개선되리라 판단된다.

References

  1. Kim SK, Oh YT, Kim AN, Kim JY, Yea SJ, Kim C, et al. Mobile Application for Supporting Medical Treatment in Korean Medicine. Korean J of Oriental Physiology & Pathology. 2012;26(6):834-41.
  2. Jang HC, Kim JH, Kim SK, Kim C, Bae SH, Kim AN, et al. Ontology for Medicinal Materials Based on Traditional Korean Medicine. Bioinformatics. 2010;26 (18):2359-60. https://doi.org/10.1093/bioinformatics/btq424
  3. Jang HC. Ontology-based Traditional Korean Medicine Knowledge Framework. Korea Institute of Oriental Medicine. 2012.
  4. Kim SK, Jang HC, Kim JH, Yea SJ, Kim C, Eum DM, et al. A Study on Reasoning based on Herb and Formula Ontologies. The Journal of Oriental Medical Classics. 2009;22(3):97-105.
  5. Kim AN, Oh YT, Kim SK, Seo JS, Jang HC. Disassembling Indication Terms of Medicinal Treatment Using a Cooperation Tool. Korean J of Oriental Physiology & Pathology. 2013;27(4):362-6.
  6. Oh YT, Lee BW, Kim EH. A Study of the virtue terms in herbal medicine. The Journal of Oriental Medical Classics. 2010;23(5):35-50.
  7. Oh YT, Jeon BU, Jang HC, Kim CS, Kim JH, Kim SK, et al. Study of connections between efficacy terms and remedy terms by conversion the raw terms into the representative terms. The Journal of Oriental Medical Classics. 2013;24(5):99-105.
  8. Lee BW. Research on linking terminology for Korean medical support system. PNU Dongje Medical Inc. 2012.
  9. The Korean Herboloy Compilation Committee. Herbology. Seoul:Younglimsa. 2005.
  10. Shin MG. Clinical Herbology. Seoul:Younglimsa. 1997.
  11. Shin GG. Shin's Herbology[special]. Seoul:Sumoonsa. 1988.
  12. Song MY. Ontology-based Traditional Korean Medicine Knowledge Framework. Korea Institute of Oriental Medicine. 2011.
  13. Joint Text Compilation Committee for Formula Study. Formula Science. Seoul:Younglim Publishing. 2008.
  14. Yun YG. Korean medicine Formula explanation. Seoul: Uiseongdang. 2007.
  15. Jang HC. Ontology-based Traditional Korean Medicine Knowledge Framework. Korea Institute of Oriental Medicine. 2012.
  16. Yun YG. Korean medicine Formula explanation. Seoul: Uiseongdang. 2007:168, 620.
  17. Joint Text Compilation Committee for Korean internal medicine(Liver). Korean internal medicine(Liver). Seoul:Institute of Oriental Medicine. 2001.
  18. Joint Text Compilation Committee for Korean internal medicine(Heart). Korean internal medicine(Heart). Seoul:Gunja Publisher. 2008.
  19. Joint Text Compilation Committee for Korean internal medicine(Spleen). Korean internal medicine(Spleen). Seoul:Gunja Publisher. 2009.
  20. Joint Text Compilation Committee for Korean internal medicine(Lung). Korean internal medicine(Lung). Seoul:Nado Publisher. 2007.
  21. Park HG compilation. Korean internal medicine (Kidney). Seoul:Sungbosa. 2006.
  22. The Korean medicine Pathology Compilation Committee. Korean Medicine Pathology. Seoul:Hanuimoonhwasa. 2009.
  23. Yang GS. Standardization and unification of the terms and conditions used for diagnosis in Korean medicine(II). Korea Institute of Oriental Medicine. 1996.
  24. http://www.franz.com/agraph/gruff/

Cited by

  1. Study on the Ontology Linking by Acupuncture Terms vol.14, pp.9, 2014, https://doi.org/10.5392/JKCA.2014.14.09.556