• Àüü
  • ÀüÀÚ/Àü±â
  • Åë½Å
  • ÄÄÇ»ÅÍ
´Ý±â

»çÀÌÆ®¸Ê

Loading..

Please wait....

±¹³» ³í¹®Áö

Ȩ Ȩ > ¿¬±¸¹®Çå > ±¹³» ³í¹®Áö > Çѱ¹Á¤º¸°úÇÐȸ ³í¹®Áö > Á¤º¸°úÇÐȸ ³í¹®Áö B : ¼ÒÇÁÆ®¿þ¾î ¹× ÀÀ¿ë

Á¤º¸°úÇÐȸ ³í¹®Áö B : ¼ÒÇÁÆ®¿þ¾î ¹× ÀÀ¿ë

Current Result Document : 11 / 12 ÀÌÀü°Ç ÀÌÀü°Ç   ´ÙÀ½°Ç ´ÙÀ½°Ç

ÇѱÛÁ¦¸ñ(Korean Title) Çѱ¹¾î ±¸ ´ÜÀ§È­¸¦ À§ÇÑ ±ÔÄ¢ ±â¹Ý ¹æ¹ý°ú ±â¾ï ±â¹Ý ÇнÀÀÇ °áÇÕ
¿µ¹®Á¦¸ñ(English Title) A Hybrid of Rule based Method and Memory based Learning for Korean Text Chunking
ÀúÀÚ(Author) ¹Ú¼º¹è   À庴Ź  
¿ø¹®¼ö·Ïó(Citation) VOL 31 NO. 03 PP. 0369 ~ 0378 (2004. 03)
Çѱ۳»¿ë
(Korean Abstract)
Çѱ¹¾î³ª ÀϺ»¾î¿Í °°ÀÌ ºÎºÐ ¾î¼ø ÀÚÀ¯ ¾ð¾î¿¡¼­´Â ±ÔÄ¢ ±â¹Ý ¹æ¹ýÀÌ ±¸ ´ÜÀ§È­¿¡ À־ ¸Å¿ì À¯¿ëÇÑ ¹æ¹ýÀ̸ç, ½ÇÁ¦·Î Àß ¹ß´ÞµÈ Á¶»ç¿Í ¾î¹Ì¸¦ È°¿ëÇϸ頼ҼöÀÇ ±ÔÄ¢¸¸À¸·Îµµ ¿©·¯ °¡Áö ±â°èÇнÀ ±â¹ýµé¸¸Å­ ³ôÀº ¼º´ÉÀ» º¸ÀÏ ¼ö ÀÖ´Ù. ÇÏÁö¸¸, ÀÌ ¹æ¹ýÀº ±ÔÄ¢ÀÇ ¿¹¿Ü¸¦ Ã³¸®ÇÒ ¼ö Àִ ¹æ¹ýÀÌ ¾ø´Ù´Â ´ÜÁ¡ÀÌ ÀÖ´Ù. ¿¹¿Ü Ã³¸®´Â ÀÚ¿¬¾ð¾î󸮿¡¼­ ¸Å¿ì Áß¿äÇÑ ¹®Á¦À̸ç, ±â¾ï ±â¹Ý ÇнÀÀÌ ÀÌ ¹®Á¦¸¦ È¿°úÀûÀ¸·Î ´Ù·ê ¼ö ÀÖ´Ù. º» ³í¹®¿¡¼­´Â, Çѱ¹¾î ´ÜÀ§È­¸¦ À§Çؼ­ ±ÔÄ¢ ±â¹Ý ¹æ¹ý°ú ±â¾ï ±â¹Ý ÇнÀÀ» °áÇÕÇϴ ¹æ¹ýÀ» Á¦½ÃÇÑ´Ù. Á¦½ÃµÈ ¹æ¹ýÀº ¿ì¼± ±ÔÄ¢¿¡ ±âÃÊÇÏ°í, ±ÔÄ¢À¸·Î ÃßÁ¤ÇÑ ´ÜÀ§¸¦ ±â¾ï ±â¹Ý ÇнÀÀ¸·Î °ËÁõÇÑ´Ù. STEP 2000 ¸»¹¶Ä¡¿¡ ´ëÇÑ ½ÇÇè °á°ú, º» ³í¹®¿¡¼­ Á¦½ÃÇÑ ¹æ¹ýÀÌ ±ÔÄ¢À̳ª ¿©·¯ ±â°èÇнÀ ±â¹ýÀ» ´Üµ¶À¸·Î »ç¿ëÇÏ¿´À» ¶§º¸´Ù ³ôÀº ¼º´ÉÀ» º¸¿´´Ù. ±ÔÄ¢°ú ±¸ ´ÜÀ§È­¿¡ °¡Àå ÁÁÀº ¼º´ÉÀ» º¸ÀΠSupport Vector MachinesÀÇ F-score°¡ °¢°¢ 91.87°ú 92.54Àε¥ ºñÇÏ¿©, º» ³í¹®¿¡¼­ Á¦½ÃµÈ ¹æ¹ýÀÇ ÃÖÁ¾ F-score´Â 94.19ÀÌ´Ù.
¿µ¹®³»¿ë
(English Abstract)
In partially free word order languages like Korean and Japanese, the rule-based method is effective for text chunking, and shows the performance as high as machine learning methods even with a few rules due to the well-developed overt postpositions and endings. However, it has no ability to handle the exceptions of the rules. Exception handling is an important work in natural language processing, and the exceptions can be efficiently processed in memory-based learning. In this paper, we propose a hybrid of rule-based method and memory-based learning for Korean text chunking. The proposed method is primarily based on the rules, and then the chunks estimated by the rules are verified by memory-based classifier. An evaluation of the proposed method on Korean STEP 2000 corpus yields the improvement in F-score over the rules or various machine learning methods alone. The final F-score is 94.19, while those of the rules and SVMs, the best machine learning method for this task, are just 91.87 and 92.54 respectively.

Å°¿öµå(Keyword) ÇÏÀ̺긮µå ¹æ¹ý   ±ÔÄ¢ ±â¹Ý ¹æ¹ý   ±â¾ï ±â¹Ý ÇнÀ   ±¸ ´ÜÀ§È­  
ÆÄÀÏ÷ºÎ PDF ´Ù¿î·Îµå