当前位置: 首页 > 范文大全 > 公文范文 >

基于领域本体的农作物病虫害问题分类研究

时间:2022-10-22 16:20:07 来源:网友投稿

zoޛ)j馞?3T۠?tmwm׭=^9nt
vߏTuuvwvvii]zomvߍM, $,^M,wimiLR1H]i}@+�+�+�+?n?开放领域问题分类方法,该方法将问题分为人物、时间、地点、数量、实体、描述和未知7个大类[8]。本课题研究的是农作物病虫害预防领域问题,具有领域特殊性,因此不能将哈工大的问题分类直接应用在本研究中。本研究按照领域专家的建议将该领域问题分为4类:病虫害种类、发病时期、病症预防、病症描述。目前,问题类型识别常用基于语义和基于规则的分类方法。基于规则的方法需要针对每类问题制定一定的规则,如果制定的规则过多则需要大量人力,如果规则太少则无法准确判断问题的类别,并且还会出现一个问题可以匹配到多个分类规则里面。基于语义的分类方法在研究中也取得不错的分类效果,但是如果问题过于简单,或者虽然较长但是所包含的特征词较少时分类效果也不理想。基于以上原因,本研究对基于语义和基于规则的分类方法相结合以提高分类的准确性。基于语义和规则相结合的分类方法思路如下:

(1)根据领域专家的建议为每类问题建立对应的特征词汇表和规则库,部分特征词汇表和规则库如表1和表2所示;

(2)抽取问句特征词,并对特征词中名词和动词进行扩展词,形成问句特征向量为Tw={W1,W2,W3,…};

(3)将Tw分别与问题类型C1、C2、C3、C4中的特征词汇进行相似度计算(特征词间的相似度计算按照刘群等基于知网提出的计算方法[9]),计算结果分别为α1,α2,α3,α4,其中α1≥α2≥α3≥α4,如果α1-α2≥β,则类别C1即为问题所属类别,分类结束,否则继续;

(4)将问句分别与类别C1和C2进行规则匹配,选择最匹配的类别作为问句所属类别。

3 试验分析

问题分类中参数β的取值直接影响分类的准确率,因此通过试验确定参数β的取值使分类结果最优。

3.1 试验数据

本研究所用试验语料来自于农林网、农业信息网等农业类网站,对语料进行清洗、分类,所用各类问题语料数量如表3所示。

3.2 试验结果及分析

分别将参数β设定不同数值,采用基于语义和规则相结合的分类方法判断试验问题语料所属分类的准确率如图4所示。由图4试验结果表明,参数β的最佳取值为0.2,通过试验结果还可以看出,随着参数β取值增大分类准确率降低。结果表明:当待判定问题与领域分类特征库中两类分类计算结果较为接近时,才有必要根据规则判断其真正所属类别;当待判定问题与分类特征库中两类分类计算结果相差较大时,因为构建的规则并不全面而导致问题所属类别判断存在误差较大。因此下一步的工作中需要将问题分类的规则库进行扩充,使其规则更加丰富,提高分类结果的准确性。

将参数β的取值设置为0.2时,分别采用基于语义的分类方法、基于规则的分类方法和本研究所用的分类方法进行比较分类的准确率,结果如表4所示。从表4可以看出,本研究的分类方法比基于规则和基于语义的方法分类准确率都有提高,特别是相对于基于规则的分类方法准确率有较大的提高,而相对于基于语义的方法准确率提高较小, 分析是因为采用规则的分类方法对每类问题制定的规则有限,直接影响了分类的准确率。另外,目前对于问题的分类仅分为4类,问题类别划分不够细致,这也会影响到问题分类的准确率。

4 结论

本研究首先构建农作物病虫害领域本体,将领域本体应用在预处理、特征词抽取及扩展中,根据领域的特殊性将问题分为4类,利用基于语义和规则相结合的分类方法对问题进行分类。试验结果表明,本研究方法对农作物病虫害领域问题分类时具有一定的有效性。但是,本研究仍存在一些问题,例如领域本体如何实现自动更新、问题类型规则不完善等,这些都将是下一步工作的重点。

参考文献:

[1]郑实福,刘 挺,秦 兵,等. 自动问答综述[J]. 中文信息学报,2002,16(6):46-52.

[2]廖 梦. 面向问答系统的金融本体构建技术研究[D]. 哈尔滨:哈尔滨工业大学,2014.

[3]邓志鸿,唐世渭,张 铭,等. Ontology研究综述[J]. 北京大学学报:自然科学版,2002,38(5):730-738.[HJ1.82mm]

[4]Li S P,Yin Q W,Hu Y J,et al. Overview of researches on ontology[J]. Journal of Computer Research and Development,2004,41(7):1041-1052.

[5]潘彩霞,薛佳妮,于辉辉,等. 基于本体的鱼病诊断专家系统的构建[J]. 广东农业科学,2015,42(1):157-160.

[6]王 超,李书琴,肖 红. 基于文献的农业领域本体自动构建方法研究[J]. 计算机应用与软件,2014,31(8):71-74.

[7]农业部情报研究所.农业科学叙词表[M]. 北京:中国农业出版社,1994.

[8]Zhang W,Chen J J,Niu Y Q.Research on Chinese question classification based on Hownet and dependency parsing[C]. The 3rd International Workshop on Intelligent System and Application.Wuhan,China,2011:483-486.

[9]刘 群,李素建. 基于《知网》的词汇语义相似度计算[C]. 台北第三届汉语词汇语义学研讨会论文集,2002:59-76.

相关热词搜索: 病虫害 本体 农作物 领域 研究