1.3 研究内容

本书主要是将FAQ系统和Web自动问答技术应用到当前的“三农”信息化建设中,可以方便农民和“三农”研究者利用现有的互联网信息资源解决生产、生活中的问题。FAQ系统的研究内容主要包括:问题-答案对存储管理,以及用户提问问句和问题答案对的匹配。目前的自动问答系统针对事实性问题,对于一些关于原因和方法等描述性问题研究相对比较少。然而解决农民在实际生产、生活中的问题,不仅需要事实性问题,而且还需要包含大量描述性问题,所以现有的答案抽取方式较难满足要求。本书研究如何利用现有知识表示方式和“三农”知识建立满足“三农”问答知识表示;如何利用自然语言处理技术提高FAQ系统中问句匹配能力,从而提高准确率;以及如何利用“三农”知识、问句特征和机器学习方法提高问句分类的正确率;研究“三农”描述性问句的答案抽取方法和策略,以便提高问答系统答案的正确率。本书包括四部分:“三农”知识表示研究、“三农”FAQ技术研究、“三农”自动问答系统的问句分类研究、“三农”自动问答系统的答案抽取研究。图1-8是本书研究的主要内容的框架和实现路线。

图1-8 本书研究内容框架和实现路线