- 中国社会科学出版社
- 9787516160916
- 57100
- 2015-05
- H083
内容简介
目录
第一章 引论
第一节 本研究提出的背景
一 术语定义自动抽取的必要性
二 术语定义的聚类的意义
三 术语识别的意义
第二节 国内外研究现状
一 术语定义抽取的研究现状
二 句子聚类的国内外研究
三 术语识别的研究现状
第三节 术语学介绍
一 什么是术语学
二 术语学的发展简介
三 术语学的主要流派
四 我国的术语学研究
五 术语数据库
六 术语概念的唯一性与术语定义的多样性
七 术语与普通词语
八 术语的跨语言借用
九 新术语与旧术语在定义出现概率上的区别
十 术语的语缀
十一 一些基本概念
第四节 术语与术语定义的界定
一 术语的界定
二 术语定义的界定
第二章 术语定义的抽取研究
第一节 候选术语定义的规则匹配
一 文本下载
二 文本的预处理
三 文本的分词
四 候选术语定义的模板匹配
第二节 基于统计方法的术语定义抽取
一 词语的定义隶属度
二 句子的定义隶属度
三 句子的定义隶属度实验结果
第三节 向量空间距离计算
一 向量空间模型介绍
二 向量空间模型的引用
三 向量空间模型实验结果示例
第四节 隶属度计算和向量空间模型的结合
第五节 术语定义抽取系统结构与实验结果
第六节 实验结果评价
一 网络文本结构的多样性因素
二 语言表达形式的多样性因素
三 分词的因素
四 网络文本的可靠性因素
五 搜索引擎准确率的因素
六 算法的因素
第七节 术语定义形式的多样性
一 传统意义上的定义形式
二 下定义的要求
三 术语定义形式的多样性
第八节 本章小结
第三章 术语定义的聚类研究
第一节 术语定义聚类的必要性
第二节 聚类综述
一 聚类与聚类分析
二 分类与聚类
三 硬聚类和软聚类
四 层级聚类与诽:层级聚类
第三节 本研究采用的聚类方法
一 聚类步骤
二 相似度的界定和属性的选取
三 《知网》介绍
第四节 术语定义的领域聚类
一 句子相似度计算
二 词语的相似度计算
三 术语定义领域聚类的停用词表的建立
四 聚类特征的选取
第五节 术语定义聚类的结果及分析
一 领域聚类的判定复杂性
二 聚类相似度阈值的设定
三 《知网》知识库在领域聚类中的优点与局限性
四 聚类结果的错误分析
第四章 术语自动识别研究
第一节 术语缺乏位置信息
第二节 术语的抽取
一 术语的语言学特征
二 术语的粗抽取
三 术语边界的确定
四 术语的词性过滤
五 术语词性序列的统计
第三节 候选术语的统计特征
一 术语的用词长度特征
二 候选术语的长度与词频计算
三 候选术语的最后得分
第四节 过滤词表的构建
一 术语识别过滤词表构建的必要性
二 过滤词表的构建
第五节 术语识别系统结构与实验结果
第六节 实验结果分析
一 定义匹配模板的局限性
二 句子定义隶属度过低
三 其他情况
第七节 本章小结
第五章 结束语
附录
附录一 《人民日报》用词与术语定义用词对比
附录二 词语的定义隶属度
附录三 术语定义抽取的分步骤结果示例
附录四 术语的词性序列
附录五 术语抽取结果
附录六 术语定义聚类的部分结果
附录七 术语定义聚类程序示例
参考文献
致谢
第一节 本研究提出的背景
一 术语定义自动抽取的必要性
二 术语定义的聚类的意义
三 术语识别的意义
第二节 国内外研究现状
一 术语定义抽取的研究现状
二 句子聚类的国内外研究
三 术语识别的研究现状
第三节 术语学介绍
一 什么是术语学
二 术语学的发展简介
三 术语学的主要流派
四 我国的术语学研究
五 术语数据库
六 术语概念的唯一性与术语定义的多样性
七 术语与普通词语
八 术语的跨语言借用
九 新术语与旧术语在定义出现概率上的区别
十 术语的语缀
十一 一些基本概念
第四节 术语与术语定义的界定
一 术语的界定
二 术语定义的界定
第二章 术语定义的抽取研究
第一节 候选术语定义的规则匹配
一 文本下载
二 文本的预处理
三 文本的分词
四 候选术语定义的模板匹配
第二节 基于统计方法的术语定义抽取
一 词语的定义隶属度
二 句子的定义隶属度
三 句子的定义隶属度实验结果
第三节 向量空间距离计算
一 向量空间模型介绍
二 向量空间模型的引用
三 向量空间模型实验结果示例
第四节 隶属度计算和向量空间模型的结合
第五节 术语定义抽取系统结构与实验结果
第六节 实验结果评价
一 网络文本结构的多样性因素
二 语言表达形式的多样性因素
三 分词的因素
四 网络文本的可靠性因素
五 搜索引擎准确率的因素
六 算法的因素
第七节 术语定义形式的多样性
一 传统意义上的定义形式
二 下定义的要求
三 术语定义形式的多样性
第八节 本章小结
第三章 术语定义的聚类研究
第一节 术语定义聚类的必要性
第二节 聚类综述
一 聚类与聚类分析
二 分类与聚类
三 硬聚类和软聚类
四 层级聚类与诽:层级聚类
第三节 本研究采用的聚类方法
一 聚类步骤
二 相似度的界定和属性的选取
三 《知网》介绍
第四节 术语定义的领域聚类
一 句子相似度计算
二 词语的相似度计算
三 术语定义领域聚类的停用词表的建立
四 聚类特征的选取
第五节 术语定义聚类的结果及分析
一 领域聚类的判定复杂性
二 聚类相似度阈值的设定
三 《知网》知识库在领域聚类中的优点与局限性
四 聚类结果的错误分析
第四章 术语自动识别研究
第一节 术语缺乏位置信息
第二节 术语的抽取
一 术语的语言学特征
二 术语的粗抽取
三 术语边界的确定
四 术语的词性过滤
五 术语词性序列的统计
第三节 候选术语的统计特征
一 术语的用词长度特征
二 候选术语的长度与词频计算
三 候选术语的最后得分
第四节 过滤词表的构建
一 术语识别过滤词表构建的必要性
二 过滤词表的构建
第五节 术语识别系统结构与实验结果
第六节 实验结果分析
一 定义匹配模板的局限性
二 句子定义隶属度过低
三 其他情况
第七节 本章小结
第五章 结束语
附录
附录一 《人民日报》用词与术语定义用词对比
附录二 词语的定义隶属度
附录三 术语定义抽取的分步骤结果示例
附录四 术语的词性序列
附录五 术语抽取结果
附录六 术语定义聚类的部分结果
附录七 术语定义聚类程序示例
参考文献
致谢