全国大中专教材网络采选系统

推荐纸质教材推荐数字资源

术语学与术语信息处理

定价：￥48.00

作者：张榕

出版时间：2015-05

出版社：中国社会科学出版社

以下为《术语学与术语信息处理》的配套数字资源，这些资源在您购买图书后将免费附送给您：

关闭

基本信息评价

出版社：中国社会科学出版社
ISBN：9787516160916
出版时间：2015-05

内容简介

　　信息时代对术语学研究提出新的要求，张榕著的《术语学与术语信息处理》从知识发现的视角对术语界定进行论证；提出面向大规模文本的术语定义的抽取、术语定义的领域聚类以及术语识别的方法。

第一章　引论
　第一节　本研究提出的背景
　　一　术语定义自动抽取的必要性
　　二　术语定义的聚类的意义
　　三　术语识别的意义
　第二节　国内外研究现状
　　一　术语定义抽取的研究现状
　　二　句子聚类的国内外研究
　　三　术语识别的研究现状
　第三节　术语学介绍
　　一　什么是术语学
　　二　术语学的发展简介
　　三　术语学的主要流派
　　四　我国的术语学研究
　　五　术语数据库
　　六　术语概念的唯一性与术语定义的多样性
　　七　术语与普通词语
　　八　术语的跨语言借用
　　九　新术语与旧术语在定义出现概率上的区别
　　十　术语的语缀
　　十一　一些基本概念
　第四节　术语与术语定义的界定
　　一　术语的界定
　　二　术语定义的界定
第二章　术语定义的抽取研究
　第一节　候选术语定义的规则匹配
　　一　文本下载
　　二　文本的预处理
　　三　文本的分词
　　四　候选术语定义的模板匹配
　第二节　基于统计方法的术语定义抽取
　　一　词语的定义隶属度
　　二　句子的定义隶属度
　　三　句子的定义隶属度实验结果
　第三节　向量空间距离计算
　　一　向量空间模型介绍
　　二　向量空间模型的引用
　　三　向量空间模型实验结果示例
　第四节　隶属度计算和向量空间模型的结合
　第五节　术语定义抽取系统结构与实验结果
　第六节　实验结果评价
　　一　网络文本结构的多样性因素
　　二　语言表达形式的多样性因素
　　三　分词的因素
　　四　网络文本的可靠性因素
　　五　搜索引擎准确率的因素
　　六　算法的因素
　第七节　术语定义形式的多样性
　　一　传统意义上的定义形式
　　二　下定义的要求
　　三　术语定义形式的多样性
　第八节　本章小结
第三章　术语定义的聚类研究
　第一节　术语定义聚类的必要性
　第二节　聚类综述
　　一　聚类与聚类分析
　　二　分类与聚类
　　三　硬聚类和软聚类
　　四　层级聚类与诽：层级聚类
　第三节　本研究采用的聚类方法
　　一　聚类步骤
　　二　相似度的界定和属性的选取
　　三　《知网》介绍
　第四节　术语定义的领域聚类
　　一　句子相似度计算
　　二　词语的相似度计算
　　三　术语定义领域聚类的停用词表的建立
　　四　聚类特征的选取
　第五节　术语定义聚类的结果及分析
　　一　领域聚类的判定复杂性
　　二　聚类相似度阈值的设定
　　三　《知网》知识库在领域聚类中的优点与局限性
　　四　聚类结果的错误分析
第四章　术语自动识别研究
　第一节　术语缺乏位置信息
　第二节　术语的抽取
　　一　术语的语言学特征
　　二　术语的粗抽取
　　三　术语边界的确定
　　四　术语的词性过滤
　　五　术语词性序列的统计
　第三节　候选术语的统计特征
　　一　术语的用词长度特征
　　二　候选术语的长度与词频计算
　　三　候选术语的最后得分
　第四节　过滤词表的构建
　　一　术语识别过滤词表构建的必要性
　　二　过滤词表的构建
　第五节　术语识别系统结构与实验结果
　第六节　实验结果分析
　　一　定义匹配模板的局限性
　　二　句子定义隶属度过低
　　三　其他情况
　第七节　本章小结
第五章　结束语
附录
　附录一　《人民日报》用词与术语定义用词对比
　附录二　词语的定义隶属度
　附录三　术语定义抽取的分步骤结果示例
　附录四　术语的词性序列
　附录五　术语抽取结果
　附录六　术语定义聚类的部分结果
　附录七　术语定义聚类程序示例
参考文献
致谢