注册 登录 进入教材巡展
#
  • #

出版时间:2016-03

出版社:科学出版社

以下为《固定短语的自动提取研究》的配套数字资源,这些资源在您购买图书后将免费附送给您:
  • 科学出版社
  • 9787030473837
  • 1-1
  • 77365
  • 44179373-4
  • 平装
  • B5
  • 2016-03
  • 252
  • 200
  • 工学
  • 计算机科学与技术
  • TP391
  • 计算机
  • 本科 研究生(硕士、EMBA、MBA、MPA、博士)
内容简介
  刘荣所著的《固定短语的自动提取研究》以固定短语自动提取为研究目标,围绕结合紧密、使用稳定原则,采取统计与规则相结合的算法,并通过历时考察最终取得固定短语。本书主要内容包括:领域高频种子词提取、通过统计量对短语的考察、通过句法规则对短语的考察、通过语义对短语的考察、历时分析对短语的考察。
  本书适合高校语言学与应用语言学专业、计算语言学专业读者阅读,也可作为计算机专业学生的参考用书。
目录
《智能科学技术著作丛书》序
序一
序二
前言
第一章  绪论
  1.1  问题的提出
  1.2  固定短语的界定
  1.3  研究目标
  1.4  研究内容和研究重点
  1.5  研究意义
    1.5.1  对中文信息处理领域的意义
    1.5.2  对语言资源监测领域的意义
    1.5.3  对汉语语言学领域的意义
    1.5.4  对词典编纂领域的意义
    1.5.5  对对外汉语教学领域的意义
    1.5.6  对舆情分析领域的意义
  1.6  创新点
  参考文献
第二章  短语提取相关研究综述
  2.1  国内语言学界对固定短语的研究
    2.1.1  国内语言学界对固定短语的定义
    2.1.2  国内语言学界对固定短语的研究方法和现状
  2.2  信息处理界对短语的研究综述
    2.2.1  国内外短语识别基本方法
    2.2.2  术语提取基本方法和技术
    2.2.3  国内对于短语研究所做的重要的工作
    2.2.4  搭配的度量指标——搭配强度、搭配离散度、搭配尖峰
  2.3  国外短语提取的最新进展
    2.3.1  多字词表达的定义
    2.3.2  多字词表达的复杂特性
    2.3.3  多字词表达的提取
    2.3.4  多字词表达研究的代表性工作
  2.4  本章小结
  参考文献
第三章  固定短语提取的基础平台
  3.1  基础数据资源——DCC语料库
    3.1.1  语料库和语料库语言学
    3.1.2  动态知识更新理论与动态流通语料库
    3.1.3  基于动态流通语料库的主要研究
  3.2  工具简介
  3.3  基础数据资源加工——语料的准备和预处理
    3.3.1  语料的选择标准
    3.3.2  语料库的存储模式
    3.3.3  语料库的语料量
    3.3.4  原始语料格式转换
    3.3.5  文本分类
    3.3.6  文本分词
  3.4  本章小结
  参考文献
第四章  利用特定领域的高频种子词提取固定短语候选串
  4.1  教育领域高频种子词提取
  4.2  面向特定领域的固定短语提取长度的确定
    4.2.1  已有的研究成果
    4.2.2  实验步骤和实验数据
    4.2.3  实验结果及分析
    4.2.4  结论
  4.3  固定短语候选串提取
  4.4  本章小结
  参考文献
第五章  固定短语候选串的定量考察与分析
  5.1  结合紧密与搭配的关系
  5.2  搭配研究综述
    5.2.1  国外搭配研究综述
    5.2.2  国内语言学界对搭配的研究。
    5.2.3  国内外语言界对搭配的研究
    5.2.4  国内计算语言学界对搭配的研究
  5.3  对结合紧密的搭配从统计量角度的分析
    5.3.1  互信息和熵简介
    5.3.2  互信息和熵的计算
    5.3.3  互信息和熵的计算结果
  5.4  按照频次、互信息结合的方法提取两个切分单位固定短语候选串
    5.4.1  实验方法
    5.4.2  实验结果及分析
    5.4.3  对“v+n”的考察
  5.5  利用频次、互信息、熵值结合的方法提取固定短语候选串
    5.5.1  实验方法
    5.5.2  实验结果
    5.5.3  数据分析
  5.6  本章小结
  参考文献
第六章  固定短语候选串的句法角度考察与分析
  6.1  固定短语候选串从定量到定性分析
  6.2  句法角度考察
    6.2.1  类联接简介
    6.2.2  类联接的定义
    6.2.3  本文的类联接类型
  6.3  类联接模式对固定短语候选串的提取
    6.3.1  实验方法
    6.3.2  实验结果
  6.4  数据分析
    6.4.1  类联接“a+n”候选串分析
    6.4.2  类联接“n+n”候选串分析
    6.4.3  类联接“v+n”候选串分析
    6.4.4  类联接“n+v”候选串分析
    6.4.5  类联接“v+v”候选串分析
  6.5  本章小结
  参考文献
第七章  固定短语候选串语义角度考察与分析
  7.1  搭配与语义的相互关系
    7.1.1  语义对搭配的制约
    7.1.2  搭配的语义基础
    7.1.3  搭配决定语义
    7.1.4  国内研究综述
  7.2  知网简介
    7.2.1  知网的结构
    7.2.2  知网对词的描述
    7.2.3  知网的信息结构规则
  7.3  基于知网的考察和过滤
  7.4  基于知网的考察实验
    7.4.1  实验方法
    7.4.2  实验数据
    7.4.3  实验分析过程
  7.5  本章小结
  参考文献
第八章  固定短语候选串的历时考察
  8.1  历时中包含有共时和共时中包含有历时的相对时间观
    8.1.1  索绪尔的时间观
    8.1.2  历时中包含有共时和共时中包含有历时的相对时间观
  8.2  时点和时段的相对性
  8.3  历时考察相关研究工作
  8.4  历时考察工作
    8.4.1  语料数据
    8.4.2  历时考察对象
    8.4.3  历时考察方法
    8.4.4  数据分析
  8.5  本章小结
  参考文献
第九章  结语
  9.1  全文总结
  9.2  进一步的工作
附录
  附表1  位序比法提取的教育领域高频词(按频次降序排序前一百)
  附表2  左熵排序(按左熵降序排序前一百)
  附表3  右熵排序(按右熵降序排序前一百)
  附表4  “v+n”互信息排序前100(按互信息降序排序前一百)
后记