中文文本信息处理的原理与应用

当前位置:首页 > 教材 > 研究生/本专科 > 中文文本信息处理的原理与应用

出版社:清华大学出版社
出版日期:2007-9
ISBN:9787302154983
页数:321页

作者简介

《中文文本信息处理的原理与应用》是一本全面系统地介绍中文文本信息处理的教材,内容丰富,由浅入深地讲述了中文文本信息处理的原理与应用。本书不仅介绍了基于规则的自然语言分析方法,也介绍了基于统计学的方法。全书共分为四大部分,分别是词法分析、语法处理、语义分析和应用与技术。其中前三部分是自然语言处理的基本理论,第一部分针对中文处理中特有的分词问题,介绍了自动分词算法、分词中歧义的消除和未登录词的识别算法,另外还介绍了语料库的相关知识。第二部分和第三部分都是从语法(语义)的表示入手,将自然语言形式化,再给出语法(语义)分析的算法,并针对该过程中的歧义问题给出了一些成熟的解决方案。最后一部分讲述自然语言理解在信息检索、信息抽取、自动文摘和文本分类等领域的应用。

书籍目录

第1章 概论 1.1 自然语言处理与中文信息处理 1.2 自然语言处理的新趋势 1.3 本书内容组织第一部分 词法分析 第2章 自动分词  2.1 关于自动分词  2.2 分词词典  2.3 机械分词方法 第3章 分词歧义消解  3.1 关于分词歧义  3.2 基于规则的分词消歧  3.3 基于统计方法的分词消歧 第4章 未登录词获取  4.1 关于未登录词  4.2 基于统计学的未登录词获取方法  4.3 中文姓名的自动辨识  4.4 中文统计词汇获取  4.5 无词典分词方法 第5章 语料库的构建  5.1 关于语料库  5.2 汉语语料库的基本加工规范  5.3 建设语料库的其他问题 第一部分习题第二部分 语法处理 第6章 自动标注  6.1 关于自动标注  6.2 马尔可夫模型和隐马尔可夫模型  6.3 马尔可夫模型标注器    6.4 隐马尔可夫模型标注器 第7章 语法表示  7.1 关于语法表示  7.2 形式语法描述  7.3 短语结构语法  7.4 转移网络  7.5 短语结构与句法树 第8章 语法分析  8.1 关于语法分析  8.2 基于符号串的句法分析  8.3 自底向上的图句法分析  8.4 自顶向下的图句法分析  8.5 基于转移网络的句法分析  8.6 移进归约句法分析器  8.7 概率上下文无关文法分析 第二部分习题第三部分 语义分析 第9章 语义表示  9.1 关于语义表示  9.2 语义的逻辑表示方法  9.3 论旨角色  9.4 语义网络表示法  9.5 框架表示法  9.6 量词的处理 第10章 语义分析  10.1 关于语义分析  10.2 组合理论与语义解释  10.3 基于语义特征的解释方法  10.4 基于语法关系的语义分析  10.5 语义语法  10.6 模板匹配  10.7 语义驱动的分析技术 第11章 语义消歧  11.1 关于语义歧义   11.2 选择限制法消歧  11.3 语义网络  11.4 统计词义消歧  11.5 统计语义优选 第三部分习题第四部分 应用与技术 第12章 文本分类  12.1 关于文本分类  12.2 文本分类方法  12.3 文本分类的评测 第13章 信息检索  13.1 关于信息检索  13.2 基于统计学的信息检索模型  13.3 基于语义的信息检索  13.4 典型信息检索系统  13.5 信息检索技术前沿 第14章 信息抽取  14.1 关于信息抽取  14.2 半结构化文本的信息抽取技术  14.3 典型信息抽取系统  14.4 Web信息抽取 第15章 自动文摘  15.1 关于自动文摘  15.2 自动文摘的方法  15.3 自动文摘系统的评测  15.4 自动文摘系统 第四部分习题参考文献

图书封面


 中文文本信息处理的原理与应用下载 更多精彩书评



发布书评

 
 


精彩书评 (总计1条)

  •     只针对书中莫名其妙的部分进行了查找,看懂的部分就没有再查找,估计也是抄袭居多P22~P28抄袭 朱巧明, 培峰李, 朱晓旭《中文信息处理技术教程》的P192P54~P60抄袭孙茂松 黄昌宁发表在中文信息学报上的《中文姓名的自动辨识》P92~P100 抄袭翻译自MIT出版社1999年Christopher D.Manning and Hinrish Schutze的Foundations of Statistical Natural Language Processing第10章P332, P349~P350,P357~P361第7,8章写的还可以,应该是另一个人写了吧,风格完全不一样了第9,10章不查找其它资料,肯定看不懂,尤其是第10章,第10章看之前先上网看下这个材料ftp://ftp.cs.sjtu.edu.cn:990/lu-rz/nlu%B7%AD%D2%EB%B0%E6_prolog/04cd.pdf,否则根本看不懂的to be continued......

精彩短评 (总计14条)

  •     市面上很多国内的书都是拼、剪、凑形成的,一点都不用心,这本书看完了前三部分,第四部分留待以后再看,也可能是永不再看了~
  •     信息处理方面很不错的教材
  •     本书难度不小,适合有时间钻研的朋友。
  •     介绍的太范,太浅
  •     由于市场上这类书比较少,所以可以说开卷有益吧!书还是有点偏理论,对于像我这样没有基础的学习者挺合适的。
  •     不错 是很新 是正版吧 反正和我们老师用的一模一样
  •     介绍了各种方法,没有深入研究
  •     还没来得及细看,粗粗翻了一下,还不错
  •     这本书写的不错,我已看过多次了,适合自然语言初学者的确是本好书。
  •     这本书还可以,讲解较为全面,作为入门教材比较可以。
  •     很水的一本书,还不如买本《统计自然语言处理基础》来看看
  •     这本书很适合信息管理、情报学专业同学好好学习的。
  •     抄也就算了,抄了也不好好组织一下!
  •     这本书的作者我认识,同济计算机系的一位知名教授.可是书中大段大段抄袭别人的内容,让读者很不爽.如果没有中文文本处理/自然语言处理基础的读者可以买一本看看.
 

农业基础科学,时尚,美术/书法,绘画,软件工程/开发项目管理,研究生/本专科,爱情/情感,动漫学堂PDF下载,。 PDF下载网 

PDF下载网 @ 2024