自然语言处理领域的圣经《自然语言处理综论(Speech and Language Processing)》第三版(简称SLP3)备受瞩目,该书的正式出版日期一再推迟,不过该书作者NLP领域的大神 Daniel Jurafsky 教授和 James H. Martin 教授一直在该书官网上更新着相关章节的电子版,终于在2020年即将结束的前两天,两位教授发布了一个更新了若干章节的完整草稿版本(2020.12.30 version),而此前的版本大概是2019年10月版,估计这应该是正式出版前的最后一个完整电子草稿版了。
之前写过一篇《如何学习自然语言处理:一本书和一门课》,介绍了NLP领域经典书籍《自然语言处理综论(Speech and Language Processing)》第三版的相关情况,作为我的NLP入门书籍,十多年前我读过这本书的第一版中文翻译版,第二版英文版,进入深度学习自然语言处理时代,第三版英文版的更新迟迟未完结,也可能与目前NLP领域“日新月异”的发展有关,不过基础的东西不会过时,打好基础才是王道。
这个版本的更新官方说明如下:
- new version of Chapter 8 (bringing together POS and NER in one chapter),
- new version of Chapter 9 (with Transformers)
- Chapter 11 (MT)
- neural span parsing and CCG parsing moved into Chapter 13 (Constituency Parsing) and Statistical Constituency Parsing moved to Appendix C
- new version of Chapter 23 (QA modernized)
- Chapter 26 (ASR + TTS)
- Plus a modernizing pass (and typo fixing, thanks to all of you!!!) on all the other chapters.
与之前的版本相比,这个版本新增了第8章(将词性标注和命名实体识别合并为一个章节),第9章(Transformer模型相关),第11章(机器翻译),第23章(对话技术),第26章(语音识别和语音合成),调整了句法分析中的部分内容到相应的章节和附录,以及修复了相关章节中错误内容。不过从全局来看,这本书剩下的章节已经不多了,预计2021年可以出版:
关于作者,两位都是NLP领域的神牛,以下是第二版中文翻译版中详细的介绍:
Daniel Jurafsky现任斯坦福大学语言学系和计算机科学系副教授。在此之前,他曾在博尔德的科罗拉多大学语言学系、计算机科学系和认知科学研究所任职。他出生于纽约州的Yonkers,1983年获语言学学士,1992年获计算机科学博士,两个学位都在伯克利加利福尼亚大学获得。他于1998年获得美国国家基金会CAREER奖,2002年获得Mac-Arthur奖。他发表过90多篇论文,内容涉及语音和语音处理的广泛领域。
James H. Martin现任博尔德的科罗拉多大学语言学系、计算机科学系教授,认知科学研究所研究员。他出生于纽约市,1981年获可伦比亚大学计算机科学学士,1988年获伯克利加利福尼亚大学计算机科学博士。他写过70多篇关于计算机科学的论著,出版过《隐喻解释的计算机模型》(A Computational Model of Metaphor Interpretation)一书。
最后是如何下载这个电子版,其实官网上已经提供了相关的下载链接:https://web.stanford.edu/~jurafsky/slp3/ ,包括最新的完整草稿电子版和相关章节电子版,以及对应的Slides。如果下载速度较慢或者希望保存到网盘上,可以关注我们的公众号:"AINLP" , 回复 "slp3" 获取该书电子版以及 Daniel Jurafsky 教授之前在Coursera上开播的斯坦福大学自然语言处理课程相关资料视频(目前已绝版),一并学习自然语言处理。
注:原创文章,转载请注明出处及保留链接“我爱自然语言处理”:https://www.52nlp.cn