书目

SparkNLP自然语言处理(影印版)

内容简介

如果你想构建一款使用自然语言文本的企业级应用,但不确定从哪里着手或者该使用什么工具,这本实用指南可以助你一臂之力。Wisecube首席数据科学家AlexThomas向软件工程师和数据科学家们展示了如何使用深度学习和ApacheSparkNLP库构建可扩展的自然语言处理(NaturalLanguageProcessing,NLP)应用。通过具体的示例、实践和理论解释,以及在Spark处理框架上使用NLP进行的动手练习,本书将教授你从基本语言学和书写系统到情感分析和搜索引擎的一切。除此之外,你还将探究开发基于文本的应用时要特别注意的性能等问题。在本书的四个部分中,你将学习到NLP基础知识和基本构成要素,然后再深入研究应用和系统构建:基础:理解自然语言处理、ApacheStark上的NLP及深度学习的基础知识。基本构成要素:学习包括标记化、句子分割和命名实体识别在内的NLP应用构建技术,知晓其工作方式及工作原理。应用:探究构建你自己的NLP应用所涉及的设计、开发和实验过程。构建NLP系统:考虑生产和部署NLP模型的备选方案,包括支持哪些人类语言。

作者简介

亚历克斯・托马斯是Wisecube的首席数据科学家。他将自然语言处理和机器学习运用于临床数据、身份数据、雇主和求职者数据以及如今的生化数据。Alex从09版本开始使用ApacheSpark,在工作中也用过包括UIMA和OpenNLP在内的多种NLP库和框架。

目录

—  END  —