书目

智能搜索引擎技术

内容简介

《智能搜索引擎技术》以当前搜索引擎主流技术为基础,密切关注前沿技术发展趋势,结合当前人工智能和自然语言技术的发展,以深入浅出的形式介绍一套完整的大数据时代背景下的智能搜索引擎的关键技术。《智能搜索引擎技术》在吸取国内外经典教材优点的基础上,广泛搜集合适的实例,通过实例从多个视角对智能搜索引擎的核心技术进行全面介绍,加深读者对关键概念和核心技术的理解。《智能搜索引擎技术》还对开源软件进行了介绍,将技术理论与应用范例结合。《智能搜索引擎技术》共分为10章,通过采用循序渐进的组织方式对搜索引擎的各个组成部分和核心技术进行了介绍。第1章引言,对搜索引擎进行了简要概述,介绍了搜索引擎与信息检索的关系,搜索引擎的历史、分类及基本架构。第2章信息采集,主要围绕搜索系统的核心——网络爬虫进行介绍。第3章文本处理,对搜索引擎的文本处理功能进行了介绍,包括文本信息的提取、自然语言中的统计语言模型、中英文分词技术、网页去重算法等。第4章搜索引擎索引构建,主要介绍搜索引擎的索引系统,包括倒排索引、建立索引的方式、索引的更新策略、分布式索引及索引压缩算法。第5章基于文本内容的检索模型,对搜索引擎的检索模型进行了介绍,包括传统的检索模型,如布尔模型、向量空间模型、概率检索模型和基于统计语言建模的检索模型,以及基于机器学习的排序模型。第6章基于链接的检索模型,主要对基于链接的检索模型和针对链接作弊的反作弊模型进行了介绍。第7章查询处理与结果展示,主要对查询条件的纠正与过滤、查询处理与展示的技术进行了介绍。第8章相关反馈与查询扩展,主要对围绕着相关反馈和查询扩展的各项技术进行了介绍,通过采用相关反馈和查询扩展的技术理解用户的查询意图。第9章分类与聚类,主要介绍了在智能搜索引擎中用到的各种机器学习算法。第10章基于知识图谱的搜索引擎,对未来搜索引擎的发展方向——基于知识图谱的智能搜索引擎进行了介绍,包括知识图谱的构建流程、构建中的信息抽取、知识融合、知识表示与推理等关键技术及其在搜索引擎中的应用。《智能搜索引擎技术》适用于数据科学与大数据技术专业及其计算机相关专业的本科生或研究生以及从事该领域研究的人员。通过对《智能搜索引擎技术》的阅读,可以使读者对智能搜索引擎的相关知识有一个基本的了解,并为将来开展研究工作打下坚实的基础。

目录

丛书

普通高等院校数据科学与大数据技术专业“十三五”规划教材

—  END  —