书目

数据科学实战之网络爬取:Python实践和示例

内容简介

本书提供了一个完整的、现代的Web抓取指南,使用Python作为编程语言,专为数据科学的读者编写,探讨了Web抓取和以及其背后的大量Web技术。书中首先简要概述抓取和现实生活中的用例,解释了HTTP、HTML和CSS的核心概念作为基础。*后总结了一些*佳实践和一系列的例子,这些数据科学用例汇集了你学到的所有知识。读者将学习到如何利用已建立的*佳实践和常用的Python包,处理包括JavaScript、Cookie和常见的web抓取技术。

作者简介

SeppevandenBroucke是比利时鲁汶大学经济与商务学院数据科学方面的助理教授。他的研究兴趣包括商务数据挖掘和分析、机器学习、流程管理和流程挖掘,相关论文发表在国际期刊和会议上。Seppe从事包括高级分析、大数据和信息管理课程方面的教学工作,也经常提供工业和商业用户的培训。除了工作,Seppe喜欢旅行、阅读(从Murakami到Bukowski到Asimov)、听音乐(从BookaShade到MilesDavis到ClaudeDebussy)、看电影和连续剧(由于没时间现在看得少多了)、玩游戏和关注新闻事件。BartBaesens是比利时鲁汶大学大数据和数据分析方面的教授,也是英国南安普顿大学的讲师。他对大数据及分析、信用风险建模、欺诈检测和营销分析进行了广泛的研究。Bart撰写了200多篇学术论文和若干本书。除了与家人共度时光外,他还是一名布鲁日足球俱乐部的铁杆球迷。Bart是美食家和业余厨师,他喜欢在他的酒窖里或者在花园里俯瞰红色英式电话亭时喝一杯好酒(他*喜欢的是白维欧尼或红赤霞珠)。Bart热爱旅行,对次世界大战着迷,并阅读了很多关于这个主题的书籍。

目录

丛书

数据科学与工程技术丛书

—  END  —