内容简介
本书共分为六个部分:基础入门、研究设计和基础工具、文本挖掘基础、人文社会科学与文本分析、计算机科学与文本挖掘、写作和展示,在内容安排上由浅入深、循序渐进。相较于单一且详尽的方法教程,本书的目的更多是在于指导学生运用社会世界的文本数据来设计一项可行的社会科学研究。本书涵盖了文本挖掘研究多个方面的关键问题,包括网络抓取和爬虫、策略性数据选择、数据抽样、特定的文本分析和文本挖掘方法以及研究报告的撰写。除了技术性内容,本书还讨论了基于文本的社会科学研究设计面临的伦理和哲学问题。同时,书中还提供了各种学科的具体案例,方便来自不同领域的文本挖掘研究者理解和学习。