书目

文本挖掘概论:研究设计、数据收集与分析

内容简介

本书共分为六个部分:基础入门、研究设计和基础工具、文本挖掘基础、人文社会科学与文本分析、计算机科学与文本挖掘、写作和展示,在内容安排上由浅入深、循序渐进。相较于单一且详尽的方法教程,本书的目的更多是在于指导学生运用社会世界的文本数据来设计一项可行的社会科学研究。本书涵盖了文本挖掘研究多个方面的关键问题,包括网络抓取和爬虫、策略性数据选择、数据抽样、特定的文本分析和文本挖掘方法以及研究报告的撰写。除了技术性内容,本书还讨论了基于文本的社会科学研究设计面临的伦理和哲学问题。同时,书中还提供了各种学科的具体案例,方便来自不同领域的文本挖掘研究者理解和学习。

作者简介

加布·伊格纳托(GabeIgnatow)社会学副教授,2007年起任教于北得克萨斯州大学(UNT)。研究方向为社会学理论、文本挖掘和分析、新媒体以及信息政策。目前与计算机科学和统计学领域的专家合作,将文本挖掘和主题模型技术应用于社会科学研究。1990年以来,加布一直致力于文本的混合分析方法,并在以下期刊发表了研究成果:SocialForces,SociologicalForum,Poetics,JournalfortheTheoryofSocialBehaviour,JournalofComputer-MediatedCommunication。共发表或出版三十余篇论文和图书章节,担任以下期刊的编委会成员:SociologicalForum、JournalfortheTheoryofSocialBehaviour和StudiesinMediaandCommunication。曾担任北得克萨斯州大学社会学系研究生项目副主任和本科生项目主任,耶鲁大学文化社会学中心理事会成员。研究生项目搜索引擎公司GradTrek的联合创始人和首席执行官。 拉达·米哈尔恰(RadaMihalcea)密歇根大学计算机科学与工程专业教授,研究兴趣为计算语言学,尤其是词汇语义学、多语自然语言处理和计算社会科学。担任以下期刊的编委:ComputationalLinguistics,LanguageResourcesandEvaluation,NaturalLanguageEngineering,ResearchonLanguageandComputation,IEEETransactionsonAffectiveComputing以及TransactionsoftheAssociationforComputationalLinguistics。2015年计算语言学协会北美分会(NAACL)会议主席,2011年计算语言学协会会议联合项目主席,2009年自然语言处理中的经验方法会议联合项目主席。曾获2008年美国国家科学基金会CAREER奖和2009年美国青年科学家与工程师总统奖。2013年,获得家乡罗马尼亚克卢日-纳波卡颁发的“荣誉公民”称号。 译者简介汪顺玉二级教授,博士,博士生导师,“西外学者”领军学者,西安外国语大学研究生院院长。先后主持国家社科重点项目、jiaoyu部人文社科项目、省市级哲学社会科学规划课题、教改重点课题、教育考试院课题等10余项。在《外语教学》《英语研究》《重庆大学学报》《上海科技翻译》《天津外国语大学学报》等刊物发表学术论文30余篇,出版学术专著、译著、教材8部。学术兴趣包括语言测试与评价、学术翻译、话语研究、社会研究方法等。陈瑞哲西安外国语大学在读博士,西安邮电大学人文与外国语学院讲师。发表学术论文10余篇,出版书籍5部,译著2部。曾获陕西省第十五次哲学社会科学优秀成果奖二等奖,陕西高等学校人文社会科学研究优秀成果三等奖。研究兴趣为文本挖掘和话语分析。 

目录

—  END  —