当前位置:首页 > 图书中心 > 图书 > 人文社科 > 文本挖掘概论:研究设计、数据收集与分析
文本挖掘概论:研究设计、数据收集与分析
ISBN:978-7-5689-3908-9
万卷方法
作者:加布·伊格纳托 拉达·米哈尔恰 著 汪顺玉 陈瑞哲 译
策划编辑:林佳木
编辑:石可
字数(千):325 页数:238 印次:1-1
开本:16开  平装
出版时间: 2023-08-25
定价:¥68
内容简介

本书共分为六个部分:基础入门、研究设计和基础工具、文本挖掘基础、人文社会科学与文本分析、计算机科学与文本挖掘、写作和展示,在内容安排上由浅入深、循序渐进。相较于单一且详尽的方法教程,本书的目的更多是在于指导学生运用社会世界的文本数据来设计一项可行的社会科学研究。本书涵盖了文本挖掘研究多个方面的关键问题,包括网络抓取和爬虫、策略性数据选择、数据抽样、特定的文本分析和文本挖掘方法以及研究报告的撰写。除了技术性内容,本书还讨论了基于文本的社会科学研究设计面临的伦理和哲学问题。同时,书中还提供了各种学科的具体案例,方便来自不同领域的文本挖掘研究者理解和学习。

目录
第一部分 基础入门
第1章 文本挖掘和文本分析
第2章 数据获取
第3章 研究伦理
第4章 哲学和逻辑基础
第二部分 研究设计和基础工具
第5章 研究设计
第6章 网络抓取和网络爬虫
第三部分 文本挖掘基础
第7章 词汇资源
第8章 基础文本处理
第9章 监督学习
第四部分 人文社会科学与文本分析
第10章 叙事分析
第11章 主题分析
第12章 隐喻分析
第五部分 计算机科学与文本挖掘
第13章 文本分类
第14章 观点挖掘
第15章 信息抽取
第16章 主题模型
第六部分 写作和展示
第17章 成果撰写和展示
附录A 数据资源
附录B 文本处理和清洗软件
附录C 文本分析软件
附录D 质性数据分析软件
附录E 观点挖掘软件
附录F 索引和关键词频软件
附录G 可视化软件
附录H 统计工具
附录I 网络资源
术语表
参考文献