资源介绍
可重现的研究工作流程示例:Python中的JSON解析和文本挖掘,R + RMarkdown
这是一个基本示例工作流程,它遵循的原则,使用GNU Make,Python和R进行可重现的研究工作流程。 请将此模板与我们的教程结合使用,网址为 。
该存储库的主要目的是要有一个干净基本的结构,可以很容易地对其进行调整以在实际项目中使用。 在此示例项目中,完成以下操作:
管道阶段“数据准备”
将原始JSON数据下载到zip文件中
解压缩数据
将JSON数据解析为CSV文件
加载CSV文件,并使用Python的TextBlob包通过文本挖掘指标丰富文本数据,以进行情感分析
管道阶段“分析”
从上一个管道阶段加载最终输出文件,运行预清理代码
使用简单的统计信息生成RMarkdown HTML输出
依存关系
通过Anaconda发行版的Python
通过pip install -U text
- 上一篇: Text_Mining_Python:用于文本挖掘的Python教程
- 下一篇: R七种武器之文本挖掘