-
Shopee联盟代码:产品评价
资源介绍
数据科学预测用户评分(1-5)
通过给定的产品评论来预测用户评分。
浏览了约150000条产品评论。
处理的文本:对文本进行词形化处理,删除特殊字符,删除sxtra空格,删除停用词。
通过使用Binary分类模型(Logistic回归,SVM)和神经网络(DNN,LSTM,带有单词embeddubg的LSTM)对系统进行了优化。
使用的代码和资源
的Python版本: 3.7 包裹: pandas,numpy,spacy,nltk,sklearn,keras 问题陈述和数据: : 文本预处理参考: : 模型参考: :
文字预处理
做文本预处理:
删除重音符号
扩大收缩
小写文字
删除多余的换行符
在特殊字符之间插入空格以将其隔离
使文本合法化
删除特殊字符
删除停用词
标记化
建筑模型
我尝试了五个不同的模型,并使用准确性和混淆矩阵对其进行了评估:将数据从简单模型拟合到复杂
- 上一篇: 数学建模中的股票趋势分析
- 下一篇: 股市投资回报模型