舆情分析技术

来自CloudWiki
跳转至: 导航搜索

数据可视化

Python-在线网页导出为图片或pdf:https://blog.csdn.net/y472360651/article/details/105393396/

按日/周/月 生成舆情分析报告。

舆情分析技术

中文分词技术

对微博/帖子中的文字拆分成短语,

          pytthon jieba 分词(over)

https://www.jianshu.com/p/c3b239dd2b64

关键词提取算法

关键词提取算法:提取微博/帖子中的关键词

TF/IDF算法,TextRank算法,LSA/LSI/LDA算法

TF/IDF算法,LSA/LSI/LDA算法 : python gensim包

TextRank算法: pytthon jieba包

文本向量化

文本向量化:计算微博/文章的相似度 ,寻找同一主题的文章

向量化算法word2vec, str2vec

word2vec训练中文词向量:https://blog.csdn.net/lilong117194/article/details/82849054

文本聚类

文本聚类:用K-means 对文本进行聚类 ?

情感分析

情感分析算法:

      词法分析
      基于机器学习的分析
      混合分析

python实现情感分析(Word2Vec):https://blog.csdn.net/qq_45874897/article/details/107662626

大数据架构技术:hadoop,spark

基于spark的舆情分析研究:

https://www.doc88.com/p-7334988699450.html

基于hadoop的中文舆情分析

https://blog.csdn.net/weixin_34381666/article/details/89613017