0%

数据挖掘上分思路

比赛思路-阅读

https://www.secrss.com/articles/15352

BERT-Finetune、BERT-CNN-Pooling、BERT-RCNPooling多种结构进行融合!

  • 每一个模型的基础上,进行10折交叉验证

  • 利用 textrank4zh 对每条新闻文本取10个关键词,汇集所有的关键词,得到前100个出现最多的关键词。通过观察这些关键词,发现假新闻喜欢对部分人名、地名、名词、动词进行造谣。

  • 模型融合+gru

假图片

基本统计特征:

  • 图片尺寸

  • 图片后缀类型

  • 图片模式(RGB、灰度等)

  • 清晰度、亮度

  • 直方图分布特征

  • 各通道的均值方差等统计特征

特征意义:

  • 关键特征包括图片尺寸和清晰度特征
  • 图片尺寸可以识别图片的来源,比如手机截图的尺寸和相机照片尺寸截然不同

一般认为图像越清晰越是真的,因为图像经过ps篡改之后清晰度会下降,还有一种可能性是谣言往往传播得更快,传播过程中的每一次保存和发送都可能会降低清晰度

-------------本文结束感谢您的阅读-------------