比赛思路-阅读
https://www.secrss.com/articles/15352
BERT-Finetune、BERT-CNN-Pooling、BERT-RCNPooling多种结构进行融合!
每一个模型的基础上,进行10折交叉验证
利用 textrank4zh 对每条新闻文本取10个关键词,汇集所有的关键词,得到前100个出现最多的关键词。通过观察这些关键词,发现假新闻喜欢对部分人名、地名、名词、动词进行造谣。
模型融合+gru
假图片
基本统计特征:
图片尺寸
图片后缀类型
图片模式(RGB、灰度等)
清晰度、亮度
直方图分布特征
各通道的均值方差等统计特征
特征意义:
- 关键特征包括图片尺寸和清晰度特征
- 图片尺寸可以识别图片的来源,比如手机截图的尺寸和相机照片尺寸截然不同
一般认为图像越清晰越是真的,因为图像经过ps篡改之后清晰度会下降,还有一种可能性是谣言往往传播得更快,传播过程中的每一次保存和发送都可能会降低清晰度