0%

摘要

决策树算法类似于数据结构中的二分查找,可以使不同类型的数据集合,建立不同的分类器,最终可以通过决策树给出近似正确的结果。

决策树 Decision Tree

例如一个邮件系统,通过数个问题推断,不断进行缩小答案。

Read more »

——用十年的沉淀,成为一名业界优秀的软件工程师

ps :某次老师需要上交的工作职业规划

先引用之前与久哥的对话(百度T9架构师):

他问,“如果让你用10年的时间学习数据库,你能不能成为这个领域的专家?”
我说,“应该可以吧”
他说,“你现在20,10年后也才30,30岁就能成为某个领域的专家,为什么不去做呢?你看看周围有多少30岁的人还一事无成,而那个时候的你已经是数据库的专家了。”

Read more »

比赛思路-阅读

https://www.secrss.com/articles/15352

BERT-Finetune、BERT-CNN-Pooling、BERT-RCNPooling多种结构进行融合!

  • 每一个模型的基础上,进行10折交叉验证

  • 利用 textrank4zh 对每条新闻文本取10个关键词,汇集所有的关键词,得到前100个出现最多的关键词。通过观察这些关键词,发现假新闻喜欢对部分人名、地名、名词、动词进行造谣。

  • 模型融合+gru

Read more »

文本特征提取

参考

机器学习算法往往无法直接处理文本数据,需要把文本数据转换为数值型数据

One-Hot

One-Hot方法很简单,但是它的问题也很明显:

  • 没有考虑单词之间的相对位置,任意两个词之间都是孤立的;
  • 如果文档中有很多词,词向量会有很多列,但是只有一个列的值是1;
Read more »

数据包

sklearn datasets

提供一些导入,在线下载及本地生成数据集的方法。

sklearn.datasets模块主要提供了一些导入、在线下载及本地生成数据集的方法,可以通过dir或help命令查看,我们会发现主要有三种形式:load_、fetch_及make_的方法

Read more »

摘要

K最近邻(k-Nearest Neighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。

Read more »

前言

本系列文章源自于读《机器学习实战》这本书的学习笔记,用于记录学习内容,不断更新,,

21世纪互联网的发展,使得我们对于数据的收集更加容易,在这样大量数据的前提下,我们必须要挖掘出海量数据的价值,而机器学习的算法受到许多爱好技术人员的青睐,是因为这些算法在一定程度上可以帮助我们进行一些诸如回归预测,分类,识别等诸多场景的应用。

Read more »

在这里插入图片描述

unnatural 石原里美 入坑了她的美

Linux基本知识

查询命令 man

linux的命令和参数太多,而且容易记错,我们可以通过man [命令] 来查看如何命令的使用文档,这才是学习命令最好的办法。

Read more »