分类:数据挖掘

使用机器学习处理iris数据集

from sklearn.datasets import load_iris import pandas as…


机器学习分类笔记

import numpy as np import struct import matplotlib.pypl…


机器学习新手入门参考笔记

# 注:在jupyter上运行 # 从一堆数据到训练好数据的机器学习模型,中间有很多过程,每个过程往往又有很多…


使用hadoop进行数据集求交

背景 之前业务里面遇到一个问题,就是有两批url,都是亿级的,里面有一些相同的url,我们需要找出这些相同的u…


记录一次C++实现ID3算法的过程-决策树模型

背景 用C++练习实现了一次ID3算法的决策树模型,中间也遇到了一下问题,记录一下 数据:隐形眼镜数据集 该数…


记录一次C++实现KNN的过程

背景 用C++写了一次KNN实现过程的练习,数据使用的《机器学习实战》第二章 ”改进约会网站配对效果“ 中的数…