本文共 236 字,大约阅读时间需要 1 分钟。
下午参加了个交流会,主要介绍了一下K近邻算法。这里把我的理解总结一下。
K临近算法就是,样本中的数据有多个维度,每条样本对应一个标签。对要判断的数据,跟样本中的数据求出距离,然后递增排序,去前K个距离近的样本,对应标签比例大的那个就是,要判断的数据对应的标签。
这个算法的思想还是挺好理解的,但是真正应用到实际问题时,可能对不同数据,需要具体考虑。
例如,样本数据较大时,不能都去求距离,然后排序,这样效率太低。
求距离很多方法,过两天再贴出来。
这也算是刚入门,加油!!
转载地址:http://bjrsi.baihongyu.com/