机器学习里最流行的模型是什么_山东广播网-山东重点资讯网站-山东权威资讯门户网站

机器学习里最流行的模型是什么

发布人:admin

发表时间:2019-02-14 12:22

山东广播网记者昨日获悉：在过去几十年里，机器学习领域发生了巨变。诚然，有些方法已经存在很长一段时间，仍然是该领域的重要方法。例如，最小二乘法的概念早在19世纪早期就由Legendre 和Gauss提出。其他方法，如神经网络，其最基本的形式是在1958年引入的，在过去的几十年里得到了很大的发展，而其他方法，如支持向量机 (SVMs)，则是最近才出现的。

　　可能有比出版物数量更准确的标准来衡量流行度。比如，出版物中对某一模型的批评并非意味该模型是流行的。

　　分析会受到使用的搜索词的影响。为了确保较高的准确度，我们没有使用模型的缩写，这就有可能导致不能检索到所有可能的结果。此外，对于那些在分析中未被考虑的搜索项引用的模型而言，灵敏度可能较低。

　　有时，出版物存储的元数据有误（如年份有误）或可能存在重复的出版物，因此，出版频率中的一些干扰是可以预测的。

　　本文将进行两种分析。第一种是对出版频率的纵向分析；第二种是比较不同领域中涉及机器学习模型的出版总量。

　　山东广播网记者昨日获悉：第一种分析通过搜索Google Scholar（收录科学出版物的标题和摘要）中的数据来确定出版物的数量。而从Google Scholar搜索数据是出了名的困难，所以我们借助ScrapeHero提供的实用建议来收集数据。

　　分析中包括了以下13种监督方法：神经网络、深度学习、支持向量机、随机森林、树形判定分类法、线性回归、逻辑回归、泊松回归、岭回归、套索回归、k-近邻法、线性判别分析和对数线性模型。注意，套索回归考虑了套索回归术语和套索模型；k-近邻法考虑了k近邻术语。所得到的数据集显示了从1950年至今与每个监督模型有关的出版物数量。

　　由于监督学习有大量可用的方法，所以人们经常提出一个问题：最好的模型是什么？众所周知，这个问题很难回答，正如George Box所言，所有的模型都是不好的，但也都有一些可取之处。而判断模型有用与否则取决于手头上的数据。因此，这个问题没有统一答案。相比而言，下面这个问题要容易回答一些：最流行的模型是什么？这是本文的关注点所在。山东广播网记者昨日获悉