机器学习里最流行的模型是什么
资讯
发布人:admin
发表时间:2019-02-14 12:22

山东广播网记者昨日获悉:在过去几十年里,机器学习领域发生了巨变。诚然,有些方法已经存在很长一段时间,仍然是该领域的重要方法。例如,最小二乘法的概念早在19世纪早期就由Legendre 和Gauss提出。其他方法,如神经网络,其最基本的形式是在1958年引入的,在过去的几十年里得到了很大的发展,而其他方法,如支持向量机 (SVMs),则是最近才出现的。
  
  可能有比出版物数量更准确的标准来衡量流行度。比如,出版物中对某一模型的批评并非意味该模型是流行的。
  
  分析会受到使用的搜索词的影响。为了确保较高的准确度,我们没有使用模型的缩写,这就有可能导致不能检索到所有可能的结果。此外,对于那些在分析中未被考虑的搜索项引用的模型而言,灵敏度可能较低。
  
  有时,出版物存储的元数据有误(如年份有误)或可能存在重复的出版物,因此,出版频率中的一些干扰是可以预测的。
  
  本文将进行两种分析。第一种是对出版频率的纵向分析;第二种是比较不同领域中涉及机器学习模型的出版总量。
  
  山东广播网记者昨日获悉:第一种分析通过搜索Google Scholar(收录科学出版物的标题和摘要)中的数据来确定出版物的数量。而从Google Scholar搜索数据是出了名的困难,所以我们借助ScrapeHero提供的实用建议来收集数据。
  
  分析中包括了以下13种监督方法:神经网络、深度学习、支持向量机、随机森林、树形判定分类法、线性回归、逻辑回归、泊松回归、岭回归、套索回归、k-近邻法、线性判别分析和对数线性模型。注意,套索回归考虑了套索回归术语和套索模型;k-近邻法考虑了k近邻术语。所得到的数据集显示了从1950年至今与每个监督模型有关的出版物数量 。
  
  由于监督学习有大量可用的方法,所以人们经常提出一个问题:最好的模型是什么?众所周知,这个问题很难回答,正如George Box所言,所有的模型都是不好的,但也都有一些可取之处。而判断模型有用与否则取决于手头上的数据。因此,这个问题没有统一答案。相比而言,下面这个问题要容易回答一些:最流行的模型是什么?这是本文的关注点所在。山东广播网记者昨日获悉