首页 > 搜索 > 缺陷分类算法,机器学习的多分类问题可用的模型都有哪些?各优缺点是什么?能用聚类算法代替吗?

缺陷分类算法,机器学习的多分类问题可用的模型都有哪些?各优缺点是什么?能用聚类算法代替吗?

互联网 2020-10-24 23:27:04
在线算命,八字测算命理

个人感觉这个问题提问“机器学习”的范畴有点太大了。从上个世纪70年代到现在的很多模型都可以叫做机器学习的模型,不过大部分都被实践淘汰了。通用(general)的分类模型一直是机器学习研究的一个活跃的领域,并且有统计和传统机器学习两拨人用两类不同的方法论在搞(有人叫做统计学习和机器学习两个派)。先说统计的吧,统计里有一些生成模型(generative model)的话早期有代表性的就是朴素贝叶斯(Naive Bayes),高斯生成贝叶斯模型,LDA和QDA等,不过这些模型道理上好看但是效果上早被淘汰了;然后判别模型(discriminative model)的话主要就是logistic regression model;然后传统机器学习的话就有一些分类树(classification tree)和支持向量机(SVM=support vector machine),还有一些早点的可加样条模型;上面的模型基本上可以看作是标配,但是标配的模型面对具体问题效果肯定是不行的,面对具体问题往往还需要一些降维升维和集成增强的trick,有名的trick有pca,ofo,fda等降维trick,svm专配的用来升维的kernel trick,和树模型配套的增强trick例如bagging,random forest和boosting等。上面的通用模型的裸模型肯定是不行的,就好比玩腾讯的游戏不充钱,不买皮肤一样,那必定是打不过人名币玩家的,所以裸模型必须配上相应的trick才能有明显的准确率提升,就像志华老师说过的,“裸的svm是没用的,必须配上kernel trick才能发挥出svm的最强功力”。

上面说的都是老的通用模型,事实上基本都被淘汰了,因为现在的神经网络(deep learning model)太强了。现在大家做分类模型肯定是上网络的,网络模型的结构简单明了,而且发挥空间大。当然了,裸的神经网络例如全连接网络肯定也是不行的。面对具体的问题肯定要配上具体的结构和trick,不同的分类问题中好用的结构和trick完全不同,所以面对具体的问题场景,题主需要自己去看相关领域的文章总结现在popular的模型和trick,在这里我可以抛砖引玉一下。例如计算机视觉(computer vision)中的分类模型好的结构基本就resnet50就能秒掉绝大多数问题,trick就有一些weight decay,bn(batch normalize),还有一些图像增强(augmentation )的方法,dropout和early stopping以前喜欢用,但是现在工业界也没人用了。而在自然语言(nlp)中的情感识别问题中,则用popular的rnn结构,然后也有一些不同的trick。

In a nutshell,如果题主想做某个具体的分类任务,简直一定去看相关领域的文章和模型,因为通用模型(general model)的效果一定比不上特定(specific model)模型,而且不同问题的神经网络模型结构也完全不同。当然了,肯定总归可以叫“Deep learning model”

免责声明:非本网注明原创的信息,皆为程序自动获取互联网,目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责;如此页面有侵犯到您的权益,请给站长发送邮件,并提供相关证明(版权证明、身份证正反面、侵权链接),站长将在收到邮件12小时内删除。

相关阅读

一周热门

查看更多