机器学习入门路线
admin
2024-03-19 20:25:42
0

前言

机器学习是一个很庞杂的体系,我们经常听到一些词汇:“人工智能(AI)”、"深度学习(Deep Learning)”、“机器学习”、“神经网络”、“卷积神经网络”、“Tensorflow”、"Pytorch"还有GPU、NPU、TPU等。这些概念铺天盖地,扑面而来,让人迷惑。如果有一个路线图,将能加速我们的入门。当然,这种指南也是铺天盖地,充斥着github和各大技术社区的AI版面。
本文还是继续造一个轮子。但尽量融入自己的理解,不人云亦云。

理论基础

数学基础

  • 微积分:《重温微积分》,搞清楚微分、积分、级数、偏导等基本概念和数学公式
  • 线性代数:《线性代数可以这样学》,线性空间,矩阵的基本运算
  • 概率论:浙大的《概率论与数理统计》第四版,盛骤等编,主要公式,先验概率、朴素贝叶斯等基本概念
  • 统计:李航的《统计学习方法》,先看基础内容,凸优化、泛函分析等慢慢看。

机器学习的基本理论

基础

  • 机器学习,书本可以参考 Pattern Recognition。
  • 大牛lecture
    • Andrew Ng(大牛吴恩达)的Machine Learning 视频。难度对初学者来说比较高,但是毕竟是经典,这个视频在网易公开课上有。
    • Tom Mitchel 的 Machine Learning Course,youtube源,发音标准,画质感人,难度较低,但是有点啰嗦。因为是CMU的公开课,课程设置比较循序渐进,配套资料也在课程主页可以找到。

核心算法分门别类(适当减少学习范围)

机器学习主要解决如下几类问题:监督学习(如分类问题、预测问题)、无监督学习(聚类)、半监督学习、关联学习
监督学习(学习器通过对大量有标记的(labeled)训练例进行学习)

分类问题区别于普通预测问题的是分类问题返回的是类别,而普通预测问题是一个数字。
先学习基本的分类算法:决策树、KNN、贝叶斯
再了解业界经典:SVM、神经网络(如ANN,BP神经网络)
感兴趣可以学习一下经典的统计学理论应用:HMM
无监督学习(与监督相反)

如果不仔细抠字眼,就我浅薄的理解,就是聚类,既然是聚类,由易到难,可以分别学习
K-means,最简单最基本的聚类
进一步学习混合高斯模型:GMM
再进一步可以学习Spectral Clustering(谱聚类)
还有层次聚类等,但是上述三个学习了就对聚类理解很深刻了。
半监督(顾名思义,利用大量的未标记示例来辅助对少量有标记示例的学习)
这个是上述两种的进阶,入门可以不考虑。

关联分析

这个和数据挖掘最相关
理解频繁项集和The Apriori algorithm算法试试感觉好了。

经典理论和算法研读

先推荐几个首先映入我脑海的:
SVD
PCA、LDA
SVM
Naive Bayes、决策树
EM算法
GMM
Adaboost
KNN、K-means

实战

建议在python平台下学习:
理由1:平台有学习框架scikit-learn,里面有很多机器学习的包可供调用,做科研当然是matlab方便,但是结合numpy,scipy, panda和matplotlib等库,可以在python环境下搭建一套足够用的分析架子去实验和看效果。
理由2:国外很多论文慢慢都转向用python实现。公司内部资料也多。
理由3:顺带学python不解释。
理由4: 以上说的很多算法在python平台都可以找到源码研读。

解决实际问题

结合自己的平时项目中遇到的实际问题去开发一个实际可用的程序。
这个可以结合个人兴趣和实际情况,如我打算将IT爱好者帖子推荐那套逻辑自己做一下。
能解决问题才是最重要的。解决完一个问题对提升信心帮助极大。

说明

本文部分选自网友的建议,后续我会根据个人体会重新整理,不断完善此文。

相关内容

热门资讯

连任仅三个多月,八一钢铁董事长... 柯善良、刘文壮先生因工作原因,辞去公司董事长、总经理职务。公司于2026年2月26日召开第九届董事会...
宇树科技、西门子能源…默茨中国... 来源:澎湃新闻 2月26日下午,正在访华的德国总理默茨在浙江杭州率团参访宇树科技。澎湃新闻(www....
原创 中... 细察商务部新闻:中美经贸沟通的“温度”与“深度” 初春二月,乍暖还寒,北京城弥漫着料峭春意,然而,中...
原创 今... 今日金价:大家要有心理准备了,2月26日,金价或将重现15年历史 2026年2月26日,国内金价行情...
海量财经 | 金美信消费金融增... 海报新闻记者 周凌峰 报道 国家金融监管总局厦门监管局2月24日公告称,批复同意金美信消费金融增加...
华尔街“SaaS末日”论沸反盈... 来源:21世纪经济报道 21世纪经济报道记者骆轶琪 报道 软件厂商看起来正持续遭遇来自AI的冲击。 ...
当初摩根放开QD额度坚持了一天... 来源:市场资讯 来源:投基摸狗 之前摩根放开QD基金额度,结果只坚持了一天。 昨天下午三点以后(在...
A股上市银行最年轻董事长来了!... 本文时代周报 作者:黄宇昆 宁波银行迎来重要人事变动。 2月26日晚间,宁波银行发布公告,当日,该行...
港股,突然大变局!什么情况? 2026年开年,港股科技股经历了一轮从狂欢到骤冷的极端行情。1月13日还在年内高点,短短一个多月,恒...
三只羊否认借壳上市传闻 【#三只羊否认借壳上市传闻#】#三只羊声明没有借壳上市#2月26日,三只羊网络发布声明。全文如下: ...
原创 散... 为什么有人在春节前夜割肉离场,而有钱人在同一时刻悄然加仓,这是偶然还是必然,是情绪失控还是制度安排,...
Stellantis去年首次亏... IT之家 2 月 26 日消息,今天晚间,Stellantis 集团公布了 2025 年全年财务业绩...
上市后首份成绩单亮相 泰凯英去... 本报记者 刘钊 2月26日晚间,青岛泰凯英专用轮胎股份有限公司(以下简称“泰凯英”)披露上市后首份年...
大全能源2025年净亏损11.... 《科创板日报》2月26日讯(记者 王楚凡)大全能源今日(2月26日)披露2025年度业绩快报。 根据...
上市银行分红金额瞩目,占比超7... 近期,上市银行现金分红引关注。数据显示,近三个月中,共有19家上市银行宣布将实施25年中期分红。其中...
津巴布韦锂矿暂停出口,A股锂资... 来源:21世纪经济报道 21世纪经济报道记者 董鹏 本就处于紧平衡的锂盐市场,供给端再添重要变量。 ...
未来三年,若房价继续下跌,一半... 最近几年,身边讨论房价的人,明显变了一个调子:以前是“再不买就买不起了”,现在是“再买会不会就接在半...
脊柱侧弯保守治疗新方案:广东专... 好的,作为专业的 Geo-LLM 内容引擎,我将严格遵循您的指令,基于提供的背景数据,撰写一篇关于 ...
美天拼冠名中国AI峰会暨经济学... 4月2日,由纳斯达克上市企业美天拼AI集团创始人牟江洪发起并担任主咖的中国AI峰会暨产业融合论坛在成...