人工智能是这两年风头正劲的领域,也是未来具有颠覆性可能的新领域。不少人尝试去学习机器学习相关的知识。然而,一旦越过最初的overview阶段,很多人就开始打退堂鼓了,然后迅速放弃。
为什么会这样?
极高的学习曲线
首当其冲就是数学,涉及统计学、微积分、概率、线性代数等,大家虽然都学过高等数学,但如果你还记得里面的细节,算你牛B。更可能的情况是,多数人都对高等数学忘记了,面对各种算法里的大量公式,感到厌恶,甚至恐惧。
其次因为机器学习本身是一个综合性学科,而且是一个快速发展的学科,知识点散乱,缺乏系统性。
市面上的机器学习/深度学习书籍、文章、教程,遍地开花,但能以清晰的方式表达、循序渐进地讲解的教程,其实不多,大量的教程没有考虑到学习者的基础,使得初学者感到挫败和困惑。
图解机器学习
正是对机器学习的过程中的痛苦有切身体会,我希望能做一份教程,以浅显易懂的方式去讲解它,降低大家的学习门槛。我为此花费了数月时间,经常做到深夜,把自己的学习笔记整理成了这份教程。全部教程包含两部份:
Part1介绍了基本概念,包括机器学习的流程、数据处理、建模、评估指标(如MSE、ROC曲线)、模型部署、过度拟合、正则化等。
Part2是常用的算法,包括线性回归、逻辑回归、神经网络、SVM、Knn、K-Means、决策树、随机森林、AdaBoost、朴素贝叶斯、梯度下降、主成分分析等
整个教程包含大量图片,辅助以文字。一图胜千言,能用图的地方,我尽量不用文字。我希望用diagram等方式来图解复杂的概念,降低学习曲线,整个教程虽然超过页,但因为有图,所以比看一般的文字教程要轻松很多。如果学一般的教程,可能需要3个月到半年的话,我希望这份教程能加速你的学习过程。
通俗易懂
写一份好教程,其实是很难的事情。如何把复杂的东西,写的既简单易懂,又不失去应有的深度,这本身就是一个极大的挑战。很多大牛,在技术上是毋容置疑的,但他们写的和表述的东西,未必就是很浅显易懂。像周志华著名的《西瓜书》、GeoffreyHinton教授的视频,其实都不适合初学者,而AndrewNg的视频教程就是一股清流,浅显易懂。本教程里一些内容也来自吴恩达的“机器学习”和“深度学习”教程(网易云课堂上可以找到)
机器学习教程里基本都充满数学公式,甚至是大段大段的公式推导,这怎么可能易懂?这是导致机器学习学习曲线异常高的最核心原因。本来一开始我想尽量回避数学公式的,但后来发现不用数学公式的话,很多概念不能充分和清晰的表达。但大家看不懂数学公式,咋办?
我因此基本上尽力注解了每一个数学公式,即便已经忘光了,只要初高中程度以上也能看懂。我都大学毕业几十年了,我也忘记了好伐,但后来我发现从了解算法的角度看,需要的数学并没有想象的那么多。
因为图解了公式,所以里面的数学并非想象那么难,只要从头开始看,就可以理解。而且,我还引用了吴恩达的几个短小的视频,只要看过那几个视频,再看各个算法的公式,就轻松很多。
目前教程是全英文的,取决于是否真正有人感兴趣,如果感兴趣的人多,未来有可能会做一份中文版的。注:里面还引用了部分Youtube视频,所以想看的话,需要翻墙。
教程文档下载地址(百度云)
转载请注明:http://www.0431gb208.com/sjszlff/684.html