现如今,计算机科学、人工智能、数据科学已成为技术发展的主要推动力。
无论是要翻阅这些领域的文章,还是要参与相关任务,你马上就会遇到一些拦路虎:
想过滤垃圾邮件,不具备概率论中的贝叶斯思维恐怕不行;想试着进行一段语音识别,则必须要理解随机过程中的隐马尔科夫模型;想通过观察到的样本推断出某类对象的总体特征,估计理论和大数定理的思想必须建立;在统计推断过程中,要理解广泛采用的近似采样方法,蒙特卡洛方法以及马尔科夫过程的稳态也得好好琢磨;想从文本中提取出我们想要的名称实体,概率图模型也得好好了解。在看到这些专业术语后,很多人就开始打退堂鼓,然后马上选择放弃。
为什么会这样?
因为机器学习所需数学知识有极高的学习曲线。
那么需要多少数学知识呢?宾夕法尼亚大学的计算机教授所写的《计算机科学相关代数学、拓扑学、微分学以及最优化理论》,就用页的篇幅讲解了相关的数学知识。
不要着急,不要害怕,继续往下看……
划重点
01
为什么我要向你推荐它?
我作为一个机器学习、自然语言处理方面的研究者和实践者,参与了大量涉及知识图谱、语义理解、智能问答等技术的工程和科研项目。我认为,有更简单、高效的方法可以让你掌握机器学习中所需的数学知识。
首先,集中力量、紧紧围绕机器学习核心算法中所涉及到的知识进行学习,做好精确打击。然后,注重加强基础知识与算法、应用案例之间的联系,将理论和算法应用场景相互关联,形成学以致用的实践导向。同时,运用好Python工具,做到和工程应用无缝对接,利用Numpy、Scipy、Matplotlib、Pandas等工具强化对知识的理解、提升工作效率。在上述理念的基础上,我花费数月时间撰写了《机器学习中的数学》系列专栏。
在这段时间里,我不仅严密地梳理知识体系的内在逻辑,还在讲解技巧上投入了很大功夫,最终做到可以深入浅出地向你展现完整的知识体系。
在近期,我将在GitChat先后推出《机器学习中的数学:概率统计》、《机器学习中的数学:线性代数》和《机器学习中的数学:微积分与最优化》三个专栏。这三部分数学知识的作用分别是:
概率统计是利用数据发现规律、推测未知的思想方法线性代数是利用空间投射和表征数据的基本工具微积分与最优化是机器学习模型中最终解决方案的落地手段机器学习应用中的思想方法与核心算法大多都是构筑在统计思维方法之上的,所以我们推出的第一个专栏《机器学习中的数学:概率统计》,正是与机器学习紧密相关的概率统计核心内容。
专栏特色
详解6大核心板块:概率思想、随机变量、统计推断、随机过程、采样理论、概率模型,筑牢机器学习核心基础。教你熟练使用Python工具库:依托numpy、scipy、matplotlib、pandas工具,无缝对接工程实践。有理论还有实战:大量实战案例与完整详细源码,反复加深概率统计思想的深刻理解。专栏大纲及内容特色
第1部分:概率思想。我们首先从条件概率和贝叶斯方法入手,阐明条件、独立、相关等基本概念,掌握联合、边缘的计算方法,我们将一起构建起认知世界的概率思维体系。
第2部分:随机变量。我们将重点介绍随机变量主干内容,从单一随机变量的分布过渡到多元随机变量的分析,最后重点阐述大数定理和中心极限定理,并初步接触蒙特卡洛方法,和读者一起建立重要的极限思维。
第3部分:统计推断。这部分我们
转载请注明:http://www.0431gb208.com/sjsbszl/7087.html