南京大学人工智能学院院长周志华曾经说过:机器学习是实现人工智能的主要方式。在其著作《机器学习》这一西瓜书中已经体现的十分明显,所以掌握机器学习是创造人工智能的入门必备技能。
智能化的时代,机器学习和深度学习将会成为计算机行业的主流技术,这已经被当前的行业工资排行榜证明,在我国十分稀有的机器学习和深度学习专家被各大巨头反复争抢,某些机器学习工程师的工资一度达到年薪80万。下图是最新的各大企业对AI人才开出的工资。
机器学习目前的主要应用有以下几个方面:
推荐系统,根据用户的习惯和喜好,将海量数据中符合用户需求的信息提供给用户,并对所提供的信息进行排序,进而进行用户画像、用户分析等,真正的在数据里理解用户,对进一步的商业行为进行指导。广告系统,和推荐系统十分相像,但是也有很大的不同之处,广告系统需要在考虑平台和用户之间的交流之外,还要同时考虑广告投资者的利益,这就使得问题变得更加复杂了,很多时候做出的决策不是最优的,而是经过一定的权衡。搜索系统,搜索系统是网站和APP的流量进入端,更高效的搜索可以优化用户体验,传统的关键字比对搜索无法理解句意,搜索结果往往也不尽如人意,机器学习是推动搜索引擎优化的重要动力。风控系统,大数据和机器学习技术在金融领域具有重要地位,对于市场反应的时效性对风控和预警系统提出了更高的要求,大量数据的积累使得机器学习有了巨大的发挥空间,并且取得了重要的进展。网络安全,传统的病*识别依赖于代码段和病*库的匹配,但是当前不断发展的病*往往会进行大量伪装,以欺骗识别系统,机器学习不仅可以代码段的匹配,也可以在跟高维度对其他的病*特征进行学习,大大提高了病*识别的准确率和速度。计算机视觉,依赖于机器学习下的深度学习技术,计算机视觉领域取得了几十年来重要的进展。语音识别和自然语言分析(NLP),同样是深度学习技术,使得这些技术取得了突破,由于这些领域的特征是无法描述的,所以深度学习自动提取特征的优点获得了施展的空间。
其实,机器学习的应用领域远远不止上述领域,只要是有大量数据存在重复性工作,都可以应用机器学习完成。机器学习本质上严重依赖统计学,所以需要大量数据,才能在统计中发现一些不那么显而易见的信息,借助于这一能力,机器学习可以完成许多重复性工作。
根据周志华教授在《机器学习》中的描述,我将简明扼要的为大家介绍三种机器学习必须掌握的技能。
第一点,编程和算法基础
当前,主流人工智能领域主流的的编程语言是python,充分掌握这一语言对于在人工智能领域的发展举足轻重,python下有许多的库,对于庞杂的计算,这些库可以取得很好的效果,python的地位很大程度上也是靠这些库堆积起来的,例如,凡是学习机器学习都要使用的sklearn库,还有一些线性代数库,这些库大大简化了我们的操作,可能只用两行代码就可以实现一个贝叶斯算法。
因此,学习python不仅要学习其基础语法,更要掌握python库的用法。这里应当首先掌握sklearn。
第二点,线性代数、微积分、统计学基础
不仅是机器学习,凡是涉及算法的领域基本都需要大量数学的应用,所以,对数学的掌握程度也决定了你在计算机这一方向上能走多远,在机器学习中,这一点体现的尤为明显,因为,机器学习是一系列算法的统称,由于机器学习也是从统计学科衍生出来的,所以需要应用很多的统计学公式,因此,学好机器学习,有必要掌握统计学基础。
在大量数据的处理过程中会出现大量的参数,线性代数中矩阵的使用大量简化了计算的复杂程度,所以需要掌握矩阵的基本运算,参数的基础知识。
微积分更不用说了,这是整个近现代数学的基础,每篇论文的论证部分都要使用到,所以这也是必须掌握的。
当你掌握了以上的数学基础后,就可以在算法的草原上如履平地。
第三点,机器学习的经典算法及其原理
机器学习算法主要分为以下三大类:
监督学习,训练数据中有明确的最终分类或是判断结果,例如垃圾邮件检测系统中“垃圾邮件“和“非垃圾邮件”,对手写数字识别中的分类任务“1“,”2“,”3“,”4“等。在建立预测模型的时候,监督式学习建立一个学习过程,将模型的预测结果与给定的实际结果进行比较,不断的调整参数,直到该组参数的测试结果达到比较满意的结果。监督学习是机器学习的主流训练方法,监督式学习的常见应用场景如分类问题和回归问题。常见算法有逻辑回归(LogisticRegression)和反向传递神经网络(BackPropagationNeuralNetwork)无监督学习,无监督学习与监督学习最本质的区别是,无监督学习并不会出现明确的分类结果的标识或是结果,而是网络根据自己的学习进行聚类分析或是回归分析,这一技术由于缺乏标签,训练起来有一定的难度。作为对监督学习的一个补充,无监督学习也必将取得重大成果。强化学习,强化学习最经典的应用是ALphaGo,强化学习的本质就是自己与自己对抗,进而不断进步。对以上学习算法有必要进行深入了解,在我的后续文章中将陆续进行深入介绍。
课后任务,用一句话简要概括机器学习是什么。期待神评论。