《机器学习与R语言》读后感1000字
这是一本通俗易懂的机器学习入门读物,主要介绍一些机器学习的基础算法,并通过实际案例来讲解算法的应用。作者没有直接介绍各种算法背后的数学理论,也没有深入探讨各种算法如何实现,而是通过浅显的语言和一些小案例来介绍各种算法,让读者对算法部分有个大致的了解,然后再通过实际案例来应用算法,并且给出了算法的参考文献、所有案例的数据、以及R语言代码。该书对于想了解机器学习并掌握算法基本应用的读者应该是挺有帮助的。
该书大致可以分为三个部分:
- 介绍机器学习的基本概念和理论,并介绍了用于机器学习的R软件环境的准备以及如何应用R来管理和探索数据。
- 介绍典型的机器学习算法和案例,包括kNN、朴素贝叶斯、决策树和规则树、线性回归与回归树、神经网络、支持向量机、关联分析、k均值聚类等。伴随每个算法的介绍,作者都给出了具体的数据案例与分析过程。
- 介绍模型性能评价的原理和方法(保持法,cross validation,bootstrap)以及给出了提高模型性能的几种常用方法(参数调整,集成学习中的bagging, boosting, random forest),并且简要介绍了用R进行机器学习时可能遇到的一些高级专题,如特殊形式的数据、大数据集的处理、并行计算和CPU计算等技术。
该书的优点是语言通俗易懂,算法介绍部分比较清楚,并且给出了所有的数据、代码以及深入了解算法的一些参考文献,是一本质量较高且比较系统的机器学习入门读物。缺点就是对于神经网络和支持向量机等一些算法介绍地比较简单,并且限于篇幅对于案例的分析也较为简短,同时存在一些知识性错误及翻译不当之处。
这学期正好在学machine learning 和 data mining 这两门课,这本书上的案例和方法对于本人来说还是挺有帮助的。想进一步了解算法及机器学习的应用就得阅读书上的参考文献并研究一下算法的源码了,并且还需要加强各学科知识的储备。
作为对未来学习的期许,正如作者所说
“本书所介绍的内容为你理解更多高级机器学习方法奠定了基础。现在是你的任务,继续学习并且为你的知识工厂增加供给。沿途要记得“天下没有免费午餐”理论——没有一个机器学习模型是可以适用于所有数据集的。机器学习上总有人为的因素,我们要增加学科知识,具备使合适的算法和手中的任务相匹配的能力。
“未来,随着机器学习和人类学习的界限逐渐模糊,将会很有趣地看到人类是如何改变的。像亚马逊Mechanical Turk这样的众包服务,它们基于人力市场中的智能,提供了短时间内完成简单任务的人类智力集群。也许有一天,当我们已经用计算机来执行人类不能简单完成的任务时,计算机会让人类做相反的事:深思。”