
会员
Spark MLlib机器学习实践(第2版)
更新时间:2020-11-28 22:29:23 最新章节:作者简介
书籍简介
Spark作为新兴的、应用范围最为广泛的大数据处理开源框架引起了广泛的关注,它吸引了大量程序设计和开发人员进行相关内容的学习与开发,其中MLlib是Spark框架使用的核心。本书是一本细致介绍SparkMLlib程序设计的图书,入门简单,示例丰富。本书分为13章,从Spark基础安装和配置开始,依次介绍MLlib程序设计基础、MLlib的数据对象构建、MLlib中RDD使用介绍,各种分类、聚类、回归等数据处理方法,最后还通过一个完整的实例,回顾了前面的学习内容,并通过代码实现了一个完整的分析过程。本书理论内容由浅而深,采取实例和理论相结合的方式,讲解细致直观,适合SparkMLlib初学者、大数据分析和挖掘人员,也适合高校和培训学习相关专业的师生教学参考。
品牌:清华大学
上架时间:2017-03-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
王晓华
同类热门书
最新上架
- 会员人本智造(以人为本的智能制造)体现了工业特别是制造业未来发展的重要趋势,是未来工业(工业5.0)的核心使能技术,是新一代智能制造的重要技术方向。本书深入阐述面向工业5.0的人本智造最新研究成果,包括人的数字孪生、人机协同作业、人机团队合作等,以及相关典型案例,展现了当前国内外人本智造领域的技术进展和应用前景。本书是《人本智造:面向新工业革命的制造模式》一书的姊妹篇,可为从事机械制造业科学研究、企业工业9.6万字
同类书籍最近更新
- 会员本书的目标在于,为数据产品从业新人或准备转行做数据产品的读者提供一个本领域的通解通法,并对即将面临的问题做出预判,并找到解决方案。本书以数据产品经理角色的定位和合作关系为切入点,站在整个数据体系的视角,从工作流程的角度剖析数据需求沟通和判断的过程、指标体系搭建的过程,同时介绍了部分通用工具,并详细剖析这些工具和对应的数据体系要解决的问题之间的关系。最后补充了必要的统计学常识、数据技术常识,并对一些自动化10万字
- 会员本书详细介绍了FlashCS3在动画制作方面的应用,主要内容包括FlashCS3的基本操作、Flash动画中的帧、图层与场景的知识与操作、基本图形的绘制与编辑、在FlashCS中使用素材与元件、制作基本动画、使用ActionScript语言、使用鼠标绘制图形、制作遮罩动画和引导动画等。自动化17.2万字
- 会员欢迎来到机器人技术的精彩世界!这是一本通俗易懂的机器人技术实践参考书,内容包括制作小型移动式智能机器人所需的材料、设计思路、常用工具、装配方法以及制作工艺。本书收录了12个低成本、易实现的小型移动式智能机器人制作实例,内容丰富,讲解具体。读者可以从这几个由易到难的制作中逐渐了解机器人的工作原理和具体的实现方法,在实际制作的过程中动手动脑,边玩边学,并从中获得乐趣和知识!本书可作为学校第二课堂和学生自动化5.3万字
- 会员生成对抗网络(GAN)可以模拟任何数据分布方式,因而潜力巨大,为很多难以自动化的问题提供了解决途径。本书立足理论,着重实践,带领读者快速熟悉并上手GAN。本书首先介绍构建高效项目所涉及的概念、工具和库,然后利用不同类型的数据集,依次构建7个GAN项目,训练并优化GAN模型。这些项目涵盖了各种流行方法,包括3D-GAN、Age-cGAN、DCGAN、SRGAN、StackGAN、CycleGAN和p自动化7.2万字