大数据分析:R基础及应用在线阅读
会员

大数据分析:R基础及应用

计算机网络数据库6.6万字

更新时间:2021-03-19 19:26:40 最新章节:参考文献

立即阅读
加书架
下载
听书

书籍简介

在大数据时代,R以其强大的数据分析挖掘、可视化绘图等功能,越来越受到社会各个领域的青睐。现在,R的计算引擎、性能、程序包都得到了提升,其中R与大数据分析平台Hadoop的结合,实现了R对大数据的分析式处理分析。这些不仅大大扩展了R的应用,也扩大了R在各行业的需求。为了更好地适应新形势,掌握大数据分析处理的相关知识是很有必要的。本书从理论基础、方法、实证三方面详细地阐释了R和RHadoop的相关理论、技术以及应用,使读者了解大数据的基础概念,掌握R以及Rhadoop大数据分析技术。本书不仅适合高等院校的各相关专业的本专科生、研究生,也适合零编程基础的科研人员以及对大数据分析技术感兴趣的人士阅读。本书在内容的选择和结构的安排上进行了深入的思考,使得不论是R或RHadoop的初学者还是具备一定相关专业知识的人员都能从本书中得到一定的收获或启发。
品牌:清华大学
上架时间:2016-03-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

深圳国泰安教育技术股份有限公司
主页

最新上架

  • 会员
    高质量的数据关乎企业运营、合规、决策和业绩的关键,哈佛商业评论的一项研究发现,企业中只有3%的数据符合质量标准,绝大多数公司都在寻求切实可行的指导来提高数据质量。本书作者基于多年在数据、数据分析和人工智能方面的实践经验,阐述了4步构建高质量数据体系。他提出了高质量数据的四阶段DARS方法(定义、评估、实现、持续)和10个数据质量最佳实践案例,以此来提高业务中的数据质量水平,为业务提供数据价值,保证
    (美)普拉桑特·苏特卡尔计算机11.7万字
  • 会员
    达梦数据库是一款非常优秀的国产数据库。本书从实用角度,通过对达梦数据库的体系结构、运行机制的讲解,以及与其他数据库相似功能的对比,帮助读者掌握达梦数据库的基本操作。本书第1章讲解达梦数据库的安装部署;第2章讲述达梦数据库的体系结构,并与Oracle的体系结构进行对比;第3章讲解数据库中最重要的两部分redo和undo;第4章介绍用户管理,重点讲述用户创建和权限;第5章讲解表和索引,并对普通表和堆表
    付强编著计算机10.7万字
  • 会员
    《SQLServer从入门到精通(第5版)》从初学者角度出发,通过通俗易懂的语言、丰富多彩的实例,详细介绍了SQLServer开发所必需的各方面技术。全书分为4篇共19章,内容包括数据库基础、SQLServer数据库环境搭建、创建与管理数据库、操作数据表、SQL基础、SQL函数的使用、SQL数据查询基础、SQL数据高级查询、视图的使用、存储过程、触发器、游标的使用、索引与数据完整性、SQL中
    明日科技编著计算机14.1万字
  • 会员
    《数据分析师手记:数据分析72个核心问题精解》从底层认知、思维方法、工具技术、项目落地及展望出发,使用问答的形式对数据分析中的72个核心知识点进行讲解,构建了数据分析的知识框架,带领读者认识数据分析背后的奥妙。读者可以用本书作为学习地图,针对具体的方法、技术进行延伸学习。
    刘林 李朝成 饼干哥哥计算机16.8万字
  • 会员
    本书以Python作为开发语言,系统介绍PySpark开发环境搭建流程及基于PySpark进行大数据分析的相关知识。本书条理清晰、重点突出,理论叙述循序渐进、由浅入深。本书共7章,第1?5章包括PySpark大数据分析概述、PySpark安装配置、基于PySpark的DataFrame操作、基于PySpark的流式数据处理、基于PySpark的机器学习库,内容介绍注重理论与实践相结合,通过典型示例
    戴刚 张良均主编计算机10.4万字
  • 会员
    这是一本站在一线开发人员的视角,从SQL的本质出发,采用理论与实践相结合、案例与分析相结合、作者经验与一线需求相结合的方式,深度解读大数据SQL优化核心技术和解决方案的工具书。本书主要面向大数据初中级技术人员,期望帮大家深度理解大数据SQL优化原理,掌握SQL优化的落地实践方法,从而真正“玩转”大数据SQL优化技术,根据实际问题和需求设计出有针对性的提升SQL性能的解决方案。
    陈鹤 杨国栋计算机14万字
  • 会员
    本书以案例的形式,介绍从思维模型分析到场景实践的数据分析方法。全书围绕“数据分析”与“运营增长”两大关键要素,在系统介绍数据分析思维、数据分析方法、数据采集技能、数据清洗技能等基础知识的同时,以问题为导向,解读运营与增长的关键性业务内容,在获客、激活、留存、变现、自传播循环等各个核心运营环节展开数据分析实战。本书提供案例相关数据集与源码包,适合数据分析、产品运营、市场营销等行业有数据分析具体业务需
    黄佳计算机12万字
  • 会员
    本书是一本介绍分布式数据库基础内容与应用的大数据专业类图书,力求培养读者对分布式数据库的应用技能。本书共11章,采用原理+代码实例+综合案例的编写形式,清晰明了地介绍分布式数据库的原理、基础应用、进阶应用及主流工具的使用方法、应用场景,以理实结合为编写要求,让读者能够轻松学习和掌握分布式数据库的内容。本书可以作为高等院校计算机、网络技术等相关专业的教材,也可以作为数据库相关工作的从业人员的参考用书
    闭应洲 许桂秋 刘军主编计算机14万字
  • 会员
    本书围绕数据挖掘竞赛,讲解了各种类型数据挖掘竞赛的解题思路、方法和技巧,并辅以对应的实战案例。全书共11章。第1章介绍数据挖掘竞赛的背景、意义和现状。从第2章开始,介绍了各种不同类型的数据挖掘竞赛包括结构化数据、自然语言处理、计算机视觉(图像)、计算机视觉(视频)、强化学习。每种类型的数据挖掘竞赛包含理论篇和实战篇:理论篇介绍通用的解题流程和关键技术;实战篇选取比较有代表性的赛题,对赛题的优秀方案
    许可乐编著计算机6.7万字

同类书籍最近更新

  • 会员
    全书共分11章,在介绍信息科学基本理论形成的基础上,重点介绍了信息技术、应用及发展趋势。本书主要内容有信息技术与信息社会、计算机技术、软件技术、云计算与大数据、微电子与传感技术、通信与网络技术、物联网技术及应用、电子商务与电子政务、人工智能技术、自动化与智能控制、智能家居与智能汽车。本书内容丰富、由点到面、循序渐进,通过对信息技术的源流与演变、理论建立与转变进行较为全面的介绍,助读者拓展综合素
    黄正洪 赵志华主编数据库23.1万字
  • 会员
    本书基于Spark2.4.X版本,以Spark商业案例实战和Spark在生产环境下几乎所有类型的性能调优为核心,以Spark内核解密为基石,对企业生产环境下的Spark商业案例与性能调优抽丝剥茧地进行剖析。全书共分4篇,内核解密篇基于Spark源码,从一个实战案例入手,循序渐进地全面解析Spark2.4.X版本的新特性及Spark内核源码;商业案例篇选取Spark开发中最具代表性的经典学习案例,在
    王家林 段智华编著数据库38.1万字
  • 会员
    本书将以智能数据分析为主线,分三个部分进行介绍:第一部分将通过对数据分析发展历程及趋势的介绍,让读者通过浅显易懂的方式快速了解数据智能分析及其发展趋势;第二部分将详细讲述笔者通过经验总结的数据智能分析的思路、方法与技巧,帮读者在脑中建立起清晰的智能分析思路及分析体系;第三部分将通过各行业案例的介绍,侧重说明企业数据智能分析的价值体现。
    陈雪莹数据库12.4万字
  • 会员
    本书是面对当前大数据应用、可视分析研究和应用的新形势,专门为数据科学与大数据技术、智能科学与技术、计算机、数据处理等专业本科生开设数据可视化课程而编写的一本教材。该书将教学之严谨和科研之创新有机地结合,全面诠释了大数据可视化的内涵与外延,详细介绍了大数据可视化概述、可视化的类型与模型、数据可视化基础、数据可视化的常用方法、大数据可视化的关键技术、可视化交互、大数据可视化工具、大数据可视化系统——魔
    何光威数据库16.7万字
  • 会员
    近些年,互联网促进经济迅速发展,越来越多的企业把互联网当作产品营销的重要渠道。网络营销依托着计算机设备和网络资源,凭借其优势成为这个时代高效的宣传推广方式。
    车云月数据库6.2万字
  • 会员
    这是一本将数据科学三要素——商业理解、量化模型、数据技术全面打通的实战性著作,是来自腾讯、滴滴、快手等一线互联网企业的数据科学家、数据分析师和算法工程师的经验总结,得到了SQLFlow创始人以及腾讯、网易、快手、贝壳找房、谷歌等企业的专家一致好评和推荐。全书三个部分,内容相对独立,既能帮助初学者建立知识体系,又能帮助从业者解决商业中的实际问题,还能帮助有经验的专家快速掌握数据科学的Z新技术和发展动
    谢梁 缪莹莹 高梓尧 王子玲等数据库13万字