林子雨主讲《大数据处理技术park》班级主页

全力打造全国高校大数据教学示范班级

厦门大学研究生课程

《大数据处理技术Spark》2018班级主页

全面系统讲解Spark技术及其编程方法

(扫一扫手机访问本主页)

(图  授课现场)

(图 期末考试现场)

课程简介

课程名称:《大数据处理技术》

课程性质:校级研究生选修课

课程难度:入门级,零基础(课程采用林子雨编著的入门级精品教材,丰富的教材配套资源帮助学生实现“零基础”学习大数据)

授课教师:林子雨

开课学期:2018年春季学期(2月到6月)

课程学时:每周2节,共16周,32学时,2学分

上课教室:海韵教学楼201教室

教师简介

示范班级

林子雨主讲厦门大学研究生课程《大数据处理技术》是“高校大数据课程公共服务平台”重点打造的示范班级,全程严格执行“林子雨精品大数据公开课六大质量标准”,旨在努力打造高校大数据教学实践标杆。

示范班级全程践行O2O教学理念,提供线上线下完整教学服务,学生在获得良好现场教学体验的同时,可以通过班级网站获得全方位课程指导和服务。示范班级标准元素包括:班级主页、标准教室、精心备课、精彩讲解、优雅形象、标准音质、完整服务等。

公告板

教学大纲

厦门大学研究生课程教学大纲

(2)积极践行O2O教学理念,努力提升教学水平,在大数据课程教学方面积极开拓创新,实现线下教学和线上服务的巧妙结合。课程主讲教师建设了国内高校首个大数据课程公共服务平台,提供讲义PPT、课程习题、学习指南、授课视频、技术资料等全方位、一站式免费服务,帮助学生更好学习大数据课程。

林子雨,赖永炫,陶继平.Spark编程基础,人民邮电出版社.

1 第1章 大数据技术概述

大数据的基本概念、关键技术和代表性软件 2

2 第2章 Scala语言基础

Scala语言概述

Scala基础 2

3 第2章 Scala语言基础

面向对象编程基础 2

4 第2章 Scala语言基础

函数式编程基础 2

5 第3章 Spark的设计与运行原理

Spark简介、运行架构、RDD的设计与运行原理、部署模式 2

6 第4章Spark环境搭建和使用方法

Spark的基本安装方法,如何在spark-shell中运行代码以及如何开发Spark独立应用程序

7 第4章Spark环境搭建和使用方法

Spark集群环境搭建,在集群上运行Spark应用程序 2

8 第5章 RDD编程

RDD编程基础、键值对RDD、 数据读写、WordCount程序解析 2

9 第5章 RDD编程

RDD编程综合案例 2

10 第6章 Spark SQL

Spark SQL简介、DataFrame、读写Parquet 2

11 第6章 Spark SQL

通过JDBC连接数据库、连接Hive读写数据 2

12 第7章 Spark Streaming

流计算概述、Spark Streaming、DStream操作概述、输入源 2

13 第7章 Spark Streaming

转换操作、输出操作 2

14 第8章 Spark Mllib

Spark MLlib简介、机器学习工作流、特征抽取、转化和选择、分类与回归 2

15 第8章 Spark Mllib

聚类算法、推荐算法、机器学习参数调优 2

16 Spark编程综合案例 2

期末考试

合计 32

教学进度表

2.1 Scala语言概述

2.2 Scala基础

5.1 RDD编程基础5.2 键值对RDD5.3 数据读写

5.4 综合案例

6.1 Spark SQL简介6.2 DataFrame概述6.3 DataFrame的创建6.4 DataFrame的保存6.5 DataFrame的常用操作6.6 从RDD转换得到DataFrame6.7 使用Spark SQL读写数据库

7.1 流计算概述7.2 Spark Streaming7.3 DStream操作概述7.4 基本输入源

7.5 高级数据源7.6 转换操作7.7 输出操作7.8 Structured Streaming

8.4 分类与回归

期末复习说明

授课视频

讲义PPT下载

课后作业

课程教材

拓展学习

林子雨编著《大数据技术原理与应用(第2版)》(人民邮电出版社2017年2月正式出版发行第2版,京东、当当各大网店热销书籍),侧重于介绍大数据技术的实现原理,编程实践内容较少,该教材定位为入门级大数据教材,以“构建知识体系、阐明基本原理、开展初级实践、了解相关应用”为原则,旨在为读者搭建起通向大数据知识空间的桥梁和纽带,为读者在大数据领域深耕细作奠定基础、指明方向。教材系统论述了大数据的基本概念、大数据处理架构Hadoop、分布式文件系统HDFS、分布式数据库HBase、NoSQL数据库、云数据库、分布式并行编程模型MapReduce、大数据处理架构Spark、流计算、图计算、数据可视化以及大数据在互联网、生物医学和物流等各个领域的应用。

详细学习如何安装运行各种大数据软件以及如何进行初级编程实践,包括Hadoop、HDFS、HBase、MapReduce、Spark、MongoDB等安装、操作、编程指南。帮助学生“零基础、零障碍”学习大数据技术。

采用2000万条用户购物数据集,案例涉及数据预处理、存储、查询和可视化分析等数据处理全流程所涉及的各种典型操作,涵盖Linux、MySQL、Hadoop、HBase、Hive、Sqoop、R、Eclipse等系统和软件的安装和使用方法。案例适合高校大数据教学,可以作为学生学习大数据课程后的综合实践案例。

THE END
0.易语言汉语编程——产品介绍本程序由大连大有吴涛易语言软件开发有限公司开发。程序使用易语言编程,用易语言实现了一种新的解释型的中文编程语言工具,“易乐谷”源程序可自动转换为流程图,流程图可自动转为“易乐谷”源程序 详细介绍|最新下载jvzquC41yy}/f‚|v0eun0ls1rti/j}r
1.C语言中文网:C语言程序设计门户网站(入门教程、编程软件)C语言中文网是中国领先的C语言程序设计专业网站,提供C语言入门经典教程、C语言编译器、C语言函数手册,C语言编程技巧,C语言考试试题等,是学习、自学C语言程序设计的好帮手。jvzquC41e0hjcwhjgpm/pny1
2.易语言汉语编程——功能展示数据库是保存、管理数据的最核心部件,易语言除了支持现今所有大型数据库,还具有从最底层自行开发的,具有完全自主知识产权和核心技术的数据库系统,现在该数据库性能已经能与曾经在中国大地上风靡一时的Fox系列数据库相媲美,并且还在继续不断的完善中,为我国发展属于自己的强大安全实用型数据库奠定基础。 jvzquC41f{}u0lto0et0ixsipgth1|om{{4ivv
3.易语言中文编程:从入门到精通(第2版)中文pdf扫描版[254MB]电子书本书介绍了全中文、全可视、全编译、跨平台的编程语言——“易语言”。该程序实现了真正的中文编程,彻底摆脱英文的语言模式,符合中国人的习惯。“易语言”功能强大,资源丰富,是广大编程爱好者的最理想的选择。书中全面、详细介绍了易语言的使用方法,内容详实、通俗易懂、结构清晰、循序渐进、图文并茂,配有大量示例。jvzquC41yy}/lk:30pku1ktqmu577@6220nuou
4.Dart编程语言中文网|DartDart 是面向对象的编程语言,语法风格对于许多现有的开发人员来说都很熟悉。 如果您已经了解 C++,C# 或 Java ,那么使用 Dart 也就是分分钟的事情。 响应式 Dart 可以便捷的进行响应式编程。由于快速对象分配和垃圾收集器的实现, 对于管理短期对象(比如 UI 小部件), Dart 更加高效。 Dart 可以通过Future和Stream的jvzquC41yy}/fjwvep4dqv4
5.乐易论坛易语言火山PC视窗中文编程交流论坛乐易网易语言中文编程专区 易语言问答区(781) 主题: 573,帖数: 2612 最后发表: 2025-5-13 09:45 乐易产品中心(496) 主题: 185,帖数:1万 最后发表:半小时前 原创软件发布 主题: 89,帖数: 2522 最后发表: 2025-10-16 16:32 易语言教程(435) jvzq<84wr0rf{kh0eqs0
6.2023年10月编程语言排行榜:C#逼近Java编程是计算机专业的核心技术,是计算机专业学生追求的终极目标。要学好计算机,首先得从学习编程语言开始。而好的编程语言入门书籍,则是良师是益友,能引领你从第一步开始,步步深入,以至精通。下面所介绍的书籍是专门为读者精选出的编程语言入门类好书。 C Primer Plus 第6版 中文版 jvzquC41yy}/fxzdcp4dqv4pqvk0:>:299<988
7.仓颉编程语言官网仓颉编程语言是一款面向全场景智能的新一代编程语言,主打原生智能化、天生全场景、高性能、强安全。主要应用于鸿蒙原生应用及服务应用等场景中,为开发者提供良好的编程体验。jvzquC41ecthlrj/ncth0ls1
8.Python语言学习指南中文网非官网Python语言学习指南中文网 下载 Python是一种编程语言,本站提供学习python的方法与资源。 开始学习 想要开始学习Python这种编程语言吗?,何时何地都可以轻松开始. 从初学者指南开始 下载 点击下载各版本的Python源代码与安装程序! 最新:下载Python 文档 在线获取Python 标准库的文档以及教程和指南jvzq<84r{vnpp7u4jr4dqv4
9.中蟒(中文Python)編程語言網站chinesepython中蟒 網站主頁 中蟒是 Python 語言的中文版本. 提供即譯式, 互動, 以概念出發並可擴展的程式語言. 其結構異常的清楚且用途極廣. 目前已移植到非常多的操作平台上. 中蟒是免費的.jvzq<84yyy4djrsgugvzvqtp0qxh1
10.洛书编程语言洛书(Losu) 编程语言,全称 Language Of Systemd Units ,超轻量、跨平台、易扩展、支持中文代码、拥有中文文档和视频资料,致力于打造一门开源、高效、强大的编程语言。 洛书是一款: 图灵完备 的编程语言,支持面向过程、面向对象与部分元编程的特性 全平台可用,支持Windows、Linux、RTOS等多种操作系统,解释器可以由 jvzquC41ikzfg7hqo1iigw2ejcudjns
11.赛事报名|香港中文大学(深圳)2023年程序设计竞赛|香港中文平均难度不高于CSC3100数据结构课程编程作业难度。赛题仅考察算法和程序设计能力,不涉及Windows/Linux等编程知识。 编程语言 支持C/C++/Python/Java,出题组会根据不同语言设置不同时限。 大赛咨询群 其他相关事项可加入咨询群询问或等待后续发放参赛手册获悉。 jvzquC41ufy/e~mm0gjv0ls1gxkov8>23
12.程序设计类课程教辅平台本课程是面向计算机新人的程序设计入门课程,Java语言是教学的媒介,但不是课程的目标。 下载开发环境 » 程序设计基础( Python语言) 本课程面向各类热爱编程的同学,培养运用 Python 编程语言解决实际问题的编程能力。使学生掌握 Python 语言的基本语法、语句以及结构化程序设计的基本思想和方法,了解基本的算法和数据结构jvzq<84e0ppvr}3gfw4dp8
13.编程帮:分享优质编程教程编程帮,一个在线学习编程的网站,专注于分享优质编程教程,包括C/C++、Java、Python、C#、JavaScript、PHP、SQL等。您的下一套教程,何必是书籍。jvzquC41yy}/drfpejkoi7sgv1
14.php5下载php5.4下载php5.3下载php中文手册php5下载-php5.4下载-php5.3下载-php中文手册PHP是现在非常常用的一款编程语言,一般都是用在前端开发里面的,而且现在php的使用十分的广泛了,很多中小型企业做开发都是用的php这门语言,绿色资源网小编为了方便大家学习php语言编程,整理出来了不少的有关于php的编程手册,比如php入门到精通,php怎么入门等等,希望给那些jvzq<84yyy4eq€see0ipo8p1rjv0
15.什么是编程语言?(通俗易懂)puts("C语言中文网"); 我们把要显示的内容放在("和")之间,并且在最后要有;。你必须要这样写,这是固定的格式。 总结:编程语言是用来控制计算机的一系列指令(Instruction),它有固定的格式和词汇(不同编程语言的格式和词汇不一样),必须遵守,否则就会出错,达不到我们的目的。 jvzquC41e0hjcwhjgpm/pny1xkkx1|gnzrms0qyon
16.易语言中文编程:学习进阶中文pdf扫描版[121MB]电子书下载易语言 中文编程:学习进阶 中文pdf扫描版[121MB],在熟悉了易语言编程环境的使用和易语言核心支持库的应用后,更全面细致地介绍了易语言及其编程环境的核心功能,本书适用于初步掌握了易语言中文编程技巧的编程爱好者jvzquC41yy}/lk:30pku1ktqmu558;;390nuou