《大数据存储》课程教学大纲
课程号 |
_ |
||
课程名称 |
中文名:大数据存储 英文名:Big Data Storage |
||
课程性质 |
□通识必修课程 √通识选修课程 □大类基础课程 □学科基础课程 √专业必修课程 √专业选修课程 |
||
学分 |
2 |
周学时 |
2 |
主要适用专业 |
大数据、人工智能、计算机、信息管理各专业 |
||
先修课程 |
大数据导论 |
1
教学目的与任务
(一)教学目的
本课程意在普及大数据知识,帮助学生熟悉大数据时代的现实意义,掌握大数据存储与管理技术,积极投身于大数据应用。
在大数据生态系统中,基础设施主要负责数据存储以及处理公司掌握的海量数据,应用程序则是人类和计算机系统从数据中获知关键信息的工具。为了应对大数据时代,需要从根本上考虑用于数据存储和处理的平台。
关系数据库和NoSQL数据库是数据库演化过程中的两个里程碑。不同的应用程序需要使用不同类型的数据库,而这恰恰是数据管理系统在过去儿十年间不断发展的动力所在。
(二)教学环节和学时分配
在传统的数据存储、处理平台中,需要用ELT工具,将数据从CRM、ERP等系统中提取出来,并转换为容易使用的形式,再导入像数据仓库和RDBMS等专用于分析的数据库中。当管理的数据超过一定规模时,用现有的数据处理平台已经很难处理具备3V特征的大数据,即便能够处理,在性能方面也很难有良好的表现。对这些时时刻刻都在产生的非结构化数据进行实时分析,并从中获取有意义的观点,是十分困难的。
大数据存储是一门理论性和实践性都很强的课程,针对大数据、人工智能、计算机、信息管理和其他相关各专业学生的发展需求,本课程系统、全面地介绍了大数据存储与管理的基本知识和技能,包括大数据存储基础、数据管理技术的发展、RDBMS与SQL、NoSQL数据模型、键值数据库、文档数据库、列族数据库、图数据库、数据库技术的发展(NewSQL)等内容,教材中还重点安排了MongoDB文档数据库和熟悉HBase列族数据库两个课程实践,全书具有较强的可读性和实用性。
本课程的教学环节主要有:
结合课堂教学方法改革的要求,全书全新设计了课程教学过程,各章的教学过程基本上是:
(1)课前,要求学生认真阅读这一章的“导读案例”,并完成阅读作业。
(2)主体:以教学PPT辅助,开展本章内容授课。
(3)布置本章“作业”和“实验与思考”,要求学生课后及时、认真完成,并通过网络环境拓展学习内容,熟悉知识内涵。
总学时 |
32 _ |
||
理论学时 |
32 |
课外实践学时 |
32 |
2
教学内容与基本要求
(一)引言、大数据存储基础(4课内理论学时+2课外实践学时)
1. 教学内容
【导读案例】什么是数据驱动?
1.1 什么是大数据
1.2 开源技术的商业支援
1.3 分布式系统
1.4 Hadoop分布式处理技术
1.5 大数据的数据处理基础
1.6 大数据存储的技术路线
【作 业】
【实验与思考】熟悉大数据存储基础
2. 基本要求
(1)了解本课程的教学设计;
(2)熟悉本课程的基本内容与学习要求;
(3)课前完成本章的导读案例、课后完成作业、实验与思考的全部内容。
3. 重点与难点
(1)重点:
· 在理解本章内容的基础上完成课后作业与实验。
· 大数据的数据处理基础
· 大数据存储的技术路线
(2)难点:阅读理解“导读案例”内容及其意义。
(二)数据管理技术的发展(2课内理论学时+2课外实践学时)
1. 教学内容
2.1 早期的数据管理系统
2.2 引发变革的关系数据库
2.3 Web程序的4个特征
2.4 催生NoSQL的动因分析
【作 业】
【实验与思考】熟悉数据管理:SQL还是NoSQL
2. 基本要求
(1)熟悉本章基本教学内容;
(2)课前完成本章的导读案例与作业;
(3)课后完成本章的作业和实验与思考。
3. 重点与难点
(1)重点:
· 使用RDBMS的应用架构
· 关系数据库的局限
· 催生NoSQL的动因分析
(2)难点:Web程序的4个特征。
(三)RDBMS与SQL(2课内理论学时+2课外实践学时)
1. 教学内容
【导读案例】关系数据库之父埃德加•考特
3.1 关系数据库
3.2 RDBMS的结构
3.3 结构化查询语言SQL
3.4 SQL语句的结构
3.5 关系数据库的ACID特征
3.6 关系数据库的三大范式
【作 业】
【实验与思考】熟悉RDBMS与SQL
2. 基本要求
(1)熟悉本章基本教学内容;
(2)课前完成本章的导读案例与作业;
(3)课后完成本章的作业和实验与思考。
3. 重点与难点
(1)重点:
· RDBMS的结构
· 结构化查询语言SQL
· 关系数据库的ACID特征
· 关系数据库的三大范式
(2)难点:
· 关系数据库的ACID特征
· 关系数据库的三大范式
(四)NoSQL数据模型(2课内理论学时+2课外实践学时)
1. 教学内容
【导读案例】灾难恢复——领军企业万国数据
4.1 分布式数据管理
4.2 NoSQL数据库性质
4.3 键值数据库类型
4.4 文档数据库类型
4.5 列族数据库类型
4.6 图数据库类型
4.7 NoSQL数据库选择
【作 业】
【实验与思考】熟悉NoSQL数据模型
2. 基本要求
(1)熟悉本章基本教学内容;
(2)课前完成本章的导读案例与作业;
(3)课后完成本章的作业和实验与思考。
3. 重点与难点
(1)重点:
· NoSQL数据库性质
· 什么是键值数据库、文档数据库、列族数据库和图数据库
· SQL和NoSQL的结合
(2)难点:
· 分布式数据管理
· NoSQL数据库性质
· NOSQL数据库选择
(五)键值数据库基础(2课内理论学时+2课外实践学时)
1. 教学内容
【导读案例】一个键值数据库包含什么?
5.1 从数组到键值数据库
5.2 键值数据库的重要特性
5.3 键:有意义的标识符
5.4 值:存放任意数据
5.5 键值数据库的数据建模
5.6 键值数据库的架构
5.7 REDIS键值数据库
【作 业】
【实验与思考】安装Redis键值数据库
2. 基本要求
(1)熟悉本章基本教学内容;
(2)课前完成本章的导读案例与作业;
(3)课后完成本章的作业和实验与思考。
3. 重点与难点
(1)重点:
· 键值数据库的重要特性
· 键值数据库的数据建模
· 键值数据库的架构
(2)难点:
· 键值数据库的数据建模
· 键值数据库的架构
(六)键值数据库设计(2课内理论学时+2课外实践学时)
1. 教学内容
【导读案例】选出最好的键值数据库
6.1 键值数据库实现的概念
6.2 键的设计与分区
6.3 设计结构化的值
6.4 键值数据库的局限
【作 业】
【实验与思考】用键值数据库管理移动应用配置
2. 基本要求
(1)熟悉本章基本教学内容;
(2)课前完成本章的导读案例与作业;
(3)课后完成本章的作业和实验与思考。
3. 重点与难点
(1)重点:
· 键值数据库实现的概念
· 键的设计与分区
· 键值数据库的局限
(2)难点:
· 键的设计与分区
· 键值数据库的局限
(七)文档数据库基础(2课内理论学时+2课外实践学时)
1. 教学内容
【导读案例】多媒体文档数据库
7.1 关于文档
7.2 文档数据库数据结构
7.3 文档数据库基本操作
7.4 文档数据库分区架构
7.5 数据建模与查询处理
【作 业】
【实验与思考】熟悉MongoDB文档数据库
2. 基本要求
(1)熟悉本章基本教学内容;
(2)课前完成本章的导读案例与作业;
(3)课后完成本章的作业和实验与思考。
3. 重点与难点
(1)重点:
· 文档数据库数据结构
· 文档数据库基本操作
· 文档数据库分区架构
· 数据建模与查询处理
(2)难点:
· 文档数据库数据结构
· 文档数据库分区架构
(八)文档数据库设计(2课内理论学时+2课外实践学时)
1. 教学内容
【导读案例】面向文档开源数据库
8.1 文档数据库设计思考
8.2 规范化还是去规范化
8.3 应对可变文档
8.4 编制数量适中的索引
8.5 为文档数据库常见关系建模
【作 业】
【实验与思考】客户的货物清单
2. 基本要求
(1)熟悉本章基本教学内容;
(2)课前完成本章的导读案例与作业;
(3)课后完成本章的作业和实验与思考。
3. 重点与难点
(1)重点:
· 文档数据库设计思考
· 规范化还是去规范化
· 为文档数据库常见关系建模
(2)难点:
· 规范化还是去规范化
· 为文档数据库常见关系建模
(九)课程实践:Mongo文档数据库(1课内理论学时+3课外实践学时)
1. 教学内容
【导读案例】MongoDB GUI可视化工具
9.1 初识MongoDB
9.2 MongoDB结构
9.3 分布式运算模型Mapreduce
9.4 存储原理与大文件存储规范
9.5 复制与分片
9.6 MongoDB版本与平台
【实验与思考】MongoDB文档数据库
2. 基本要求
(1)熟悉文档数据库相关知识;
(2)了解MongoDB文档数据库;
(3)安装和初步运行MongoDB文档数据库。
(十)列族数据库基础(2课内理论学时+2课外实践学时)
1. 教学内容
【导读案例】阿里云数据库
10.1 列族数据库谷歌BigTable
10.2 列族、键值及文档数据库异同
10.3 列族数据库使用架构
10.4 列族数据库适用场合
10.5 列族数据库基本组件
【作 业】
【实验与思考】熟悉列族数据库
2. 基本要求
(1)熟悉本章基本教学内容;
(2)课前完成本章的导读案例与作业;
(3)课后完成本章的作业和实验与思考。
3. 重点与难点
(1)重点:
· 列族数据库谷歌BigTable
· 列族、键值及文档数据库异同
· 列族数据库使用架构
· 列族数据库适用场合
· 列族数据库基本组件
(2)难点:
· 列族数据库谷歌BigTable
· 列族数据库使用架构
· 列族数据库基本组件
(十一)列族数据库设计(2课内理论学时+2课外实践学时)
1. 教学内容
【导读案例】腾讯云数据库
11.1 列族数据库的设计
11.2 列族数据库的结构
11.3 处理流程及协议
11.4 设计数据表格
11.5 编制索引
11.6 应对大数据的工具
【作 业】
【实验与思考】客户数据分析
2. 基本要求
(1)熟悉本章基本教学内容;
(2)课前完成本章的导读案例与作业;
(3)课后完成本章的作业和实验与思考。
3. 重点与难点
(1)重点:
· 列族数据库的设计
· 列族数据库的结构
· 设计数据表格
· 应对大数据的工具
(2)难点:
· 熟悉腾讯云
· 列族数据库的结构
· 处理流程及协议
· 应对大数据的工具
(十二)课程实践:HBase列族数据库(1课内理论学时+3课外实践学时)
1. 教学内容
【导读案例】图解HBase列式存储
12.1 HDFS分布式存储
12.2 初识HBase
12.3 HBase的使用场景
12.4 HBase模型和系统架构
12.5 HBase Shell
【实验与思考】HBase列族数据库环境搭建
2. 基本要求
(1)熟悉文档数据库相关知识;
(2)了解HBase列族数据库;
(3)安装和初步运行HBase列族数据库。
(十三)图数据库基础(2课内理论学时+2课外实践学时)
1. 教学内容
【导读案例】利用图数据库构建社交应用
13.1 图及其元素
13.2 关系建模与图数据库
13.3 图数据库的优势
13.4 图的操作
13.5 图和节点的属性
13.6 图的类型
13.7 Neo4j图数据库
【作 业】
【实验与思考】安装和了解Neo4j图数据库
2. 基本要求
(1)熟悉本章基本教学内容;
(2)课前完成本章的导读案例与作业;
(3)课后完成本章的作业和实验与思考。
3. 重点与难点
(1)重点:
· 图及其元素
· 关系建模与图数据库
· 图数据库的优势
· 图的操作
· 图和节点的属性
(2)难点:
· 关系建模与图数据库
· 图和节点的属性
· 图的类型
(十四)图数据库基础(2课内理论学时+2课外实践学时)
1. 教学内容
【导读案例】2020年11月DB-Enines排行
14.1 设计图模型
14.2 Cypher:对图的声明式查询
14.3 Gremlin:遍历图模型查询
14.4 图数据库设计技巧
【作 业】
【实验与思考】优化运输路线
2. 基本要求
(1)熟悉本章基本教学内容;
(2)课前完成本章的导读案例与作业;
(3)课后完成本章的作业和实验与思考。
3. 重点与难点
(1)重点:
· 设计图模型
· 图数据库设计技巧
(2)难点:
· Cypher:对图的声明式查询
· Gremlin:遍历图模型查询
(十五)图数据库设计(2课内理论学时+2课外实践学时)
1. 教学内容
【导读案例】把NAS网络存储功能效果最大化
15.1 数据库行业全景图
15.2 NEWSQL数据库应运而生
15.3 典型NewSQL——NuoDB
15.4 其他数据库
【作 业】
【实验与思考】熟悉NewSQL数据库
2. 基本要求
(1)熟悉本章基本教学内容;
(2)课前完成本章的导读案例与作业;
(3)课后独立完成本书的课程学习与实验总结。
3. 重点与难点
(1)重点:
· 数据库行业全景图
· NewSQL数据库应运而生
· 其他数据库
· 完成课程实验总结
(2)难点:
· NewSQL数据库应运而生
· 其他数据库
3
学时分配表
4
实验环节安排汇总表
实验目的、内容和要求:见《实验项目卡》
5
推荐教材与参考书目
《大数据存储——从SQL到NoSQL》周苏,清华大学出版社
参考:
《大数据导论》周苏等,清华大学出版社
《大数据分析》周苏,清华大学出版社
《大数据存储》课程教学进度表
课程用书
《大数据存储——从SQL到NoSQL》
作者:柳俊、周苏
定价:59.80元
扫码优惠购书
内容简介
本书针对大数据、人工智能、信息管理、经济管理和其他相关专业学生的发展需求,系统、全面地介绍了大数据存储与管理的基本知识和技能,介绍了大数据存储基础、数据管理技术的发展、RDBMS与SQL、NoSQL数据模型、键值数据库、文档数据库、列族数据库、图数据库、数据库技术的发展(NewSQL),重点安排了熟悉MongoDB文档数据库和HBase列族数据库两个课程实践。全书具有较强的系统性、可读性和实用性。
本书是为高等院校相关专业“大数据存储”“大数据存储与管理”“大数据管理”等课程全新设计编写的具有丰富实践特色的主教材,也可供有一定实践经验的软件开发人员、管理人员参考,或作为继续教育的教材。
丛书推荐