大数据存储(课程教学大纲+教学日历)
admin
2022-04-17 07:41:15
0

原标题:大数据存储(课程教学大纲+教学日历)

《大数据存储》课程教学大纲

课程号

_

课程名称

中文名:大数据存储

英文名:Big Data Storage

课程性质

□通识必修课程 √通识选修课程

□大类基础课程 □学科基础课程

√专业必修课程 √专业选修课程

学分

2

周学时

2

主要适用专业

大数据、人工智能、计算机、信息管理各专业

先修课程

大数据导论

1

教学目的与任务

(一)教学目的

本课程意在普及大数据知识,帮助学生熟悉大数据时代的现实意义,掌握大数据存储与管理技术,积极投身于大数据应用。

在大数据生态系统中,基础设施主要负责数据存储以及处理公司掌握的海量数据,应用程序则是人类和计算机系统从数据中获知关键信息的工具。为了应对大数据时代,需要从根本上考虑用于数据存储和处理的平台。

关系数据库和NoSQL数据库是数据库演化过程中的两个里程碑。不同的应用程序需要使用不同类型的数据库,而这恰恰是数据管理系统在过去儿十年间不断发展的动力所在。

(二)教学环节和学时分配

在传统的数据存储、处理平台中,需要用ELT工具,将数据从CRM、ERP等系统中提取出来,并转换为容易使用的形式,再导入像数据仓库和RDBMS等专用于分析的数据库中。当管理的数据超过一定规模时,用现有的数据处理平台已经很难处理具备3V特征的大数据,即便能够处理,在性能方面也很难有良好的表现。对这些时时刻刻都在产生的非结构化数据进行实时分析,并从中获取有意义的观点,是十分困难的。

大数据存储是一门理论性和实践性都很强的课程,针对大数据、人工智能、计算机、信息管理和其他相关各专业学生的发展需求,本课程系统、全面地介绍了大数据存储与管理的基本知识和技能,包括大数据存储基础、数据管理技术的发展、RDBMS与SQL、NoSQL数据模型、键值数据库、文档数据库、列族数据库、图数据库、数据库技术的发展(NewSQL)等内容,教材中还重点安排了MongoDB文档数据库和熟悉HBase列族数据库两个课程实践,全书具有较强的可读性和实用性。

本课程的教学环节主要有:

结合课堂教学方法改革的要求,全书全新设计了课程教学过程,各章的教学过程基本上是:

(1)课前,要求学生认真阅读这一章的“导读案例”,并完成阅读作业。

(2)主体:以教学PPT辅助,开展本章内容授课。

(3)布置本章“作业”和“实验与思考”,要求学生课后及时、认真完成,并通过网络环境拓展学习内容,熟悉知识内涵。

总学时

32

_

理论学时

32

课外实践学时

32

2

教学内容与基本要求

(一)引言、大数据存储基础(4课内理论学时+2课外实践学时)

1. 教学内容

【导读案例】什么是数据驱动?

1.1 什么是大数据

1.2 开源技术的商业支援

1.3 分布式系统

1.4 Hadoop分布式处理技术

1.5 大数据的数据处理基础

1.6 大数据存储的技术路线

【作 业】

【实验与思考】熟悉大数据存储基础

2. 基本要求

(1)了解本课程的教学设计;

(2)熟悉本课程的基本内容与学习要求;

(3)课前完成本章的导读案例、课后完成作业、实验与思考的全部内容。

3. 重点与难点

(1)重点:

· 在理解本章内容的基础上完成课后作业与实验。

· 大数据的数据处理基础

· 大数据存储的技术路线

(2)难点:阅读理解“导读案例”内容及其意义。

(二)数据管理技术的发展(2课内理论学时+2课外实践学时)

1. 教学内容

2.1 早期的数据管理系统

2.2 引发变革的关系数据库

2.3 Web程序的4个特征

2.4 催生NoSQL的动因分析

【作 业】

【实验与思考】熟悉数据管理:SQL还是NoSQL

2. 基本要求

(1)熟悉本章基本教学内容;

(2)课前完成本章的导读案例与作业;

(3)课后完成本章的作业和实验与思考。

3. 重点与难点

(1)重点:

· 使用RDBMS的应用架构

· 关系数据库的局限

· 催生NoSQL的动因分析

(2)难点:Web程序的4个特征。

(三)RDBMS与SQL(2课内理论学时+2课外实践学时)

1. 教学内容

【导读案例】关系数据库之父埃德加•考特

3.1 关系数据库

3.2 RDBMS的结构

3.3 结构化查询语言SQL

3.4 SQL语句的结构

3.5 关系数据库的ACID特征

3.6 关系数据库的三大范式

【作 业】

【实验与思考】熟悉RDBMS与SQL

2. 基本要求

(1)熟悉本章基本教学内容;

(2)课前完成本章的导读案例与作业;

(3)课后完成本章的作业和实验与思考。

3. 重点与难点

(1)重点:

· RDBMS的结构

· 结构化查询语言SQL

· 关系数据库的ACID特征

· 关系数据库的三大范式

(2)难点:

· 关系数据库的ACID特征

· 关系数据库的三大范式

(四)NoSQL数据模型(2课内理论学时+2课外实践学时)

1. 教学内容

【导读案例】灾难恢复——领军企业万国数据

4.1 分布式数据管理

4.2 NoSQL数据库性质

4.3 键值数据库类型

4.4 文档数据库类型

4.5 列族数据库类型

4.6 图数据库类型

4.7 NoSQL数据库选择

【作 业】

【实验与思考】熟悉NoSQL数据模型

2. 基本要求

(1)熟悉本章基本教学内容;

(2)课前完成本章的导读案例与作业;

(3)课后完成本章的作业和实验与思考。

3. 重点与难点

(1)重点:

· NoSQL数据库性质

· 什么是键值数据库、文档数据库、列族数据库和图数据库

· SQL和NoSQL的结合

(2)难点:

· 分布式数据管理

· NoSQL数据库性质

· NOSQL数据库选择

(五)键值数据库基础(2课内理论学时+2课外实践学时)

1. 教学内容

【导读案例】一个键值数据库包含什么?

5.1 从数组到键值数据库

5.2 键值数据库的重要特性

5.3 键:有意义的标识符

5.4 值:存放任意数据

5.5 键值数据库的数据建模

5.6 键值数据库的架构

5.7 REDIS键值数据库

【作 业】

【实验与思考】安装Redis键值数据库

2. 基本要求

(1)熟悉本章基本教学内容;

(2)课前完成本章的导读案例与作业;

(3)课后完成本章的作业和实验与思考。

3. 重点与难点

(1)重点:

· 键值数据库的重要特性

· 键值数据库的数据建模

· 键值数据库的架构

(2)难点:

· 键值数据库的数据建模

· 键值数据库的架构

(六)键值数据库设计(2课内理论学时+2课外实践学时)

1. 教学内容

【导读案例】选出最好的键值数据库

6.1 键值数据库实现的概念

6.2 键的设计与分区

6.3 设计结构化的值

6.4 键值数据库的局限

【作 业】

【实验与思考】用键值数据库管理移动应用配置

2. 基本要求

(1)熟悉本章基本教学内容;

(2)课前完成本章的导读案例与作业;

(3)课后完成本章的作业和实验与思考。

3. 重点与难点

(1)重点:

· 键值数据库实现的概念

· 键的设计与分区

· 键值数据库的局限

(2)难点:

· 键的设计与分区

· 键值数据库的局限

(七)文档数据库基础(2课内理论学时+2课外实践学时)

1. 教学内容

【导读案例】多媒体文档数据库

7.1 关于文档

7.2 文档数据库数据结构

7.3 文档数据库基本操作

7.4 文档数据库分区架构

7.5 数据建模与查询处理

【作 业】

【实验与思考】熟悉MongoDB文档数据库

2. 基本要求

(1)熟悉本章基本教学内容;

(2)课前完成本章的导读案例与作业;

(3)课后完成本章的作业和实验与思考。

3. 重点与难点

(1)重点:

· 文档数据库数据结构

· 文档数据库基本操作

· 文档数据库分区架构

· 数据建模与查询处理

(2)难点:

· 文档数据库数据结构

· 文档数据库分区架构

(八)文档数据库设计(2课内理论学时+2课外实践学时)

1. 教学内容

【导读案例】面向文档开源数据库

8.1 文档数据库设计思考

8.2 规范化还是去规范化

8.3 应对可变文档

8.4 编制数量适中的索引

8.5 为文档数据库常见关系建模

【作 业】

【实验与思考】客户的货物清单

2. 基本要求

(1)熟悉本章基本教学内容;

(2)课前完成本章的导读案例与作业;

(3)课后完成本章的作业和实验与思考。

3. 重点与难点

(1)重点:

· 文档数据库设计思考

· 规范化还是去规范化

· 为文档数据库常见关系建模

(2)难点:

· 规范化还是去规范化

· 为文档数据库常见关系建模

(九)课程实践:Mongo文档数据库(1课内理论学时+3课外实践学时)

1. 教学内容

【导读案例】MongoDB GUI可视化工具

9.1 初识MongoDB

9.2 MongoDB结构

9.3 分布式运算模型Mapreduce

9.4 存储原理与大文件存储规范

9.5 复制与分片

9.6 MongoDB版本与平台

【实验与思考】MongoDB文档数据库

2. 基本要求

(1)熟悉文档数据库相关知识;

(2)了解MongoDB文档数据库;

(3)安装和初步运行MongoDB文档数据库。

(十)列族数据库基础(2课内理论学时+2课外实践学时)

1. 教学内容

【导读案例】阿里云数据库

10.1 列族数据库谷歌BigTable

10.2 列族、键值及文档数据库异同

10.3 列族数据库使用架构

10.4 列族数据库适用场合

10.5 列族数据库基本组件

【作 业】

【实验与思考】熟悉列族数据库

2. 基本要求

(1)熟悉本章基本教学内容;

(2)课前完成本章的导读案例与作业;

(3)课后完成本章的作业和实验与思考。

3. 重点与难点

(1)重点:

· 列族数据库谷歌BigTable

· 列族、键值及文档数据库异同

· 列族数据库使用架构

· 列族数据库适用场合

· 列族数据库基本组件

(2)难点:

· 列族数据库谷歌BigTable

· 列族数据库使用架构

· 列族数据库基本组件

(十一)列族数据库设计(2课内理论学时+2课外实践学时)

1. 教学内容

【导读案例】腾讯云数据库

11.1 列族数据库的设计

11.2 列族数据库的结构

11.3 处理流程及协议

11.4 设计数据表格

11.5 编制索引

11.6 应对大数据的工具

【作 业】

【实验与思考】客户数据分析

2. 基本要求

(1)熟悉本章基本教学内容;

(2)课前完成本章的导读案例与作业;

(3)课后完成本章的作业和实验与思考。

3. 重点与难点

(1)重点:

· 列族数据库的设计

· 列族数据库的结构

· 设计数据表格

· 应对大数据的工具

(2)难点:

· 熟悉腾讯云

· 列族数据库的结构

· 处理流程及协议

· 应对大数据的工具

(十二)课程实践:HBase列族数据库(1课内理论学时+3课外实践学时)

1. 教学内容

【导读案例】图解HBase列式存储

12.1 HDFS分布式存储

12.2 初识HBase

12.3 HBase的使用场景

12.4 HBase模型和系统架构

12.5 HBase Shell

【实验与思考】HBase列族数据库环境搭建

2. 基本要求

(1)熟悉文档数据库相关知识;

(2)了解HBase列族数据库;

(3)安装和初步运行HBase列族数据库。

(十三)图数据库基础(2课内理论学时+2课外实践学时)

1. 教学内容

【导读案例】利用图数据库构建社交应用

13.1 图及其元素

13.2 关系建模与图数据库

13.3 图数据库的优势

13.4 图的操作

13.5 图和节点的属性

13.6 图的类型

13.7 Neo4j图数据库

【作 业】

【实验与思考】安装和了解Neo4j图数据库

2. 基本要求

(1)熟悉本章基本教学内容;

(2)课前完成本章的导读案例与作业;

(3)课后完成本章的作业和实验与思考。

3. 重点与难点

(1)重点:

· 图及其元素

· 关系建模与图数据库

· 图数据库的优势

· 图的操作

· 图和节点的属性

(2)难点:

· 关系建模与图数据库

· 图和节点的属性

· 图的类型

(十四)图数据库基础(2课内理论学时+2课外实践学时)

1. 教学内容

【导读案例】2020年11月DB-Enines排行

14.1 设计图模型

14.2 Cypher:对图的声明式查询

14.3 Gremlin:遍历图模型查询

14.4 图数据库设计技巧

【作 业】

【实验与思考】优化运输路线

2. 基本要求

(1)熟悉本章基本教学内容;

(2)课前完成本章的导读案例与作业;

(3)课后完成本章的作业和实验与思考。

3. 重点与难点

(1)重点:

· 设计图模型

· 图数据库设计技巧

(2)难点:

· Cypher:对图的声明式查询

· Gremlin:遍历图模型查询

(十五)图数据库设计(2课内理论学时+2课外实践学时)

1. 教学内容

【导读案例】把NAS网络存储功能效果最大化

15.1 数据库行业全景图

15.2 NEWSQL数据库应运而生

15.3 典型NewSQL——NuoDB

15.4 其他数据库

【作 业】

【实验与思考】熟悉NewSQL数据库

2. 基本要求

(1)熟悉本章基本教学内容;

(2)课前完成本章的导读案例与作业;

(3)课后独立完成本书的课程学习与实验总结。

3. 重点与难点

(1)重点:

· 数据库行业全景图

· NewSQL数据库应运而生

· 其他数据库

· 完成课程实验总结

(2)难点:

· NewSQL数据库应运而生

· 其他数据库

3

学时分配表

4

实验环节安排汇总表

实验目的、内容和要求:见《实验项目卡》

5

推荐教材与参考书目

《大数据存储——从SQL到NoSQL》周苏,清华大学出版社

参考:

《大数据导论》周苏等,清华大学出版社

《大数据分析》周苏,清华大学出版社

《大数据存储》课程教学进度表

课程用书

《大数据存储——从SQL到NoSQL》

作者:柳俊、周苏

定价:59.80元

扫码优惠购书

内容简介

本书针对大数据、人工智能、信息管理、经济管理和其他相关专业学生的发展需求,系统、全面地介绍了大数据存储与管理的基本知识和技能,介绍了大数据存储基础、数据管理技术的发展、RDBMS与SQL、NoSQL数据模型、键值数据库、文档数据库、列族数据库、图数据库、数据库技术的发展(NewSQL),重点安排了熟悉MongoDB文档数据库和HBase列族数据库两个课程实践。全书具有较强的系统性、可读性和实用性。

本书是为高等院校相关专业“大数据存储”“大数据存储与管理”“大数据管理”等课程全新设计编写的具有丰富实践特色的主教材,也可供有一定实践经验的软件开发人员、管理人员参考,或作为继续教育的教材。

丛书推荐

相关内容