1、封面介绍2、出版时间2021年2月3、推荐理由本书一方面对Flink的技术架构做了深入的介绍,另一方面涵盖了Flink大多数API,本书每章都提供了一些实践案例和习题训练,帮助读者了解、上手和熟悉Flink技术。与其他中文Flink图书相比,本书从初学者角度出发,结合相关案例,深入浅出,有助于读者学懂学会Flink。本书围绕大数据流处理领域,介绍F...

1、封面介绍2、出版时间2020年9月3、推荐理由《Flink内核原理与实现》既讲解了Flink的入门、安装、流计算开发入门、类型和序列化系统、监控运维、安全管理配置等基础知识,又讲解了Flink的时间概念、Window的实现原理及其代码解析,Flink的容错机制原理,Flink容错的关键设计、代码实现分析,Flink Job从源码到执行整个过程的解析...

1、封面介绍2、出版时间2019年12月3、推荐理由带你走近Apache Flink,一个为全世界多个Z大规模级别的流处理应用提供支持的开源框架。通过本书,你将探索并行流处理的基本概念并了解该技术与传统批处理的区别。Apache Flink项目的资深贡献者Fabian Hueske和Vasiliki Kalavri展示了如何使用Flink DataSt...

1、封面介绍2、出版时间2019年4月3、推荐理由《深入理解Flink:实时大数据处理实践》介绍了实时数据处理引擎Flink,讲解了流处理API、批处理API、机器学习引擎FlinkML、关系型API、复杂事件处理,以及指标度量与部署模式,分析了流式数据处理理论中时间、窗口、水印、触发器、迟到生存期之间的关联和关系,深入分析了多项式曲线拟合、分类算法、...

1、封面介绍2、出版时间2019年12月3、推荐理由Apache Flink项目的资深贡献者Fabian Hueske和Vasiliki Kalavri展示了如何使用Flink DataStream API实现可伸缩的流式应用,以及怎样在业务环境中持续运行和维护这些应用。流处理的理想应用场景有很多,包括低延迟ETL、流式分析、实时仪表盘以及欺诈检测、异...

1、封面介绍2、出版时间2020年11月3、推荐理由本书适合初级和中级软件工程师阅读,未接触过流计算领域的Java开发者也可以从本书中获益。针对初学者,本书提供Windows环境搭建的演示,使不具备Linux系统操作经验的读者也可以快速学习Apache Flink。本书从Apache Flink的缘起开始,由浅入深,理论结合实践,全方位地介绍Apach...

1、封面介绍2、出版时间2020年6月3、推荐理由适读人群 :数据库系统工程师、开发工程师、运维工程师、存储工程师及其他相关从业人员本书从数据库开发者角度,对现代数据库技术进行了全景式解读,完全不拘泥于任何一款数据库系统,也不偏袒任何一种数据库的类型或特性。这本书只会讨论现代数据库必不可少的那些东西,例如存储格式、索引数据结构、数据一致性等,以及相关的...

1、封面介绍2、出版时间2010年5月3、推荐理由《数据库系统实现(第2版)》内容深入且全面,技术实用且先进,叙述深入浅出,是一本难得的高层次的教材,适合作为高等院校计算机专业研究生的教材或本科生的教学参考书,也适合作为从事相关研究或开发工作的专业技术人员的高级参考资料。《数据库系统实现(第2版)》是斯坦福大学计算机科学专业数据库系列课程第二门课的教科...

1、封面介绍2、出版时间2014年5月3、推荐理由《分布式数据库系统原理(第3版)》主要介绍分布式数据库管理系统的基本概念、基本理论和设计问题,涵盖了分布式数据库系统的设计、实现和管理等方面的诸多专题。全书由两大部分组成,第一部分包括第1~14章,以关系数据库为主,讲述了分布式数据管理的基础原理,内容包括分布式数据库设计,分布式查询的分解与优化,事务管...

1、封面介绍2、出版时间2017年12月3、推荐理由本书是数据库领域的经典畅销著作,被世界多所大学选为教材,同时被广大技术人员和管理人员视为必读书。本书作者曾在工业界致力于数据库系统的设计,后进入学术界精耕于教学,深谙专业人士和非专业人士在使用和学习数据库时的痛点。因此,本书采用这两类读者都易于接受和理解的方式,全面介绍数据库设计、实现和管理的基本理论...

1、封面介绍2、出版时间2016年5月3、推荐理由本书是数据库领域的经典著作,内容系统、全面、实用,被世界多所大学选为数据库相关课程的教材。中文版分为基础篇和进阶篇,分别对应原书~五部分和第六~九部分。本书为基础篇,主要内容包括:数据库系统与数据库设计的基础知识;关系模型与语言;数据库分析与设计的主要技术;数据库设计方法学;以及现代数据库管理相关专题,...

1、封面介绍2、出版时间2012年4月3、推荐理由数据库系统方面的经典教材,被国外许多知名大学采用。决战大数据时代!IT技术人员不得不读!数据库领域的殿堂级作品,夯实数据库理论基础,增强数据库技术内功的必备之选,对深入理解数据库,深入研究数据库,深入操作数据库都具有极强的指导作用!《数据库系统概念(原书第6版)》是经典的数据库系统教科书《Databas...

科德十二定律,又称黄金十二定律,是计算机数据库中的一条定律,目的是数据库关系化。关系模型的奠基人埃德加·科德具体地给出了全关系系统应遵循的基本准则,如下所示:准则0一个关系型的数据库必须能完全通过它的关系能力来管理数据库。准则1 信息准则关系数据库的所有信息都应该在逻辑一级上用表中的值这一种方法显式的表示。准则2 保证访问准则依靠表名、主码和列名的组合...

简介埃德加·弗兰克·科德(英语:Edgar Frank Codd, 1923年8月23日-2003年4月18日),小名泰德·科德(Ted Codd),生于英国英格兰多塞特郡的波特兰,计算机科学家。他为关系型数据库理论做出了奠基性的贡献。他在IBM工作期间,首创了关系模型理论。他一生中为计算机科学做出了很多有价值的贡献,而关系模型作为一个在数据库管理方面...

Ted Codd于1923年出生在英格兰多塞特郡波特兰市的一个大家庭中。他曾经就读于牛津大学,主修数学和化学专业,第二次世界大战期间曾在英国皇家空军服役。第二次世界大战后,Codd动身前往纽约并成为IBM的一名编程员。Codd所做的第一个项目是帮助构建一个称为可选顺序电子计算器(Selective Sequence Electronic Calcula...

Flink用DataStream表示无界数据集,用DataSet表示有界数据集,前者用于流处理应用程序,后者用于批处理应用程序。从操作形式上看,DataStream 和 DataSet 与集合 Collection 有些相似,但两者有着本质的区别:(1)DataStream 和 DataSet 是不可变的数据集合,因此不可以像操作集合那样增加或者删除 ...

尼古拉斯·沃斯:算法+数据结构=程序尼古拉斯·沃斯(Niklaus Wirth,1934年2月15日—),生于瑞士温特图尔,是瑞士计算机科学家。他有一句在计算机领域人尽皆知的名言“算法+数据结构=程序”(Algorithm + Data Structures = Programs)。这个公式对计算机科学的影响程度足以类似物理学中爱因斯坦的“E=MC^2...

随着时代的发展,企业对数据实时处理的需求愈来愈大,所以就出现了storm/spark流框架。这两者有着自己的计算模式:storm属于真正的流式处理,低延迟(ms级延迟),高吞吐,且每条数据都会触发计算。spark属于批处理转化为流处理即将流式数据根据时间切分成小批次进行计算,对比与storm而言延迟会高于0.5s(s级延迟),但是性能上的消耗低于sto...