Flink的最新版本目前已经更新到了1.12.2了,下载和使用flink的最新版本,请移步官网:https://flink.apache.org/zh/downloads.html

Flink 是一个针对流数据和批数据的分布式处理引擎。它主要是由Java代码和Scala代码实现。对 Flink 而言,它所要处理的主要场景就是流数据,而批数据只是流数据的一个极限特例而已。换句话说,Flink 会把所有任务当成流来处理,这也是其最大的特点。

另外,Flink 支持本地的快速迭代,以及一些环形的迭代任务。所谓迭代运算,就是给定一个初值,用所给的算法公式计算初值得到一个中间结果,然后将中间结果作为输入参数进行反复计算,在满足一定条件的时候得到计算结果。迭代计算通常是数据挖掘和机器学习算法的核心部分,在各类应用中都普遍存在。在搜索领域,由Google提出的著名的网页排序算法PageRank,其核心思想就是根据网络之中不同网页之间的链接关系进行迭代计算,最终的排名即是迭代最终收敛的值或重要性;在社交网络领域, 很多好友推荐算法都是通过利用现有用户的好友关系网络图通过迭代计算来挖掘用户之间可能存在的潜在链接关系。

标签: none

[网站公告]-[2024年兼职介绍]


添加新评论