阅读更多

3顶
0踩

开源软件
Apache 基金会宣布了 Apache Falcon 项目通过了孵化阶段,目前已经成为基金会的顶级项目。

新的项目网址:http://falcon.apache.org/

Apache Falcon 提供了一个用于治理和编排 Hadoop 内部和周边数据流的数据处理框架。该框架为获取和处理数据集、复制与保留数据集、重新定向位于非Hadoop扩展中的数据集、维护审核跟踪与沿袭提供了关 键性的管控框架。Knox拓展了Hadoop的安全边界,实现了与LDAP、用于证书管理的活动目录等框架进行了充分整合,为跨Hadoop和所有相关项 目的授权提供了一个通用服务。

整体架构:


  • 大小: 64.1 KB
来自: 开源中国
3
0
评论 共 0 条 请登录后发表评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

  • Apache Falcon升级为Apache顶级项目

    Apache Falcon是一个面向Hadoop的、新的数据处理和管理平台,设计用于数据移动、数据管道协调、...近日,Apache基金会宣布Falcon升级为顶级项目。\\Apache Falcon项目副主管Srikanth Sundarrajan说:\\\Apache Fa...

  • Apache Flex孵化完毕成为Apache顶级项目,但前景并不明朗

    本文来源于我在InfoQ中文站翻译的文章,原文地址是:http://www.infoq.com/cn/news/2013/01/Apache-Flex-TLP近日,Apache软件基金会宣布Apache Flex孵化完毕并成为Apache顶级项目,这距离Adobe将Flex SDK的源代码、...

  • 我是如何成为Apache Kudu committer & PMC的?

    Kudu项目最先是由Cloudera公司发起的一个开源项目,2016年7月成为Apache软件基金会顶级项目。 Kudu的定位是提供一个既有媲美HDFS顺序扫描的性能,也同时具有HBase随机读写特性的存储系统,在与Spark SQL或impala结合...

  • Apache Pegasus 首次 Meetup 圆满落幕

    Apache Pegasus 是分布式 KV 存储系统,目标是服务于数据规模较大、对延迟敏感、有一致性要求、且有持久化存储需求的业务。2021年9月25日,由小米开源委员会主办的 Apa...

  • 作为技术负责人,如何从0搭建公司后端技术栈

    Apache ZooKeeper 本来是 Hadoop 的子工程,现在已经是顶级工程了。 除此之外也可以自己实现服务实现,或者用 Redis 也行,只是需要自己实现高可用性。 7、关系数据库 关系数据库分为两种,一种是传统关系数据,如 ...

  • 元数据与数据治理|Hadoop技术栈(第二篇)

    目前所有人都可以下载Giraph,它已经成为Apache软件基金会的开源项目,并得到Facebook的支持,获得多方面的改进。 18. GraphX (图计算模型) Spark GraphX最先是伯克利AMPLAB的一个分布式图计算框架项目,...

  • 从零开始搭建创业公司后台技术栈

    Apache ZooKeeper 本来是 Hadoop 的子工程,现在已经是顶级工程了。 除此之外也可以自己实现服务实现,或者用 Redis 也行,只是需要自己实现高可用性。 7、关系数据库 关系数据库分为两种,一种是传统关系数据,如 ...

  • 值得关注的开源软件推荐

    希望这篇文章起到抛砖引玉的作用,这里我们只交流、讨论一些思路和方法,并不深入到某个具体项目,这个会留在以后的课程与大家一同学习交流。 开源软件在操作系统、云计算、大数据、编译器、数据库、移动、汽车工业...

  • 从零搭建创业公司后台技术栈

    Apache ZooKeeper 本来是 Hadoop 的子工程,现在已经是顶级工程了。 除此之外也可以自己实现服务实现,或者用 Redis 也行,只是需要自己实现高可用性。 7、关系数据库 关系数据库分为两种,一种是传统关系数据,如 ...

  • 一个牛逼的创业公司后台技术栈搭建方案

    Apache ZooKeeper 本来是 Hadoop 的子工程,现在已经是顶级工程了。 除此之外也可以自己实现服务实现,或者用 Redis 也行,只是需要自己实现高可用性。 关系数据库 关系数据库分为两种,一种是传统关系数据库,如 ...

  • 面试官:如果让你作技术负责人,你会如何从0搭建公司后端技术栈

    如何您是一名创业公司的负责人,如何从0搭建公司的后端技术栈。...流程:怎样的流程和规范,如:开发流程,项目流程,发布流程,监控告警流程,代码规范等等; 系统:系统化建设,上面的流程需要有系统来.

  • 创业公司 如果让你作技术负责人,你会如何从0搭建公司后端技术栈

    文章目录创业公司 如果让你作技术负责人,你会如何从0搭建公司后端技术栈各系统组件选型1、项目管理/Bug管理/问题管理2、DNS3、LB(负载均衡)4、CDN5、RPC 框架6、名字发现/服务发现7、关系数据库8、NoSQL9、消息...

  • 如果让你作技术负责人,你会如何从0搭建公司后端技术栈

    如何您是一名创业公司的负责人,如何从0搭建公司的后端技术栈。...流程:怎样的流程和规范,如:开发流程,项目流程,发布流程,监控告警流程,代码规范等等; 系统:系统化建设,上面的流程需要有系统来保证,如:

  • 如果让你做技术负责人,你会如何从0搭建公司后端技术栈

    Apache ZooKeeper 本来是 Hadoop 的子工程,现在已经是顶级工程了。 除此之外还有eureka, nacos等,大家可以根据相关的组件特性,选择适合自己的组件。 7、关系数据库 关系数据库分为两种,一种是传统关系数据,如 ...

  • 06_QLibrary.zip

    06_QLibrary.zip

  • 毕业设计: 基于Densenet + CTC技术的文字检测识别的技术研究

    本毕设课题是属于计算机视觉下的目标检测与识别,对象为自然场景下的各种文本信息,通俗的说就是检测识别图片中的文本信息。由于文本的特殊性,本毕设将整个提取信息的过程可以分为检测、识别两个部分。 论文对用到的相关技术概念有一定的介绍分析,如机器学习,深度学习,以及各种的网络模型及其工作原理过程。 检测部分采用水平检测文本线方式进行文本检测,主要参考了乔宇老师团队的 CTPN 方法,并在正文部分从模型的制作到神经网络的设计实现对系统进行了较为详细的分析介绍。 识别部分则采用的是 Densenet + CTC,对于印刷体的文字有较好的识别。

  • 毕业设计 基于javaweb的在线答题平台

    毕业设计 基于javaweb的在线答题平台

  • numpy安装 python get-pip.py

    numpy安装 numpy安装 python get-pip.py

  • 基于用户、物品的协同过滤算法.zip

    协同过滤算法(Collaborative Filtering)是一种经典的推荐算法,其基本原理是“协同大家的反馈、评价和意见,一起对海量的信息进行过滤,从中筛选出用户可能感兴趣的信息”。它主要依赖于用户和物品之间的行为关系进行推荐。 协同过滤算法主要分为两类: 基于物品的协同过滤算法:给用户推荐与他之前喜欢的物品相似的物品。 基于用户的协同过滤算法:给用户推荐与他兴趣相似的用户喜欢的物品。 协同过滤算法的优点包括: 无需事先对商品或用户进行分类或标注,适用于各种类型的数据。 算法简单易懂,容易实现和部署。 推荐结果准确性较高,能够为用户提供个性化的推荐服务。 然而,协同过滤算法也存在一些缺点: 对数据量和数据质量要求较高,需要大量的历史数据和较高的数据质量。 容易受到“冷启动”问题的影响,即对新用户或新商品的推荐效果较差。 存在“同质化”问题,即推荐结果容易出现重复或相似的情况。 协同过滤算法在多个场景中有广泛的应用,如电商推荐系统、社交网络推荐和视频推荐系统等。在这些场景中,协同过滤算法可以根据用户的历史行为数据,推荐与用户兴趣相似的商品、用户或内容,从而提高用户的购买转化率、活跃度和社交体验。 未来,协同过滤算法的发展方向可能是结合其他推荐算法形成混合推荐系统,以充分发挥各算法的优势。

  • strcmp函数应用.zip

    strcmp函数应用.zip

Global site tag (gtag.js) - Google Analytics