简介
PiFlow 是一个基于分布式计算框架Spark开发的大数据流水线系统。该系统将数据的采集、清洗、计算、存储等各个环节封装成组件,以所见即所得方式进行流水线配置。简单易用,功能强大。它具有如下特性:简单易用:可视化配置流水线,实时监控流水线运行状态,查看日志功能强大:提供100+的数据处理组件, 包... 更多
其它信息
授权协议
BSD
开发语言
Java
操作系统
跨平台
软件类型
开源软件
所属分类
大数据、 数据处理
开源组织
无
地区
国产
适用人群
未知
收录时间
2023-09-18
时光轴
里程碑1
LOG0
2023
2023-09
轻识收录
评价
0.0(满分 10 分)0 个评分
什么是点评分
推荐
PrestoDB大数据查询引擎
Presto是Facebook最新研发的数据查询引擎,可对250PB以上的数据进行快速地交互式分析。据称该引擎的性能是Hive的10倍以上。PrestoDB是Facebook推出的一个大数据的分布式S
PrestoDB大数据查询引擎
0
TrafficTeach大数据项目:车流量监控
车流量监控前言目的1.对业务场景抽象,熟练Spark编码2.增加自定义累加器,自定义UDF3.Spark优化方式项目数据处理架构模块介绍卡扣流量分析SparkCore卡扣车流量转化率SparkCore
TrafficTeach大数据项目:车流量监控
0
Apache MADlib大数据机器学习工具
ApacheMADlib是为数据科学提供的SQL大数据机器学习工具。ApacheMADlib拥有强大的大数据分析能力。ApacheMADlib支持Postgres,PivotalGreenplum数据
Apache MADlib大数据机器学习工具
0