OLAP分析引擎-Apache Kylin
2015-10-13 15:19:25 阿炯

本站赞助商链接,请多关照。 Kylin 是一个开源的分布式的 OLAP 分析引擎,由eBay公司开发,基于 Hadoop 提供 SQL 接口和 OLAP 接口,支持 TB 到 PB 级别的数据量。使用Java开发并在Apache协议下授权。


Apache Kylin Extreme OLAP Engine for Big Data

Apache Kylin is an open source Distributed Analytics Engine designed to provide SQL interface and multi-dimensional analysis (OLAP) on Hadoop supporting extremely large datasets, original contributed from eBay Inc.

Apache Kylin一个开源的分布式分析引擎,提供Hadoop之上的SQL查询接口及多维分析(OLAP)能力以支持超大规模数据,最初由eBay Inc. 开发并贡献至开源社区。


Kylin 是:
- 可扩展超快OLAP引擎:
Kylin是为减少在Hadoop上百亿规模数据查询延迟而设计

- Hadoop ANSI SQL 接口:
Kylin为Hadoop提供标准SQL支持大部分查询功能

- 交互式查询能力:
通过Kylin,用户可以与Hadoop数据进行亚秒级交互,在同样的数据集上提供比Hive更好的性能

- 多维立方体(MOLAP Cube):
用户能够在Kylin里为百亿以上数据集定义数据模型并构建立方体

- 与BI工具无缝整合:
Kylin提供与BI工具,如Tableau,的整合能力,即将提供对其他工具的整合

- 其他值得关注的特性包括:
作业管理和监控
压缩和编码的支持
Cube 的增量更新
Leverage HBase Coprocessor for query latency
Approximate Query Capability for distinct Count (HyperLogLog)
易用的 Web 管理、构建、监控和查询 Cube 的接口
Security capability to set ACL at Cube/Project Level
支持 LDAP 集成

运行环境要求:
Hadoop
Hadoop: 2.2.0 or above
Hive: 0.12.0 or above
HBase: 0.96.0-hadoop2

Kylin Server
Command hadoop, hive, hbase is workable on your hadoop cluster
JDK Runtime: JDK7 (OpenJDK or Oracle JDK)
Maven
Git
Tomcat
Mysql

在 InfoWorld Bossie Awards 2015 中,Apache Kylin 与其他众多项目,包括 Spark,Kafka, H2O, Elasticsearch,Zeppelin 等,一起入选“最佳开源大数据工具”奖。

最新版本:1.2
这是一个主要的版本发布带来了更稳定,健壮及更好管理的版本,Apache Kylin社区解决了44个issue,包括Bug修复,功能增强及一些新特性等。

主要变化
Kylin 核心功能增强
支持Excel, Power BI 及 Tableau 9.1 KYLIN-596,KYLIN-1065
增强HDFS小文件处理机制 KYLIN-702
环境检查脚本中对Hive HCatalog的增强 KYLIN-1081, KYLIN-1119
维度列字典编码支持超过千万以上基数 KYLIN-1099
Job页面加载性能改进 KYLIN-1154
基于每个查询分配内存预算 KYLIN-1190

主要Bug修复
修复在编辑模式中保存Cube的Bug KYLIN-1168
Cube创建后不能重命名 KYLIN-693
项目页面中Cube列表消失 KYLIN-930
Join两个字查询时报错 KYLIN-1033
当过滤条件是 (A or false) 时导致错误结果 KYLIN-1039
支持通过ResourceManager HA环境中获取MapReduce任务状态 KYLIN-1067
Build Base Cuboid Data出错后无法发送邮件 KYLIN-1106
二进制包中ResourceTool 下载上传不工作 KYLIN-1121
Kylin示例Cube “kylin_sales_cube”无法被保存 KYLIN-1140
1.x 分支中使用Minicluster的单元测试不工作 KYLIN-1155
在查询中无法解析如’YYYYMMDD’的日期格式 KYLIN-1216

详细介绍请看发行说明

最新版本:2.0
新特性
[KYLIN-744] - Spark Cube 构建引擎
[KYLIN-2006] - 使作业引擎分布,启用 HA
[KYLIN-2031] - 新的固定长度十六进制编码,支持散列值和更好的整数编码以支持负值提升
[KYLIN-227] - 支持 Kylin Job 的“暂停”
[KYLIN-490] - 支持多列不同计数
[KYLIN-995] - 启用 kylin 以支持多次加入相同的查找表
[KYLIN-1832] - HyperLogLog 编解码器性能提升

完整内容请查看发行说明


项目主页:http://kylin.incubator.apache.org/