【clickhou-学习】01-ClickHou初识及安装使⽤ClickHou是什么?有什么?能做什么? 为什么⽤? 如何使⽤? 寻找⼀堆⿊⼈问号的答案西华路
穿怎么组词⼀、ClickHou介绍
ClickHou(开源)是⼀个⾯向列的数据库管理系统(DBMS),⽤于在线分析处理查询(OLAP)。
关键词:开源、⾯向列、联机分析处理(OLAP)
ClickHou不仅查询速度快(相较于hive等类似的分析型DBMS),⽽且硬件使⽤效率、容错性、可靠性、易⽤性、线性扩展性等⾼。
1.1 Clic k H o u的独特功能
电脑怎么卸载
真正的列式DBMS
爱情甜蜜蜜
除了数据本⾝外不应该存在其他额外的数据。这意味着为了避免在值旁边存储它们的长度“number”,你必须⽀持固定长度数值类型。
数据压缩
饺子简笔画可爱
数据压缩存储在性能⽅⾯发挥着关键作⽤
家长的期望
数据的磁盘存储
⼯作在传统磁盘上的系统
多核⼼并⾏处理
⼤型查询以⼀种⾃然的⽅式并⾏化,占⽤当前服务器上可⽤的所有必要资源
多服务器分布式处理
在ClickHou中,数据可以保存在不同的shard上,每⼀个shard都由⼀组⽤于容错的replica组成,查询可以并⾏的在所有shard上进⾏处理⽀持SQL
ClickHou⽀持基于SQL的查询语⾔,该语⾔⼤部分情况下是与SQL标准兼容的。 ⽀持的查询包括 GROUP BY,ORDER BY,IN,JOIN 以及⾮相关⼦查询。 不⽀持窗⼝函数和相关⼦查询
向量引擎
为了⾼效的使⽤CPU,数据不仅仅按列存储,同时还按向量(列的⼀部分)进⾏处理
实时的数据更新
ClickHou⽀持在表中定义主键。为了使查询能够快速在主键中进⾏范围查找,数据总是以增量的⽅式有序的存储在MergeTree中。因此,数据可以持续不断⾼效的写⼊到表中,并且写⼊的过程中不会存在任何加锁的⾏为
索引
按照主键对数据进⾏排序,使能够以⼏⼗毫秒的低延迟对数据进⾏特定值查找或范围查找
适合在线查询
在线查询意味着在没有对数据做任何预处理的情况下以极低的延迟处理查询并将结果加载到⽤户的页⾯中
⽀持近似计算
ClickHou提供各种各样在允许牺牲数据精度的情况下对查询进⾏加速的⽅法:
1、⽤于近似计算的各类聚合函数,如:distinct values, medians, quantiles
待月西厢下
2、 基于数据的部分样本进⾏近似查询。这时,仅会从磁盘检索少部分⽐例的数据。
爱就像
3、 不使⽤全部的聚合条件,通过随机选择有限个数据聚合条件进⾏聚合。这在数据聚合条件满⾜某些分布条件下,在提供相当准确的聚合结
果的同时降低了计算资源的使⽤。
1.2 OLAP场景特征(适⽤场景)