3.1Tableau数据可视化

更新时间:2023-07-29 04:39:39 阅读: 评论:0

3.1Tableau数据可视化
1. Tableau 简介
Tableau 是⼀款可视化的分析和商业智能软件,可以帮助个⼈或公司组织更善于利⽤数据来做决策
1.1 Tableau 优势
1. 极速⾼效
2. 简单易⽤
3. 功能丰富
4. 灵活扩展
5. ⽆需编程
花样滑冰英文1.2 可视化与 BI
1. 商业智能(Business Intelligence,简称:BI),指⽤现代数据仓库技术、线上分析处理技术、数据挖掘和数据展现技术进⾏数据分
析以实现商业价值。
2. 可视化(Visualization),是利⽤计算机图形学和图像处理技术,将数据转换成图形或图像在屏幕上显⽰出来,再进⾏交互处理的理
论、⽅法和技术。
3. Tableau 作为 BI ⼯具的优势
1. 图代替表
2. 动态图代替静态图
3. 多维图代替⼆维图
4. 可交互
5. 可操作
2. 探索 Tableau
2.1 初识 Tableau Desktop
2.1.1 Tableau 家族产品
2.1.2 Tableau 结构
1. 开始页⾯,导⼊数据
2. ⼯作表,可视化 idea 实现的地⽅。从上到下,从左到右依次是:
菜单键,数据 tab,分析 tab,页⾯,筛选器,标记卡,⾏列,画图,智能显⽰
3. 仪表板,是多个⼯作表汇总,依照⼀个主题汇总,表之间可以联动
4. 故事板,就是 prentation,是多个⼯作表、多个仪表板按照⼀定的逻辑串联起来的 PPT:
2.2 Tableau 分析步骤
1. 连接数据
2. 数据源预处理
3. 在⼯作表⾥开展可视化
4. 在新的⼯作表开展可视化
5. 在新的⼯作表⾥再开展可视化
6. …
7. 汇聚成⼀个仪表板
8. 还可以⽣成⼀个故事板
3-6 都是数据探索,不停的探索和发现
3. 连接数据
3.1 ⽀持导⼊的数据类型丰富多样
3.1.1 Excel 导⼊
如果只有⼀个 sheet,默认为该数据;
可以⾃动读取多个 sheet 页;
3.1.2 Csv 导⼊
可以⾃动读取同⽬录源下多个⽂件
3.1.3 Txt 导⼊
可以⾃动读取同⽬录源下多个⽂件,同 csv 格式
3.1.4 MySQL 导⼊
3.1.5 复制粘贴
复制所需数据,进⼊ Tableau 使⽤ Ctrl+V
3.2 数据预处理
3.2.1 规整数据
数据解释器:去除空⾏、标题等,智能识别数据表格;它可以检测并绕过标题、注释、页脚、空单元格等内容,从⽽确定数据集中的实际字段和值
3.2.2 数据格式设置
⽂本转⽇期
⽂本转数字
3.2.3 字段设置
列拆分:对有分隔符的列进⾏拆分,增加数据信息
转置(数据透视表):*选中同⼀维度的多个标题列,转化为⼀列 —这是个不常⽤但⾮常有⽤的知识点
隐藏:隐藏不需要列
重命名:规范命名(数据源:多列转⼀列)
3.3 数据联接
根据相同列字段、列合并(类似 Excel 的 vlookup,MySQL 的 join,Pandas 的 merge)
3.3.1 联接⽅式(how)
左联接
右联接
外联接
内联接
3.3.2 联接字段(on)
⽤已有的字段联接
*⽤计算字段联接
3.4 数据并集
生日快乐数据列⼀致,对⾏进⾏合并(类似 MySQL 中的 union,Pandas 中的 concat)直接拖拽(对 excel 不适⽤)
新建并集
通配符新建并集:⽂件批量合并—这是个不常⽤但⾮常有⽤的知识点
3.5 数据源管理
3.5.1 数据源的两种读取⽅式
实时连接:和本地数据源联动,随着本地表的更新⽽更新;适⽤于⼩数据,临时数据分析
数据提取:提取成 Tableau 数据库格式,可以按照某字段增加新数据;适⽤于⼤数据,定期数据分析创建数据提取
筛选(类似于 MySQL 中的 where,是最优先级筛选)
聚合
⾏数
数据另存为 hyper 格式数仓
春散文刷新数据提取
3.5.2 数据源维护的 N 种⽅式
查看数据
数据刷新
替换数据
关闭数据源
寸和英寸保存数据
3.6 数据源合并(混合关系)
3.6.1 数据源合并和数据表联接的区别
数据源合并是多个数据源之间的联接
数据表联接是⼀个数据源下表的联接
有两个及以上数据源,两个源之间要通过⼀个或多个字段实现列合并
3.6.2 如何创建混合关系?
顶部菜单栏”数据“ >> 编辑关系
蓝⾊的是主源,黄⾊的辅源,红⾊的纽带代表已成功联接的字段,灰⾊的纽带代表未联接成功的字段
4.初阶可视化
4.1 直接拖拽
合适的图表配合适的数据;合适的数据配合适的图表;没有 low 图,没有⽆⽤的数据。
.
4.2 字段处理,贯穿在可视化⾥的润滑剂
4.2.1 维度和度量
维度包含定量值(例如名称、⽇期或地理数据)。您可以使⽤维度进⾏分类、分段以及揭⽰数据中的详细信息。维度影响视图中的详细级别。
度量包含可以测量的数字定量值。度量可以聚合。将度量拖到视图中时,Tableau(默认情况下)会向该度量应⽤⼀个聚合。
绿⾊度量和维度是连续的。连续字段值被视为⽆限范围。通常,连续字段会向视图中添加轴。
蓝⾊度量 和维度 是离散的。离散值被视为有限。通常,离散字段会向视图中添加标题。
改变度量数据显⽰格式:默认属性-数据格式
4.2.2 聚合和粒度
聚合:可⽤于度量的不同聚合确定单独值的聚集⽅式;对这些值进⾏加总 (SUM)、求平均值(AVG),或设置为单独⾏值中的最⼤值(MAX) 或最⼩值 (MIN)。
粒度:数据的不同聚合粒度。如果决定要以最详细的粒度级别查看数据,需要解聚;
良好的数据集是明细级别的数据,未聚合的数据,有丰富维度的数据!
4.2.3 基本的字段处理,点击操作即可
数据类型转换:⽂本转数字,数字转⽂本
度量、维度互转: 字段排序:
按照源排序,不要按字母排序 分⽂件夹管理字段:
如果字段过多,可以按类建⽂件夹 数据格式设置:
百分⽐设置;
复制字段:⼀个字段⽤做原始值,复制的字段⽤做衍⽣
⽇期类型转化和⼏种⽇期类型
4.2.4 下钻上卷的字段处理
下钻:数据明细,粗粒度到细粒度的过程,会细化某些维度
上卷:数据的汇总聚合,细粒度到粗粒度的过程,会⽆视某些维度
lect _ from table group by A;
lect _ from table group by A,B;
lect * from table group by A,B,C;
– ⾃上⽽下粒度变细,为下钻;
– ⾃下⽽上粒度变粗,为上卷
下钻上卷都属于细分分析,细分分析分为⾃上⽽下和⾃下⽽上
4.2.5 ⾼级的字段处理,⼿动创建
字段拆分:订单 ID 的信息拆分
分组:地区分组
创建集:
创建数据桶:是直⽅图的基础数据
创建新字段
医院锦旗
#创建参数
4.3 图表的⼏个重要组成
4.3.1 ⾏和列
西安特色菜添加⾏和列
维度字段排序:
老的组词度量指标聚合⽅式:
隐藏⾏和列
4.3.2 视图
**A. 字段标签**-添加到⾏或列功能区的离散字段的标签,⽤于说明该字段的成员。例如,“类别”是⼀个离散字段,它包含以下三个成员:“家具”、“办公⽤品”和“技术”。
B. 标题- ⼯作表、仪表板或故事提供的名称,系统会为⼯作表和故事⾃动显⽰标题。
C. 区/单元格-表⽰视图中所包括的字段(维度和度量)交集的数据。可以⽤线、条、形状、地图、⽂本等来表⽰标记。
学琴之路D. 图例-描述视图中的数据编码⽅式的图例。例如,如果您在视图中使⽤形状或颜⾊,则图例会描述每个形状或颜⾊所代表的项。
E. 坐标轴-是在将度量(包含定量数值信息的字段)添加到视图时创建的。默认情况下,Tableau 会针对此数据⽣成连续的轴。
F. 横坐标-字段名或标签-字段的成员名称。
**G. 说明**- 描述视图中的数据的⽂本。说明可以⾃动⽣成,并且可以打开和关闭。
⼀些必须掌握的交互操作:
突出显⽰
圈选
排除
隐藏和显⽰隐藏
查看数据和详细数据
复制粘贴数据

本文发布于:2023-07-29 04:39:39,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/89/1100481.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:数据   字段   数据源   度量   维度   联接   视图   分析
相关文章
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图