Posted 03 Jan 2018
图表”数据可视化”可以帮助用户理解数据,一直是热门方向。 图表是”数据可视化”的常用手段,其中又以基本图表—-柱状图、折线图、饼图等等—-最为常用。 用户非常熟悉这些图表,但如果被问道,它们的特点是什么,最适用怎样的场合(数据集)?恐怕答得上来的人就不多了。
条形图是最常见的图表,也最容易解读。 条形图位居最常见数据可视化方式之列。为什么?利用条形图,可迅速做出比较,一目了然地 揭示高低点。如果数值数据能够顺畅归入不同类别,那么条形图就尤为有效,便于您快速看 清数据中显示的趋势。它的适用场合是二维数据集(每个数据点包括两个值x和y),但只有一个维度需要比较。 年销售额就是二维数据,”年份”和”销售额”就是它的两个维度,但只需要比较”销售额”这一个维度。 条形图利用柱子的高度,反映数据的差异。肉眼对高度差异很敏感,辨识效果非常好。 条形图的局限在于只适用中小规模的数据集。 通常来说,条形图的X轴是时间维,用户习惯性认为存在时间趋势。如果遇到X轴不是时间维的情况,建议用颜色区分每根柱子,改变用户对时间趋势的关注。
使用情况:跨类别比较数据。示例:不同尺寸衬衫的量、按来源站点划分的网站流量、按分区划分 的消费比率。
折线图适合二维的大数据集,尤其是那些趋势比单个数据点更重要的场合。 它还适合多个二维数据集的比较。 和条形图和饼图一样,折线图也是最常用的一种图表类型。折线图可连接各个单独的数 值数据点。结果就是可视化数值序列简单、直接的方式。其主要用途就是显示一段时间 内的趋势。
使用情况:查看数据中随时间推移的趋势。例如:五年期的股价变化、一个月内的网页查看数、逐季收入 增长情况。
饼图是一种应该避免使用的图表,因为肉眼对面积大小不敏感。 饼图应该用来显示信息的相对比率(或百分率),仅此而已。但饼图往往遭到无节制的 滥用,置这一建议的限定情境于不顾。结果就是,饼图是误用最多的图表类型。 如果要比较数据,请让条形图或堆积条形图担当此任。请勿要求看图人把扇形边转换成相关数据 或者在饼图间相互比较。数据关键点将错失,看图人不得不非常费力。 一般情况下,总是应该用柱状图替代饼图。但是有一个例外,就是反映某个部分占整体的比重,比如贫穷人口占总人口的百分比
使用情况:显示比率。例如:花费在不同部门的预算、对调查的回答类别、美国人度过休闲时光方式的 细分情况。
一切和空间属性有关的分析都可以用到地理图。比如各地区销量,或者某商业区域店铺密集度等。 地理图一定需要用到坐标维度。可以是经纬度、也可以是地域名称(上海市、北京市)。 坐标粒度即能细到具体某条街道,也能宽到世界各国范围。 无论是邮政编码、州简称、国名,还是自定义地理编码,有任意一种位置数据的情况 下,您都需要在地图上查看数据。没有地图(或者说 GPS)的情况下,您不会离开家找 新餐馆吧?因此,要从数据获取同样信息丰富的图景。
使用情况:显示地理编码数据。示例:按州划分的保险索赔、按国家划分的出口目的地、按邮政编码划 分的车祸、自定义销售区域。
散点图适用于三维数据集,但其中只有两维需要比较。 想要再深入挖掘一些数据,但不确定不同信息的关联方式,或者是否有关联。散布图是 大概了解趋势、集中度、极端数值的有效方式,可指导您应该进一步把考察工作着重在 哪一方面。 为了识别第三维,可以为每个点加上文字标示,或者不同颜色。
使用情况:考察不同变量之间的关系。示例:男女在不同年龄得肺癌可能性的比较情况、技术较早与较 晚接纳者的智能手机购买模式、不同地区不同产品类别的配送成本。
甘特图对于说明项目各元素的起始与终止日期效果非常好。符合实现对于项目的成功非常重要。 清楚看到需要完成的内容和截止时间,对实现这一点非常关键。这就是该用到甘特图的时候了。 尽管大部分人把甘特图与项目管理联系到一起,它们还能用来理解随时间推移人员或机器的变化 情况。举例来说,您可以用甘特图进行资源规划,以查看达到具体里程碑需要多久,例如认证级别、 随时间推移的分布情况等。
使用情况:1.显示项目进度。例如:说明关键可交付成果、所有者、截止期限。 2.显示随时间推移的其他事物使用事项。例如:机器使用的持续时间、团队成员有空与否。
气泡图是散点图的一种变体,通过每个点的面积大小,反映第三维。 因为用户不善于判断面积大小,所以气泡图只适用不要求精确辨识第三维的场合。 如果为气泡加上不同颜色(或文字标签),气泡图就可用来表达四维数据。 气泡图不是自成一类的可视化,而应视为强调散布图或地图上数据的手段。气泡图不是 自成一类的可视化,而应视为强调散布图或地图上数据的手段。我们使用旗袍的原因是 圆圈的不同大小揭示数据的意义。
使用情况:显示数据沿两个轴的集中度。例如:按产品和地理划分的销售集中情况、按院系和一天中时 间段划分的课程出勤情况。
希望查看数据的跨组分布情况时使用直方图。举例来说,您有 100 只南瓜,希望了解有多少只 是 2 磅或以下,多少只 3 到 5 磅,多少只 6 到 10 磅等等。把数据分组到这些类别中,然后 然后使用直条形沿一根轴标绘,就能看到南瓜的重量分布情况。在以上过程中,直方图也就创建 了出来。 有时候,您不必知道哪种归类方法对数据有意义。您可以使用直方图尝试不同方法,确保创建的 组大小均衡,与分析相关。
使用情况:了解数据的分布情况。示例:按公司大小划分的客户数量、学生的考试成绩、产品缺陷频率
设定了目标并希望参照目标跟踪进展时,靶心图就是理想之选。就其核心而言,靶心图是另一种 形式的条形图。其设计宗旨是替代仪表板量具、仪表和温度计。为什么?因为这些图像一般不能显 示足够的信息,并且需要占用宝贵的仪表板空间。 靶心图将主要度量值(比如年初迄今收入)与一个或多个其他度量值(比如年收入目标)比较,并 且以明确的绩效指标为背景(例如销售配额),呈现比较情况。通过靶心图可立即看清主要度量 值相对于总体目标的表现情况(例如某个销售代表距离完成年度配额还有多少)。
使用情况:参照目标评估指标表现。例如:销售配额评估、实际花费与预算的比较情况、绩效优劣范围( 优/良/差)。
突出显示表让热点图更进一步。除了用色彩显示数据的交叉情况外,突出显示表还在上方 添加数字,提供更多详细信息。
使用情况:提供热点图相关详细信息。例如:不同细分市场占总体市场比例、按特定地区中代表划分的 销售数字、不同年份中的 城市人口。
是否希望一目了然看清您的数据,发现不同部分与整体的关系?那么,树形图就非常适合您。 这些图表使用一系列的矩形,嵌套在其他矩形内,以相对于整体的比例显示分层数据。 顾名思义,把这种图表中的数据想成一棵树:每根树枝都赋予一个矩形,代表其包含的数据量。 每一矩形再细分为更小的矩形(或者分枝),仍然以其相对于整体的比例为依据。通过各个矩形 的大小和色彩,您往往可以在数据的各个部分(甚至是类别)间看到某些模式,例如某个特定项 目是否相关。树形图还能有效利用空间,便于您一目了然地看到整个数据集。
使用情况:以相对于整体的比例显示分层数据:例如:各个电脑主机的存储空间使用情况,管理技术支 持案例的数量与优先级,比较各年份之间的财务预算。
箱线图一般人了解的不多,它能准确地反映数据维度的离散(最大数、最小数、中位数、四分数)情况。 凡是离散的数据都适用箱线图。 绘制箱线图,新人需要了解统计的基础概念:最大值,最小值,中位数,四分位数。这个会在后续讲解。 是否希望一目了然看清您的数据,发现不同部分与整体的关系?那么,树形图就非常适合您。 这些图表使用一系列的矩形,嵌套在其他矩形内,以相对于整体的比例显示分层数据。 顾名思义,把这种图表中的数据想成一棵树:每根树枝都赋予一个矩形,代表其包含的数据量。 每一矩形再细分为更小的矩形(或者分枝),仍然以其相对于整体的比例为依据。通过各个矩形 的大小和色彩,您往往可以在数据的各个部分(甚至是类别)间看到某些模式,例如某个特定项 目是否相关。树形图还能有效利用空间,便于您一目了然地看到整个数据集。
使用情况:显示一组数据的分布情况:例如:一目了然地理解数据,查看数据如何向某一段偏斜,查看数 据中的异常值。
热力图需要位置信息,比如经纬度坐标,或者屏幕位置坐标。 热点图是使用色彩跨两个类别比较数据的理想方式。作用是快速看清两个类别的交集哪 里最强,哪里最弱。
使用情况:显示两种因素间的关系。例如:目标市场客户群分析、跨区域产品采用情况、按个人代表划分 的销售线索。