首页 » 大数据 » 大数据可视化分析之Tableau

大数据可视化分析之Tableau

 

前两天看到一个朋友在自己做个excle去分析欧赔。其实在了解了大数据之后,可以使用大数据的一些分析工具进行分析。下面来看下什么是大数据,以及目前用的最多的一个分析工具

 

psb

大数据的核心不是“大”,也不是“数据”,而是蕴含在其中的商业价值。作为挖掘数据背后潜在价值的重要手段,商业智能和分析平台成为大数据部署中的关键环节。然而,获取价值的难点并不在于数据分析应用的部署,而在于专业数据分析人才的缺乏。市场研究机构IDC甚至认为,数据分析人才的欠缺可能会成为影响大数据市场发展的重要因素。

一、数据可视化概述

数据可视化是技术与艺术的完美结合,它借助图形化的手段,清晰有效地传达与沟通信息。一方面,数据赋予可视化以意义;另一方面,可视化增加数据的灵性,两者相辅相成,帮助企业从信息中提取知识、从知识中收获价值。

维基百科对数据可视化的定义较为权威,它认为数据可视化是技术上较为高级的技术方法,而这些技术方法允许利用图形、图像处理、计算机视觉以及用户界面,通过表达、建模以及对立体、表面、属性以及动画的显示,对数据加以可视化解释。

  1.发展历史

数据可视化的历史可以追溯到二十世纪50年代计算机图形学的早期,人们利用计算机创建出了首批图形图表。到了1987年,一篇题为《Visualization in Scientific Computing(科学计算之中的可视化,即‘科学可视化’)》的报告成为数据可视化领域发展的里程碑,它强调了新的基于计算机的可视化技术方法的必要性。

随着人类采集数据种类和数量的增长,以及计算机运算能力的提升,高级的计算机图形学技术与方法越来越多的应用于处理和可视化这些规模庞大的数据集。二十世纪90年代初期,“信息可视化”成为新的研究领域,旨在为许多应用领域之中对于抽象的异质性数据集的分析工作提供支持。

当前,数据可视化是一个既包含科学可视化,又包含信息可视化的新概念。它是可视化技术在非空间数据上新的应用,使人们不再局限于通过关系数据表来观察和分析数据信息,还能以更直观的方式看到数据及数据之间的结构关系。

2.市场调查

IT168网站在2014年3月进行了一项有关数据可视化的调查,从中可以看出,当前已经部署数据可视化的企业仅为15%,但有56%的企业计划1-2年内部署相关应用。从企业部署可视化的目的来看,排在前三位的分别为:通过可视化发现数据的内在价值(36%)、满足高层领导的决策需要(30%)和满足业务人员的分析需要(25%),仅有9%的企业选择需要更美观的展现效果。

分析零距离 数据可视化产品选型指南
▲数据可视化知名度、流行度和领导者调查

在针对Tableau、Qlik、Tibco software、SAS、Microsoft、SAP、IBM和Oracle八家数据可视化产品和服务提供商的调查中,笔者分别从知名度、流行度和领导者三个角度进行分析。从知名度来看,八家厂商几乎不分先后,只有微小的差距;从流行度来看,SAP、IBM和SAS占据前三位,所在比例分别为19%、18%和17%;从领导者来看,Tableau以40%的优势遥遥领先,这与2014年Gartner的魔力象限排名也非常吻合。

3.技术趋势

数据可视化的思想是将数据库中每一个数据项作为单个图元元素,通过抽取的数据集构成数据图像,同时将数据的各个属性值加以组合,并以多维数据的形式通过图表、三维等方式用以展现数据之间的关联信息,使用户能从不同的维度以及不同的组合对数据库中的数据进行观察,从而对数据进行更深入的分析和挖掘。

传统的数据可视化工具仅仅将数据加以组合,通过不同的展现方式提供给用户,用于发现数据之间的关联信息。近年来,随着云和大数据时代的来临,数据可视化产品已经不再满足于使用传统的数据可视化工具来对数据仓库中的数据抽取、归纳并简单的展现。新型的数据可视化产品必须满足互联网爆发的大数据需求,必须快速的收集、筛选、分析、归纳、展现决策者所需要的信息,并根据新增的数据进行实时更新。因此,在大数据时代,数据可视化工具必须具有以下特性:

(1)实时性:数据可视化工具必须适应大数据时代数据量的爆炸式增长需求,必须快速的收集分析数据、并对数据信息进行实时更新;

(2)简单操作:数据可视化工具满足快速开发、易于操作的特性,能满足互联网时代信息多变的特点;

(3)更丰富的展现:数据可视化工具需具有更丰富的展现方式,能充分满足数据展现的多维度要求;

(4)多种数据集成支持方式:数据的来源不仅仅局限于数据库,数据可视化工具将支持团队协作数据、数据仓库、文本等多种方式,并能够通过互联网进行展现。

1. Tableau Desktop

Tableau Desktop是Tableau公司开发的桌面系统中最简单的商业智能工具软件,Tableau没有强迫用户编写自定义代码,新的控制台也可完全自定义配置。在控制台上,不仅能够监测信息,而且还提供完整的分析能力。Tableau控制台灵活,具有高度的动态性。

主流数据可视化工具介绍

如上图所示,Tableau将数据运算与美观的图表完美地嫁接在一起。程序通过拖放将所有的数据展示到数字“画布”上,转眼间就能创建好各种图表。这一软件的理念是,界面上的数据越容易操控,公司对自己在所在业务领域里的所作所为到底是正确还是错误,就能了解得越透彻。

Tableau Desktop数据来源有多种方式,能同时支持Excel、支持各种数据库类型,同时能以web模式发布至网络中,以供别人访问。也支持团队协作,由多个人同时完成一件任务。

主流数据可视化工具介绍

如上图所示,Tableau Desktop有多种展现形式,操作人员能操作人员能够自定义图表类型,并以多种图形的方式进行展现,同时根据图形的不同,针对不同的展示图形有不同的提示。

当用户从Tableau Desktop完成图形的绘制后,数据会从数据库中进行自动更新,从而对展示的数据进行自动同步,同时Tableau Desktop中集成了趋势分析,能对数据未来的走向进行一定的趋势分析,同时Tableau Desktop也与地理信息等进行了较好集成。

在Tableau Desktop使用中发现,使用该软件操作反应较慢,由于该软件将数据全部加载至内存,因此对计算机的内存等使用要求较高。

同时Tableau Desktop的趋势分析模块中,用户无法根据自己的需求选择算法,用户从而无法根据自己的商业特性对未来进行一个预测。

原文链接:大数据可视化分析之Tableau,转载请注明来源!

1