我这里就不放百科的解释了,说说我自己的理解吧,就是将数据用图展示出来。
我现在给你一个表格,里面的数据是某个公众号在某个时间点来自不同省份的用户数。
现在请你告诉用户数最多的三个省份和用户数最少的三个省份,3秒钟内给我答案,你可以吗?
这样给你看数据呢?
那我不仅仅关注排名情况,我还希望看看粉丝分布的地理特征呢?
我想已经说明白了,为啥要进行数据可视化(用图来展示数据)了吧!
我认为数据可视化的难点在于选择合适的图表类型去展示数据。对应于这个难点,我后面会连载所有我见过的图表,它们与数据的对应关系的文章,这是图表类型选择的基础知识。
可用于做数据可视化的软件非常多,我们经常用的 Excel 就可以啊,特别是最新版的Excel2016,像微软家的Power BI 也能用。还有数据分析领域使用较多的R语言,Python 都支持丰富的图表类型。但是如果你没有编程基础,又想短时间内用到数据可视化,那必须得选择Tableau 啊,我在这里强烈推荐大家使用这款工具。这款工具非常成熟,不用自己考虑美化问题,它已经帮助你解决这些问题了,它还可以和数据库系统,Excel,R,Python 等工具打配合,大大提高数据分析过程中的效率。
这里提一下,由于数据可视化相关内容连载过程中会大量使用 Tableau,感谢tableau官方给我延长了试用期限。
图表的美化构建在合理的图表类型选择基础之上,关于图表美化,我也没有太多的心得,唯一要分享给大家的是——在灵活掌握数据和图表的映射关系的基础上,去模仿。比如经济学人的图表,麦肯锡的图表。
数据库——像常见的 MySQL,SQLserver,oracle,是数据分析中的利器,甚至有的公司就是用SQL来做数据分析,那么数据可视化分析如何跟数据库打交道呢?难道从数据库中导出,再导入?这太低效了。直接把数据可视化软件与数据库进行连接,才是高效进行分析的正确姿势。