我喜欢数据并将它广为人知。
如果您最近和我参加聚会我在您耳边说的都是有关数据可视化工具或者最近使用的酷R包对此我在这向您表示歉意。
如果您和我玩范特西游戏欢迎您来到图表世界这里有很多的图表。
不要为越来越频繁地听到下面的问题感到惊讶“Nick我想走向数据分析和数据可视化我应该从哪里开始
不幸的是没有一个完美的答案适合所有的人–每一个人的需求不同且人们已经知道的东西相差很大。但令我高兴的是一件关于最近科技/教育/商业环境事情
来自不同职业道路和背景的聪明人都对自己说“我需要从数据中得到更多”。
但是在很多初学者沟通后发现了的共性。很明显这些共性不是适合每一个人的
一个老练的工程师会嘲笑共性上说的第一时间学习Java脚本或者Python。
早已知道D3.js 的人会疑惑选择哪一个可视化工具或者疑惑怎么样将数据驱动转换应用*的3D中
这些适合想进一步了解接近数据可视化的学术科学家、学校老师、研究咨询师、项目经理、失业快乐族或者MBA毕业生……。
如果符合你我认为你应该开始于从“无编码”有计划地学习到“爱编码”。
无编码
首先如果你对excel一无所知这是值得去做的。严肃地告诉你至少得学会透视表听起来有些差劲但是Excel能做很多超乎人们想象的事情。如果你善于尝试Excel甚至能做出很多漂亮的图表。
如果你已经有一些数据仅仅想用一个好的工具来探索可视化或者输出更多引人注目的图表。Tableau 就很流行、功能惊人它有免费的公共版和一个十分昂贵费用的付费版
不过如果你是学生就可以享受到免费版。它一般会在网上或者论文上以静态图表形式发布也可以传送到Instagram上或者以墙图输出。在它的官网上可以找到很多模板激发你的灵感。
遗憾地是将要探讨的另一个工具–Infoactive,可惜已经下架了但没关系Tableau吸收了Infoative所有优点。这个意味着Tableau很有可能是未来公认的好工具。我将牵头一本免费的书它是Infoactive团队带领下涉及数据可视化设计工具的背景资料下面谈论的任何工具:
数据+设计
一个简单有关准备和可视化信息的说明介绍
简单编码
如果要选择一款独立的程序语言来操作单机数据我会选择R语言。因为R语言是免费的且支持大量的在线开发加载有用的*基础语言程序包并且有大量的免费资源学习如何运用它。在这些资源中–我极力推荐Coursera课程
数据科学家证书|课程
约翰霍普金斯大学验证通过的数据科学专业化专家成为数据科学家*谈论……
它们可能会抹杀一个真正的初学者但是课程能带你走出一条重要数据科学项目和想法的路线通过所有的方式探索数据分析它涵盖了有用的R包例如ggplot一个十分受欢迎的可视化工具的交互性通过Shiny和数据故事发布在网页上。
R是我最常用来处理小型快速的分析和数据可视化工具–如果有一个数据数据量大、不易于可视化Excel处理不了R最适合快速探索。
“是的你可能要学些一些SQL”另外一个快速入门的语言–SQL与R相比实际上这已经超出了苹果和苹果的比较SQL是一门比较有针对性的语言
如果你希望在数据库中用任何工具或者语言集成数据这将是一个很好的机会让你有学习SQL的兴趣。
爱编码
通常在网页上看到一个美好的交互式可视化界面都会浮现一个问题“我们要从何学起”。我着迷于这个创新的领域点击这可以看更多深入的调查)。
不幸地是如果你喜欢这些作品
一个机器学习的可视化介绍
让我们重新审视73英尺高的边界提出了我们的建议看看我们是怎样地提高直觉。明显地……
……它可以令你沮丧的发现还有多少东西需要自己学习。反复的实践以求得“《纽约时报》一样好”是一个艰难的目标值得但是困难。
幸运的是这里有很多帮助资源。
交互式的作品后面的逻辑库和很多在网页上运行的数据可视化作品都是Mike Bostock创作的D3.js。D3.js是一个很好的工具去学习作品网页发布和交互式。
博斯托克Bostock的网站是一个有关金矿的例子和教程网站你不需要筋疲力竭地从逻辑库的创建者学起……。
我也推荐Murry创建的网页版交互式数据可视化你可以从 O’Reilly 那购买或者网上在线免费使用:
网页交互式数据可视化
这是一个关于非程序员的编程数据可视化的书。如果你是一个拥有视觉技能的艺术家或图形设计师但没有从事数据或代码工作的先验经验这本书适合你。如果你是一个拥有大量数据的记者或研究人员但没有数据可视化或代码的先验工作这本书也适合你。
在线版本很好–你可以跟着书本本身编写代码脚本运行它并拿你的输出结果和模板比较。Murray 还特别为初学者量身定制这个网站能很好的引导初学者从HTML/CSS和Javascript基础到深入学习相对难的D3。
D3的地理空间可视化是一个值得一提的长处。D3擅长创造很多不同效果的地图,如果这是你的专业领域这里可以获得不错的专用教程
我以前让地图教程介绍了如何用D3和topojson做一个基本的地图现在是时候让它覆盖……
D3很难操作但也有工具能降低难度我建议使用最基础的D3而不是复杂的绘图程序如果你人觉得棘手那使用Plot.ly会更实际。
如果你要学万能的程序语言那Python是最适合。它功能强大目的性强很受欢迎。
我发现Python是一种极易上手且多用途的编程语言。但实际上如果你要做的是探索和可视化数据它会让你觉得吃力:例如Youtube就是用Python开发的……代码有一百万行。如果你想了解PythonCode Academy 课程是一个短且有趣的语言介绍。
最后和前面介绍的D3.js Javascript or ggplot R一样, Python也有很多资料库。最值得推荐的是Seaborn(建立在一个年长受欢迎的库,matplotlib)和Bokeh很有可能是一流的但是这是一个快速发展和提升的领域。Seaborn and Bokeh 的网站包括画廊展示你用这些工具创建的各种各样的可视化作品。
本文作者佚名
来源51CTO