本文摘自 《鲜活的数据 数据可视化指南》这书里。 这本书还是不错的,作为可视化数据入门的书还是很好用哒,其实书里就告诉你一些工具怎么用,然后是一些简单的统计学知识。看完这本书应付平时一些简单的数据可视化工作,在朋友面前露几手应该是没有问题的。。
如果想在可视化数据方面进阶的话,还需要统计学 和 一些图标制作方面的知识。- 收集数据
1. 搜索引擎: wolfram.com
2. 向媒体记者讨要。 3. 大学资源 data and story library, DASL http://lib.stat.com.edu/DASL Berkeley Data Lab HTTP://sunsite3.berkeley.edu/wikis/data/ 4. 综合数据类应用 freebase: www.freebase.com Infochimps : infochimps.com Numbrary : Numbrary.com AggData : aggdata.com Amazon Public Data Sets : aws.amazon.com/publicdatasets 维基百科 5. 专题性数据 地理:TIGER / OpenStreetMap / Geocommons / Flickr Shapefiles 全球: Global Health Facts( globalhealthfacts.org ) UNdata ( data.un.org ) World Health Organization ( who.int/research/en/ ) OECD Statistics ( stats.oecd.org ) World Bank ( data/wordbank.org ) DATA.GOV 6.自动收集数据的python 函数库:Beautiful Soup- 处理数据
1. Google Refine
2. Mr .Data Converter 数据格式转换。 支持XML / JSON / CSV /EXCEL 3. Mr.People 功能同上,新增名字处理功能。- 数据可视化工具
把数据呈现出来的工具
1. excel 2. Google Spreadsheets 3. Many Eyes. IBM Visual Communication Lab 主导的一个项目。比较酷。 4. Tableau Software ..面向windows的程序。- 自己写一个可视化工具:
1. python: NumPy 和 SciPy ( numpy.scipy.org ) —— python 科学计算模块
NumPy 是一个数据处理函数 SciPy 是科学研究用额函数库,再Numpy的基础上开发。 2. Sparkline PHP图形函数库 ( sparkline.com ) 3. Processing.. 适合设计师和数据艺术家用的轻量级编程语言,很容易上手。 4. Flash 和 ActionScript.. 适合大多数网页 5. 关于web的工具: Protovis / jquery的Sparklines插件 / Polymaps ( javascript地图函数库) 6. R. 统计学家开发,面向统计学家的编程语言。