规划工作中,尤其是项目研究、科学研究中,常常涉及大量的数据。如何才能高效地管理数据、处理数据呢?这里推荐使用Access数据库。
本文做简单的引入,具体涉及的方法技术,见本期其他推文。
Access是MicrosoftOffice套装中的一个,是一个面向个人的本地数据库。市面上还有很多其他的商业数据库等等,但是就小团队的研究而言,Access就很够了。而所谓数据库,通俗的讲是由一个个Excel表格构成的库。为什么不直接使用Excel,而非要用Access去储存呢?
举一个简单的例子,在某个城市研究中,涉及的数据有:
1)该城市所有居住区数据(名称、面积、位置、建设年代);
2)问卷调查数据(受访者住区名称、性别、年龄、家庭收入……);
直接对应的表:
1) 居住区信息表(根据住区名称组织)
2) 问卷信息表(根据问卷受访者编号组织)
如果我们要做一个受访者基本情况的介绍,比如各个小区有多少人,对应的性别、年龄、收入情况如何——我们可以用Excel很轻松的解决,因为所有信息都在“问卷信息表”里,[数据透视表]这个功能很容易解决。
如果我们要分析受访者行为和他所居住小区的建设年代是否有关(老旧小区、新建小区等等)——信息虽然在两个表中,但我们照样可以用Excel解决,一个简单的Vlookup函数就可以了,=Vlookup(问卷表.居住区名称,住区表.居住名称,住区表.住区年代,精确匹配)
如果,我们想研究受访者行为和小区周边的公交线路数目是否有关,怎么办?我们希望得到的是这样一个表,比如:
受访者编号 | 受访者信息 | 所在小区 | 小区年代 | 通向某地的线路数 |
---|---|---|---|---|
1 | 月收入 | xx小区 | 90年 | x条 |
…… | …… | …… | …… | …… |
首先我们需要增加一个数据,交通站点数据(站点名称、坐标、线路数目、靠近的居住区名称)
现在表格增加到三个:
1) 居住区信息表(根据住区名称组织)
2) 问卷信息表(根据问卷受访者编号组织)
3) 交通站点信息表(根据站点名称组织)
(交通表如何得到不简单呐,先假设有人给了)
我们需要的信息分散在三个表中,接下来呢?——的确,我们可以通过多次Vlookup来集合所有需要的信息
如果我们研究分析的内容又增加了呢?表格增加到4个、5个……呢?我们需要的信息分散在4个、5个……中呢?
——Access来了,数据库的作用不仅仅是更好地管理各种表格,更重要的是——表格交叉查询
当然了,它还有很多的其他实用功能。
可以说,规划研究中大数据量的、尤其是涉及地理空间数据的,都建议使用Access数据库进行数据的管理和处理。