微数据(统计)

调查和人口普查数据的研究中,微型数据是个人受访者级别的信息。例如,国家人口普查可能会收集年龄,家庭住址教育水平,就业状况以及许多其他变量,这些变量分别记录在每个回应的人;这是微数据。

优点

由于隐私原因和涉及的大量数据,调查/人口普查结果最常见于骨料(例如区域级别的就业率);一次人口普查的微型数据很容易包含数百万记录,每个记录都有数十个数据项。

但是,将结果汇总到汇总水平会导致信息丢失。例如,如果单独汇总教育和就业的统计数据,则不能用来探索这两个变量之间的关系。访问微数据可以使研究人员有更多的自由来研究这种相互作用并进行详细的分析。

可用性

因此,一些统计组织允许用于研究目的的微型数据。通常会强加控制该数据可能滥用该数据或导致隐私丧失的风险。例如,集成的公共用途微型数据系列要求研究人员执行安全措施,避免重新分布微数据,仅将微型ATA用于非商业研究/教育目的,并且不尝试识别记录的个人。删除了名称和高级的地理数据,一些数据项会根据需要进行更改,以使其无法识别个人,并合并了小民族类别。

国际家庭调查网络已制定了工具和指南,以帮助感兴趣的统计机构改善其微型ATATA管理实践。 Microdata管理工具包是DDI元数据编辑器,现在在大约80个国家 /地区使用,在加速数据计划的支持下,由巴黎21秘书处,世界银行和其他合作伙伴在Marrakech行动计划的背景下实施。统计数据。