|
数据使用向导
你对决定男性与女性开始吸烟的平均年龄感兴趣吗?如果你需要知道不同地区的结婚年龄是否不同,或者不同年龄、性别、教育水平、种族指尖政治态度的差异。这些问题还有其他数清的问题可以
对ICPSR保存的数据进行研究得到解答。
请注意ICPSR不提供出版物、报告或者统计表格,我们只提供用于出版和的数字形式的原始数据。如果查看其他人已经发表的成果,选择“相关报告及文献,这些文献链接在搜索结果页面中与已有的数据系列上,或者在每一个研究描述中。这样,可以为您提供根据数据的研究成果,如果可能的话,还有与研究报告在线链接。
概述
在开始一项与数据分析相关的项目之前,首先需要查找能够回答研究问题的数据,把这些数据下载,然后在个人的计算机上用自己的软件完成简单的统计过程(*),或者您可以选择ICPSR网站上的可用数据使用在线数据分析系统进行分析。
虽然很多ICPSR的数据中提供了SAS, SPSS和Stata格式文件,但是使用这些在线分析系统需要您有基本的统计技巧,在您自己的分析中,还需要更高级的技能。
ICPSR的资源中包括一些时间序列和其他类型的数据集合,这些资源主要是由一些来源于调查、人口普查和行政管理的数据记录。这些数据最初是为一些特殊的研究或者行政管理的目的收集的,然而,这些数据还具有比最初的收集时的研究的潜质。ICPSR保存这些有价值的数据资源,把它们公开并用于二次分析。
ICPSR的数据资源包括6300个研究,50万个文件,广泛覆盖了社会科学领域,其中包括人口、经济、健康、社会和政治行为、社会和政治态度、历史、犯罪、人口老化以及药物滥用。
术语,格式和统计词汇表
在开始使用ICPSR数据之前,我们建议您先熟悉这个网站中常用的方法上的术语。如果你需要社会科学术语或者基本的计算词汇,我们强烈推荐您参考下面的资源:
搜索查找您所需要的数据
如果您早已经有您需要的数据的信息,例如某一个调查的题目或者主要调查者的名字,就可以使用ICPSR首页上或者在数据访问与分析页面中的“搜索”功能。但如果您没有线索或者更愿意在某一特定领域中探求可用的数据,您最好的选择是通过“主题”开始浏览数据。如果您找不到与您所查找有关的主题的描述,您可以考虑ICPSR的“辞典”,那里提供了一个范围较广的社会科学主题词表。
如果您的搜索结果太多或太少,强烈建议您浏览“搜索常问问题”网页。
搜索结果是以数据系列和文本的列表形式出现的.那些有可以下载数据的研究有一个“描述”和“下载”的链接。(也可以在CD-ROMs、系列数据描述和其他ICPSR网站中的网页中进入。)
例二:搜索结果屏幕

通过“描述”链接可以看到相应的研究描述,这些描述中提供了数据的内容摘要、范围、时间以及其它细节,帮助您决定适合您研究的数据。
“下载”链接引导您到可以下载的数据列表和文本文件页面。
“相关文献”连接的是根据某一数据所发表的书目清单。
“在线分析”只是针对那些可以进行在线分析的研究数据,同时直接进行在线分析或者列出与某一特定研究相关的在线分析成分。
一旦选择分析某一数据,就可以进行"访问数据"
访问数据
访问数据的程序根据下载的数据的类型以及用户是否是ICPSR会员而有所不同。注意,所有的ICPSR的技术文档对所有的用户免费使用。
特殊主题数据档案
ICPSR大部分的数据档案通过ICPSR会员支持都可已获得并且进行数据的加工,ICPSR会员机构中的个人可以下载。保存的数据通过主题档案来使用,这些是由联邦政府资助的,所以这些数据可以对一般的公众自由使用。不管研究是由谁资助的,文本文件都可以自由使用,如果数据不能自由使用,在下载页面将出现“只提供说明文档”。
您的机构是ICPSR会员吗?
您可以查看"会员机构"名单,如果您的机构不是会员,您可以通过netmail@icpsr.umich.edu联系ICPSR的“用户支持机构”
ICPSR 指导
如果您所在学校是会员,您的学校大多会参与ICPSR的指导项目,ICPSR指导是一项提供直接获得ICPSR数据资源的服务,这项服务面向所有的学生、机构和ICPSR会员单位的成员。如果您的机构是会员但还没有加入ICPSR指导项目中,请与您的官方代表(OR)联系,OR的名字、EMAIL地址可以在ICPSR会员名单中找到。您的OR也可以直接对您提供数据,或者安排您的机构与ICPSR
Direct 签约。
我的数据
如果您是第一次使用IPCSR Direct的用户,我们会要求您创建一个MYData的帐户。注册您的MYDATA帐户、开始同意遵守ICPSR的使用责任声明。在您以后访问我们的网站开始下载数据时,您会被要求输入您的E-mail地址和MYData的密码。
限制使用数据
由于数据本身的敏感性,有些数据有一些额外的限制,在这种情况下,ICPSR会要求用户签署限制数据使用协议,以便于在特定的时间范围内有权使用数据。如果您希望下载的研究数据是受限制的,需要阅读"访问受限数据的程序"。
下载
下载界面通过一系列的步骤第一步列出可用数据的格式,第二步是这项研究的数据集合,完成选项后使用第三步的按钮在您的Data Cart添加文件。第四步可以回顾cart中的内容,或者是直接点击第五步的按钮下载包含了您选中的文件内容的压缩文件夹。
如果您不能确定这个研究是否适合您的需要,您可以首先浏览一下codebook或点击“浏览文本”进入其它的文本文件,
例三:下载屏幕

注意从ICPSR中下载数据,您需要同意在收到数据后不与其他没有获准使用数据的人使用。您还要同意ICPSR的“使用责任声明”中的指定条款。
在准备下载数据时查阅描述文件也是有帮助的。描述文件中包括对此项研究的一般性说明,有时还会提供文件格式的重要信息以及关于数据的其他特点。
使用统计软件分析数据
如前所述,统计软件可以有效地数据文件中定义、处理和摘录的变量和记录。进一步的解释和分析数据需要有基本的统计技能并具备使用统计软件的一些知识。社会科学的学生通常在大学的头两年学到这些知识。
ICPSR大多数研究都有Setup文件,用户可以把它们读入统计软件包的数据文件。现在提供的SETUP文件包括社会科学比较常用的SAS、SPSS以及STADA几种分析软件。
SAS、SPSS和STADA格式的文件既可以在统计软件中的编程使用,也可以在WINDOWS,配套软件使用。以下的介绍解释了SAS,
SPSS和Stata 格式文件的不同构成。特定目的的SETUP文件不一定包括以下的所有命令。
小的数据文件也可以在EXCEL等电子表文件中分析。在EXCEL中,以文本形式打开数据文件,使用“文本导入向导”来定义及合并变量。然后把变量名称编码文件中复制或者从SETUP文件中复制。汇总和分析数据可以点击“工具”中的“数据分析”,然后从菜单中选择适当的统计程序。
使用数据分析系统进行(DAS)在线分析
为了使更多的人能够充分利用数据资源,ICPSR使用非常友好的“在线统计分析系统”(DAS)。经过挑选的ICPSR收集的数据,主要是那些特殊主题的数据档案,现在用来进行在线分析。这意味着用户不必下载数据文件、不需要熟悉特定的统计软件就可使用特定的统计程序开发数据。。另外,DAS对于熟练使用某一统计软件的用户提供非常有用的选择:用户可以创建某些记录或变量的特定的子集,然后下载到自己的电脑中。在数据文件很大但只对有一定年龄、性别等部分变量,这项选择非常有用。
ICPSR的在线分析系统是在一个“调查文本与分析”的系统(SDA)提供的,SDA是由加利福尼亚大学伯克利分校开发和维护的计算机辅助调查方法程序(CSM)
在线数据分析主要是推荐给对以下内容感兴趣的用户:
- 在数据集中搜索感兴趣的变量
- 初步浏览关键变量的频数分析和统计概要来决定进一步分析
- 缺失数据的频数回顾或统计摘要
- 生成报告使用的简单统计概要
- 生成原始数据的统计表
- 在下载到个人计算机中时从收集的数据中创建一些记录或变量的子集可以节约时间和空间
ICPSR目前在所有的研究使用SDA 2.1版分析软件,这个版本可以使用户:
- 浏览数据集的代码文件
- 完成一定的统计程序,例如:
- 显示个案记录的值
- 频数分布
- 交互表
- 均值比较
- 相关矩阵
- 一般最小二乘法回归
- 为频数分布及交互表创建统计图,包括条形、线性和饼图
- 字段操作
- 为选定字段与记录生成特定子集
- 下载子集,包括:
- 有特定分隔符的ASCII数据文件
- SAS、SPSS,或Stata格式文件
- 选定子集的定制代码文
使用数据分析系统,点击出现在搜索结果中下载页面或描述页面的在线分析链接。也可以浏览"可用于在线分析的数据"列表如前所述,只有选定的ICPSR收集数据可以用于在线分析。如果发现您需要的数据在列表上,只需要点击数据的名字,然后按照网页提示,进入您需要的数据集的DAS菜单。
下面的例子选自于“一般社会调查1972-2000年:[累计文件]”
例1 选定一个25-70岁的受访者的子集,访问时间是在1990年以后
输出结果:
数据文件
例2:一般社会调查1972-2000收入均值比较
也可以在在查看伯克利在线用户帮助系统(Berkeley online help files for users),ICPSR使用的数据分析系统只是面向普通文件,可以进入特殊主题档案网址(DAS可用数据列表)。DAS研究名单不久将扩展到包括在一般数据档案中的数据文件。
需要更多的信息吗?
如果您还有更多的问题,请阅读“帮助文件”或点击“Need
Help?”链接,这些将为你提供ICPSR员工的联系信息,以及您当地的ICPSR代表。
|