stata描述性统计命令

时间:2025-03-30 13:45:47 计算机

一、基础描述性统计命令

summarize

计算变量的均值、标准差、最小值、最大值等基本统计量。

示例:`summarize age` 将输出年龄变量的描述性统计结果。

tabulate

生成频数表,可显示变量的唯一取值及对应频数。

示例:`tabulate gender` 将列出性别变量的频数分布。

xtsum

面板数据描述性统计工具,计算每个个体在多个时间点的均值、标准差等。

二、扩展描述性统计命令

xttab

面板数据交叉表工具,可计算不同组间的频数和百分比。

describe

与summarize类似,但提供更详细的统计量(如分位数、偏度、峰度)。

correlate

计算变量间的相关系数矩阵,用于分析相关性。

pwr

用于样本量计算,可预估达到特定统计功效所需的样本量。

三、分组与格式化

by子句

按指定变量分组后计算统计量,例如:

`summarize income by region` 将按地区分组计算收入均值。

format选项

自定义输出格式,如保留小数位数:

`summarize age, format(%6.2f)` 将年龄结果保留两位小数。

tabstat

结合分组与统计量计算,例如:

`tabstat income by region, stat(mean sd min max)` 将按地区分组并显示收入相关统计量。

四、其他相关命令

sort & bysort:

按变量排序数据,`bysort` 支持分组排序。

replace:替换变量值,例如:`replace age = age + 1` 将年龄加1。

outreg2:将描述性统计结果导出为Word文档。

建议根据数据类型和分析需求选择合适命令,面板数据需先通过`xtset`设置结构。对于复杂分析,可结合`summarize`与`tabulate`等命令获取多维度信息。