一、基础描述性统计命令
summarize 计算变量的均值、标准差、最小值、最大值等基本统计量。
示例:`summarize age` 将输出年龄变量的描述性统计结果。
tabulate
生成频数表,可显示变量的唯一取值及对应频数。
示例:`tabulate gender` 将列出性别变量的频数分布。
xtsum
面板数据描述性统计工具,计算每个个体在多个时间点的均值、标准差等。
二、扩展描述性统计命令
xttab
面板数据交叉表工具,可计算不同组间的频数和百分比。
describe
与summarize类似,但提供更详细的统计量(如分位数、偏度、峰度)。
correlate
计算变量间的相关系数矩阵,用于分析相关性。
pwr
用于样本量计算,可预估达到特定统计功效所需的样本量。
三、分组与格式化
by子句
按指定变量分组后计算统计量,例如:
`summarize income by region` 将按地区分组计算收入均值。
format选项
自定义输出格式,如保留小数位数:
`summarize age, format(%6.2f)` 将年龄结果保留两位小数。
tabstat
结合分组与统计量计算,例如:
`tabstat income by region, stat(mean sd min max)` 将按地区分组并显示收入相关统计量。
四、其他相关命令
sort & bysort: 按变量排序数据,`bysort` 支持分组排序。 replace
outreg2:将描述性统计结果导出为Word文档。
建议根据数据类型和分析需求选择合适命令,面板数据需先通过`xtset`设置结构。对于复杂分析,可结合`summarize`与`tabulate`等命令获取多维度信息。