Stata如何获取一个变量的不重复记录数?

分类变量的值如果少的话,可以tabulate一下人工数一数就出来了,比如年龄组、性别,但如果变量值很多的话,数数就很容易出错了,也不现实。 一眼可以看出,region下有四个区,Stata代码如下: sysuse census tabulate region 如果很多的话,Stata代码如下: *tabulate后内存中保留结果r(r) 行数;r(...

Stata如何快速查询唯一变量组合?

系统自带的isid 用来判断某个变量或某些变量组合是否唯一,是的话可以生成一个uniqueid,便于以后的数据分析。但如何快速判断哪些最小变量组合唯一呢?美国西北大学凯洛格商学院 (Northwestern University Kellogg School of Management)的Riccardo Marchingiglio开发了Stata社区命令findunique,用...

Stata如何将数据转码为utf-8格式?

Stata14开始支持Unicode字符,变量、标签、注释及变量值均可以为中文(日韩德等等)了。之后版本若直接读取Stata13及之前的文件( .do 文件和.dta 文件一般为 gbk 或更广泛的gb18030 编码)会显示乱码,影响使用,Stata提供了unicode命令进行转化,简单介绍如下。 使用 Stata 13 及早期版本保存的 d...

Stata如何实现在某变量特定值后插入新行?

想在keys字段特定的字母“f”后插入一新空行。具体而言,只要某条记录keys变量的值出现“f”,就在该记录后插入一条空记录,Stata的演示数据如下: /*读取演示数据*/ clear input byte num str1 keys 1 "a" 2 "b" 3 "c" 4 "d" 5 "e" 6 "f" 7 "a" 8 "b" 9 "c" 10 "d" 11 "e" 12 "f" 13 "a" 14 "b" 15 "c" ...