Stata如何删除地址重复的个案,只保留id最小的那个观测?

五一前正在出差去贵州的高铁上接到一位EpiMan坛友的咨询,具体内容如下: 我想实现“删除地址重复的个案,只保留id最小的那个观测” Stata code怎么写啊?我在网上看的code 是给重复观测 重新分配一个随机数 然后删掉随机数>1 的 不太符合要求。 id addr keep 3 2 Y 4 2 N 5 2 N 1 1 Y 2 1 N 6 3 Y...

利用Stata的正则表达式实现提取字符串的任务

有位坛友在日常工作中碰到一个提取字符串的难题:提取两字符“\”和“.”之间的字符串,然后提取其中的信息。举例如下:路径名称为“D:/项目/2022年/项目工作/区县报表/更新纠错后\九龙区-2022年10月-二次供水.xlsx”,欲提取的信息为“九龙区-2022年10月-二次供水”,然后还想提取区名:九龙,年份:2022,...

Stata如何使记录第一行成为变量标签?

有时在Excel整理数据时,会把第一行写为变量名,第二行写为变量标签。在导入Stata中时,第一行可以自动转化为变量名,但第二行标签会在导入时成为第一行记录。 山东大学经济研究中心的Kerry Du开发了Stata社区命令labone,可以便捷实现这一功能。 安装Stata社区命令labone: ssc install labone, re...

Stata如何识别几年(不一定连续)的变量数据的样本?

前面我们介绍了如何识别至少有几次连续数据和有且仅有几次连续数据的实现方式,那么大家很自然就会想到,如果不要连续会怎么实现? //读取演示数据 clear input id year Lian 1 2020 11.11 1 2021 22.22 1 2022 33.33 2 2020 9.88 2 2021 8.99 2 2022 9.99 3 2020 7.77 3 2022 8.88 4 2021 8.88 4 2...

Stata如何识别连续几年(如仅3年)的变量数据的样本?

上一次提到如何使用Stata社区命令xtpattern和Stata自身函数实现如何识别至少连续几年的变量数据的样本,实际工作中有可能还存在其他情况,如有可能你不需要至少连续3次的数据,你需要且仅需要连续3次的数据,该怎么办呢? 演示数据如下: //读取演示数据 clear input id year Lian 1 2020 11.11 1 2...

Stata如何识别至少连续几年的变量数据的样本?

有时候数据分析需要保留某个变量至少有连续几年观察值的记录,英国杜伦大学(University of Durham)的Nicholas J. Cox在2002年开发了一款Stata社区命令xtpattern,可以轻松实现该需求。 演示例子:如何保留至少连续三年有测量数据的记录? //读取演示数据 clear input id year Lian 1 2020 11.11 1...

Stata如何绘制小提琴图2?

瑞士伯尔尼大学(University of Bern)的Ben Jann开发了一款新的生成小提琴图的Stata社区命令violinplot,更为强大和灵活。 安装: //安装violinplot ssc install violinplot, replace //安装依赖包 ssc install dstat, replace ssc install moremata, replace ssc install palettes, replace ssc i...