微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

重建链接观察链

如何解决重建链接观察链

我有一个数据集,其中公司可以由人(类型 0)或其他公司(类型 1)拥有。 下面是一个例子:


* Example generated by -dataex-. To install: ssc install dataex
clear
input str1(firmid ownerid) str7 last_name byte type
"A" "B" ""        1
"A" "C" ""        1
"A" "D" ""        1
"B" "E" ""        1
"B" "F" ""        1
"E" "I" "Smith"   0
"E" "J" "Johnson" 0
"F" "G" ""        1
"G" "I" "Smith"   0
"G" "J" "Johnson" 0
"G" "H" ""        1
end

公司可以由其他公司所有,而其他公司又由其他公司拥有,依此类推。例如,A 归 B 所有,B 归 E 和 F 所有,等等。我想重建这些所有权链,直到我得到最终所有者(一个人,如 I 或 J,或拥有数据中没有所有者,如 C、D 或 H)。 最终输出将如下所示:


* Example generated by -dataex-. To install: ssc install dataex
clear
input str1(firmid ownerid1 ownerid2 ownerid3) str5 last_name1 str7 last_name2 byte(type1 type2 type3) str1(ultimate_owner1 ultimate_owner2 ultimate_owner3 ultimate_owner4 ultimate_owner5)
"A" "B" "C" "D" ""      ""        1 1 1 "I" "J" "H" "C" "D"
"B" "E" "F" ""  ""      ""        1 1 . "I" "J" "H" ""  "" 
"E" "I" "J" ""  "Smith" "Johnson" 0 0 . "I" "J" ""  ""  "" 
"F" "G" ""  ""  ""      ""        1 . . "I" "J" "H" ""  "" 
"G" "I" "J" "H" "Smith" "Johnson" 0 0 1 "I" "J" "H" ""  "" 
end

我认为 vlookup一个不错的起点。使用以下代码,我检索了所有中间所有者和最终所有者(因此我接近目标),但是代码很麻烦,我不知道如何将其推广到任意长的所有权链。

ssc inst missings
by firmid,sort: g rep=_n
reshape wide ownerid last_name share type,i(firmid) j(rep)

qui forv j=1/3{
    g rep_ownerid`j'=ownerid`j'
forv i=1/3{
    vlookup rep_ownerid`j',gen(ownerid`j'`i') key(firmid) value(ownerid`i')
forv k=1/3{
    vlookup ownerid`j'`i',gen(ownerid`j'`i'`k') key (firmid) value(ownerid`k')
forv m=1/3{
    replace ownerid`m'="99" if ownerid`m'==""
    vlookup ownerid`j'`i'`k',gen(ownerid`j'`i'`k'`m') key (firmid) value(ownerid`m')
}
}
}
}

qui foreach x of varlist ownerid* {
replace `x'="" if `x'=="99"
}

qui missings dropvars,force
drop reP*

我想知道是否有更好/更通用的方法来实现我的目标? 原始数据相当大(3M 观察)。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。