微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

9个亿的5位数QQ号用户中出现了神秘人物 挖掘QQ大数据


作者:yetwave


几天前,一个朋友来聊天,表示很羡慕我的6位QQ号,我说有啥好羡慕的,还有那么多5位号呢! 他感叹道:“一个5位号现在值好几万,早知道当初注册个百八十个的话,现在不就发财了… ”!


自我介绍下。传说中的“网络抓取铁手追命”,就是本人了。 主要擅长各种互联网数据抓取挖掘,通晓各种数据源采集规则,互联网江湖人士也,现和你分享一下如何一夜间挖价值9个亿的5位数QQ号用户!


本文由发源地数据交易平台 投稿并首发到36大数据,任何不表明作者、来源和本文链接http://www.36dsj.com/archives/39602的均为侵权。


9万条5位数QQ用户的详细数据


QQ号,昵称,空间名称,性别,年龄,生日,所在国家,省份,城市,感情状况,职业(其中QQ空间公开的一共有23283条,占全部9万个号的25.87%)


你还不知道的腾讯用户真相:


在价值9个亿的5位数QQ号用户中出现了神秘人物!


QQ的“金粉世家”主要聚集在哪些地方?


5位数QQ用户如何影响到国家的GDP?


75后85前用户,至今未婚的QQ女们要肿么办?


IT腐男宅女,商场精英,工程师,退休老大爷最爱混迹QQ圈!


到目前为止,没人知道“天若晴”到底是哪位大佬!




QQ的“金粉世家”主要聚集在哪些地方?


大数据分析常用的热力图如下,颜色越深的是代表人数越多,可以看出:人群最集中的是长三角,珠三角和北京。辽宁,湖南和四川瞧着也是略有小成。



再来看看省市的TOP10,前4没有黑马,主要就是国内热点聚集地区;稍感意外的是城市的第5名是我大东北的哈尔滨,而黑龙江也排在省的第7名。





5位数QQ用户如何影响到国家的GDP?



我为什么说稍感意外呢,因为前面也说了5位QQ号这个东西某种意义上也算一种财富象征,不管是虚拟财富还是现实财富;而我大黑龙江虽然白山黑水,地大物博,毕竟GDP在全国还是排在后面的,现实财富会差一些,用一张图来对比下:




一对比就可以看出来,黑龙江在右图(QQ)的颜色明显深过左边(GDP)。咱来算笔账:黑龙江2014年GDP是1.5万个亿,公开的5位QQ号有493个;而山东省GDP将近6万亿,5位QQ号却只有266个?可见老山东起码在互联网+的发展上,落后于黑龙江一筹。



用邓通发明的指标GQ率(GDP除以5位QQ号人数)来计算,老山东高达223.4,而后几名内蒙古,山西,河北也都是重度雾霾的难兄难弟,互联网+的创新不够,急需经济转型啊。


至于东北为何5位QQ这么多(摸头)大概因为俺们东北人喜欢唠嗑吧?这个问题还是等砖家作答吧。


75后85前用户,至今未婚的QQ女们要肿么办?


从结果可以看到,男女分布为60.2和23.2%,其中女生透露自己年龄的不多,只占15%左右;这也是人之常情:)。36大数据表示, 从年龄结构看,75后85前占大部分,确实,QQ大概是98,99年发布的(那时还叫OICQ呢),那时候90后还都在吃奶玩凯蒂猫呢。女生中70后占比最高,并且未婚比已婚的比例高。




从情感方面的分布图,未婚比已婚的比例高。这个话题,我表示比较有兴趣:70后的土豪Q们大部分时间都在忙事业了,Q男的不着急生娃,Q女不着急婚嫁。大龄女可以叫“剩女”,大龄男不能喊“剩男”,那得叫成熟的“黄金单身”!这让至今未婚的Q女们肿么办? 可以考虑学学小龙女,也许能遇上一段世纪佳缘,百合一生,或者干脆将单身进行到底,做坚强的“黄金剩斗士”!!!





原来IT腐男宅女,商界精英,工程师,退休老大爷最爱混迹QQ圈!


用户职业方面,QQ好像可以随便,因此职业也是五花八门,挑了前十几个最多的做一副云图。另外标识退休的一部分估计早已财务自由。计算机及互联网行业的居多,很好理解。早期QQ号码随便申请,没人知道他的价值,同时安全性也非常差,主要的上网渠道–网吧中有各种后门及盗号木马神马的。所以很大一部分靓号都被各类计算机大神“收集”起来。所以最终形成如下现在的分类图:




后记:拥抱互联网数据


很有感悟“ 互联网上没有垃圾信息,只有放错位置的资源”。关于WEB数据挖掘方面其实是很值得研究的。以上的数据分享案例仅从5个维度做了对应分析,其实根据数据采集的维度,是可以做更广泛分析的。如从腾讯开放的QQ群、QQ会员、QQ拼音及QQ秀等多个公开数据源渠道挖掘收集到非常有价值的数据。就像百度中有很多你需要的开放数据,关键看你怎么去挖掘收集。


多年前,数据采集工作是需要程序员自己写各种爬虫程序,同时需要搞定多线程、数据库、高匿IP等多个技术门槛才能比较随心所欲地做到,整个过程是非常繁琐的。现在好多了,随着互联网云存储计算、大数据相关云技术的成熟,使用支持云采集的SaaS工具化交易平台,一方面自己可以使用工具轻而易举收集到想要你的数据,另一方面也可以直接发个需求让其他开发者或供应方定制给你。自己就可以聚焦在擅长的数据分析方面了。


言归正传。以上数据源由托管在发源地数据交易平台,有兴趣的朋友可以去这个链接:http://www.finndy.com/midycp.PHP?action=robots&op=viewrobot&robotid=1123看看(需要登录),2万多原始数据都在里面。


End.
感谢你耐心的看完,鞠躬ing。
一直最用心,行业最强音。
如果你觉得内容对你有帮助,希望你转载到朋友圈分享给更多的人。
传递知识,传递快乐。

回复对应数字,查看对应系列文章
1
数据可视化 5篇系列文章
2
推荐系统 5篇系列文章
3
机器学习 5篇系列文章
4
随机森林和支持向量机 5篇系列文章
5
成为数据科学家 5篇系列文章
6
大数据面试题 5篇系列文章
7
大数据工具 5篇系列文章
8
实践篇 大数据应用案例 5篇系列文章
9
新手上路,数据行业入门学习5篇系列文章
36大数据是一个专注大数据创业、大数据技术与分析、大数据入门学习的商业新媒体。分享大数据在电商、移动互联网APP、医疗及金融银行等领域的落地应用。

36大数据是百度大数据首席战略合作媒体。也是WeMedia自媒体联盟成员。

网站:36dsj.com
QQ千人群:80958753
投稿邮箱:dashuju36@qq.com

36大数据微信
dashuju36
发干货/有价值的内容

大数据女神
dashujunvshen
发布行业新闻、动向
点击下方 “阅读原文”查看更多
↓↓↓

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐