“水泊梁山“互联网有限公司一百单八将内部社交网络

点击上方“程序人生”,选择“置顶公众号”

第一时间关注程序猿(媛)身边的故事


640?wx_fmt=jpeg

图片源自:水浒传

作者

徐麟

目前就职于上海唯品会产品技术中心,哥大统计数据狗,从事数据挖掘&分析工作,喜欢用R&Python玩一些不一样的数据。

如需转载,请联系原作者授权。


前言

最近看到了一些社交网络分析的文章,对此产生了兴趣,也开始进行相关的学习。本次文章我们将水浒传这一名著与互联网公司组织架构相结合,用Python+Gephi完成本次的分析,让大家能够以一种不同的视角了解社交网络以及社群发现。


PART1:获得数据

由108位精兵强将组成的水泊梁山互联网有限公司内部高效运转,经营包括酒店、武馆、寺庙等多项产业,我们今天来探秘公司内部员工的社交网络。

作为上市公司,财报需要定期对公众披露,所以此次数据无需爬虫获得,直接可以从最新“财报“《水浒传》中获得,我们从中获取员工的有效信息,以CEO宋江为例。

 
 
  1. with open("水浒传全文.txt", encoding='gb18030') as file:

  2.    shuihu = file.read()

  3. shuihu = shuihu.replace('\n','')

  4. shuihu_set = shuihu.split(' ')

  5. shuihu_set=[k for k in shuihu_set if k!='']

  6. songjiang_set=[k for k in shuihu_set if '宋江' in k]

  7. haohan = pd.read_excel('水浒人物.xlsx')

  8. haohan['出场段落']=0


PART2:员工收入情况

作为能够长期运作的互联网公司,在员工收入分配方面始终员工KPI(出场段落数量)相挂钩,我们来看一下年薪TOP10和BOTTOM10


640?wx_fmt=png

640?wx_fmt=png

看来水泊梁山大家的年收入差距两头分化比较严重,比较符合目前互联网公司发展趋势,杜绝“吃大锅饭”的发展思路,代码如下:


 
 
  1. haohan.sort_values('出场段落',ascending=False,inplace=True)

  2. attr = haohan['姓名'][0:10]

  3. v1 = haohan['出场段落'][0:10]

  4. bar = Bar("水泊梁山年收入TOP10")

  5. bar.add("年收入(万)", attr, v1, is_stack=True,is_label_show=True)

  6. bar.render('水泊梁山年收入TOP10.html')


  7. haohan.sort_values('出场段落',ascending=True,inplace=True)

  8. attr = haohan['姓名'][0:10]

  9. v1 = haohan['出场段落'][0:10]

  10. bar = Bar("水泊梁山年收入BOTTOM10")

  11. bar.add("年收入(万)", attr, v1, is_stack=True,is_label_show=True)

  12. bar.render('水泊梁山年收入BOTTOM10.html')


PART3:员工社交网络

我们调取了员工的聊天记录(同时出现的段落),每出现一次聊天记录,我们将员工之间的关联权重加一,统计代码如下:


 
 
  1. net_df = pd.DataFrame(columns=['Source','Target','Weight','Source_Ratio','Target_Ratio'])

  2. for i in range(0,107):

  3.    for j in range(i+1,108):

  4.        this_weight = len([k for k in shuihu_set if haohan['使用名'][i] in k and haohan['使用名'][j] in k])

  5.        net_df=net_df.append({'Source':haohan['姓名'][i],'Target':haohan['姓名'][j],

  6.                              'Weight':this_weight,

  7.                              'Source_Ratio':this_weight/haohan['出场段落'][i],

  8.                              'Target_Ratio':this_weight/haohan['出场段落'][j]},

  9.                              ignore_index=True)

  10.        print(str(i)+':'+str(j))    


我们在去除一些社交网络节点数据(聊天总数较少或聊天数量占一方数量比例过少)的情况后,用Gephi软件绘制出了整体的社交网络图如下:


640?wx_fmt=png

可以看出的社交网络是围绕着总裁宋江展开,其他的一些总裁办成员如吴用、李逵等也在社交网络中占据重要位置。林冲、鲁智深、李俊等高级领导则起到连接高层与基层员工的作用。值得一提的是副总裁卢俊义虽然职级很高,但是在公司的话语权似乎不是强,毕竟卢俊义也是作为空降兵来到的公司。


PART4:员工社区发现

Gephi软件自带社区发现函数,我们实现后用不同颜色划分出不同的社群,整体效果如下:


640?wx_fmt=png


我们下面逐一来看一下各个社区的成员,首先是CEO宋江、CTO吴用等人所在的总裁办:


640?wx_fmt=jpeg

下面来看一下花荣、林冲等日常工作与代马(码)这件事情息息相关的开发组:

640?wx_fmt=jpeg

之后是由鲁智深、孙二娘等人组成的数据组,需要日常分析梁山酒店等产业运营状况:

640?wx_fmt=png


产品、运营团队则分别由精通水性,能够协调好各个部门的李俊和执行力极强,善于推动项目进行的李逵带领:

640?wx_fmt=jpeg

640?wx_fmt=jpeg

最后看一下一些人数较少的社群:

640?wx_fmt=jpeg

这些社群基本上都是由夫妻、亲兄弟、铁哥们组成,具有很强的亲密度,水泊梁山的HR在招人时显然是考虑了这点。通过招聘具有亲密关系的应聘者,提高员工工作幸福感,有效降低离职率。


- The End -

「若你有原创文章想与大家分享,欢迎投稿。」

加编辑微信ID,备注#投稿#:

程序 丨 druidlost  

小七 丨 duoshangshuang


上期精彩内容

640?wx_fmt=png

640?wx_fmt=gif

内容概要:《中国HR+HER2-早期乳腺癌患者诊疗需求调研白皮书》聚焦于中国早期HR+/HER2-乳腺癌患者的诊疗现状和需求。白皮书通过定量调研,揭示了患者在确诊、复发风险评估、术后辅助治疗及长期管理等各阶段面临的挑战,包括对新药的期待、信息需求及信息渠道偏好。调研显示,患者对新型辅助治疗方案的疗效和生活质量提升寄予厚望,但也存在对不良反应的担忧。此外,患者在理解诊断报告、复发风险认知及获取权威信息方面存在诸多障碍。白皮书呼吁加强患者教育、优化医患沟通、提高新药可及性,以改善患者预后和生活质量。 适合人群:早期HR+/HER2-乳腺癌患者、家属、临床医生及相关医疗工作者。 使用场景及目标:①帮助患者更好地理解诊断结果和后续治疗方案;②为临床医生提供患者需求和挑战的真实数据,优化诊疗路径;③推动社会各界关注和支持早期乳腺癌患者的教育和管理,助力患者早日康复,重获高质量生活。 其他说明:白皮书强调了早期乳腺癌患者在诊疗旅程中面临的多重障碍,包括早期筛查覆盖率不足、复发风险认知偏差及医患沟通壁垒。为应对这些挑战,白皮书提出了多项改进建议,如加强乳腺健康教育、优化诊断结果沟通方式、提升患者对复发风险的认知、强化不良反应管理及构建权威信息平台等。
内容概要:本文档详细介绍了项目进度管理的知识体系,涵盖从启动到收尾的五大过程组,具体包括项目整合管理、范围管理、进度管理、成本管理、质量管理、资源管理、沟通管理、风险管理、采购管理和干系人管理。其中重点阐述了项目进度管理的六个核心过程:规划进度管理、定义活动、排列活动顺序、估算活动持续时间、制订进度计划和控制进度。每个过程详细描述了其定义、输入、工具、输出及相关补充信息。例如,在规划进度管理中,介绍了进度管理计划的内容,包括项目进度模型制定、准确度、计量单位等;在定义活动中,讲解了活动清单、活动属性和里程碑清单的构成;在排列活动顺序中,描述了紧关系绘图法(PDM)和箭线图法(ADM)的应用;在估算活动持续时间中,介绍了类比估算、参数估算、三点估算和自下而上估算等方法;在制订进度计划中,详细说明了进度基准、项目进度计划、进度数据、进度网络分析等概念和技术;在控制进度中,讨论了数据分析、关键路径法、项目管理信息系统等工具的使用。 适合人群:项目管理人员、项目经理、项目团队成员及其他对项目进度管理感兴趣的人员。 使用场景及目标:①帮助项目管理人员掌握项目进度管理的核心流程和方法;②为项目经理提供详细的进度管理工具和技术指导;③协助项目团队成员理解并应用进度管理的最佳实践。 其他说明:本文档不仅提供了理论知识,还结合了实际操作中的工具和技术,旨在提高项目进度管理的效率和准确性。读者可以通过学习本文档,更好地规划、执行和监控项目进度,确保项目按时交付。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值