“水泊梁山“互联网有限公司一百单八将内部社交网络

点击上方“程序人生”,选择“置顶公众号”

第一时间关注程序猿(媛)身边的故事


640?wx_fmt=jpeg

图片源自:水浒传

作者

徐麟

目前就职于上海唯品会产品技术中心,哥大统计数据狗,从事数据挖掘&分析工作,喜欢用R&Python玩一些不一样的数据。

如需转载,请联系原作者授权。


前言

最近看到了一些社交网络分析的文章,对此产生了兴趣,也开始进行相关的学习。本次文章我们将水浒传这一名著与互联网公司组织架构相结合,用Python+Gephi完成本次的分析,让大家能够以一种不同的视角了解社交网络以及社群发现。


PART1:获得数据

由108位精兵强将组成的水泊梁山互联网有限公司内部高效运转,经营包括酒店、武馆、寺庙等多项产业,我们今天来探秘公司内部员工的社交网络。

作为上市公司,财报需要定期对公众披露,所以此次数据无需爬虫获得,直接可以从最新“财报“《水浒传》中获得,我们从中获取员工的有效信息,以CEO宋江为例。

 
 
  1. with open("水浒传全文.txt", encoding='gb18030') as file:

  2.    shuihu = file.read()

  3. shuihu = shuihu.replace('\n','')

  4. shuihu_set = shuihu.split(' ')

  5. shuihu_set=[k for k in shuihu_set if k!='']

  6. songjiang_set=[k for k in shuihu_set if '宋江' in k]

  7. haohan = pd.read_excel('水浒人物.xlsx')

  8. haohan['出场段落']=0


PART2:员工收入情况

作为能够长期运作的互联网公司,在员工收入分配方面始终员工KPI(出场段落数量)相挂钩,我们来看一下年薪TOP10和BOTTOM10


640?wx_fmt=png

640?wx_fmt=png

看来水泊梁山大家的年收入差距两头分化比较严重,比较符合目前互联网公司发展趋势,杜绝“吃大锅饭”的发展思路,代码如下:


 
 
  1. haohan.sort_values('出场段落',ascending=False,inplace=True)

  2. attr = haohan['姓名'][0:10]

  3. v1 = haohan['出场段落'][0:10]

  4. bar = Bar("水泊梁山年收入TOP10")

  5. bar.add("年收入(万)", attr, v1, is_stack=True,is_label_show=True)

  6. bar.render('水泊梁山年收入TOP10.html')


  7. haohan.sort_values('出场段落',ascending=True,inplace=True)

  8. attr = haohan['姓名'][0:10]

  9. v1 = haohan['出场段落'][0:10]

  10. bar = Bar("水泊梁山年收入BOTTOM10")

  11. bar.add("年收入(万)", attr, v1, is_stack=True,is_label_show=True)

  12. bar.render('水泊梁山年收入BOTTOM10.html')


PART3:员工社交网络

我们调取了员工的聊天记录(同时出现的段落),每出现一次聊天记录,我们将员工之间的关联权重加一,统计代码如下:


 
 
  1. net_df = pd.DataFrame(columns=['Source','Target','Weight','Source_Ratio','Target_Ratio'])

  2. for i in range(0,107):

  3.    for j in range(i+1,108):

  4.        this_weight = len([k for k in shuihu_set if haohan['使用名'][i] in k and haohan['使用名'][j] in k])

  5.        net_df=net_df.append({'Source':haohan['姓名'][i],'Target':haohan['姓名'][j],

  6.                              'Weight':this_weight,

  7.                              'Source_Ratio':this_weight/haohan['出场段落'][i],

  8.                              'Target_Ratio':this_weight/haohan['出场段落'][j]},

  9.                              ignore_index=True)

  10.        print(str(i)+':'+str(j))    


我们在去除一些社交网络节点数据(聊天总数较少或聊天数量占一方数量比例过少)的情况后,用Gephi软件绘制出了整体的社交网络图如下:


640?wx_fmt=png

可以看出的社交网络是围绕着总裁宋江展开,其他的一些总裁办成员如吴用、李逵等也在社交网络中占据重要位置。林冲、鲁智深、李俊等高级领导则起到连接高层与基层员工的作用。值得一提的是副总裁卢俊义虽然职级很高,但是在公司的话语权似乎不是强,毕竟卢俊义也是作为空降兵来到的公司。


PART4:员工社区发现

Gephi软件自带社区发现函数,我们实现后用不同颜色划分出不同的社群,整体效果如下:


640?wx_fmt=png


我们下面逐一来看一下各个社区的成员,首先是CEO宋江、CTO吴用等人所在的总裁办:


640?wx_fmt=jpeg

下面来看一下花荣、林冲等日常工作与代马(码)这件事情息息相关的开发组:

640?wx_fmt=jpeg

之后是由鲁智深、孙二娘等人组成的数据组,需要日常分析梁山酒店等产业运营状况:

640?wx_fmt=png


产品、运营团队则分别由精通水性,能够协调好各个部门的李俊和执行力极强,善于推动项目进行的李逵带领:

640?wx_fmt=jpeg

640?wx_fmt=jpeg

最后看一下一些人数较少的社群:

640?wx_fmt=jpeg

这些社群基本上都是由夫妻、亲兄弟、铁哥们组成,具有很强的亲密度,水泊梁山的HR在招人时显然是考虑了这点。通过招聘具有亲密关系的应聘者,提高员工工作幸福感,有效降低离职率。


- The End -

「若你有原创文章想与大家分享,欢迎投稿。」

加编辑微信ID,备注#投稿#:

程序 丨 druidlost  

小七 丨 duoshangshuang


上期精彩内容

640?wx_fmt=png

640?wx_fmt=gif

印刷电路板(PCB)作为电子元件的关键支撑体,在电子设备中扮演着不可或缺的角色,其市场发展态势备受关注。QYResearch 的调研数据为我们揭示了该市场的全景:2024 年,全球印刷电路板市场规模约达 782.9 亿美元,而展望 2031 年,这一数字有望攀升至 1012.7 亿美元,在 2025 - 2031 期间,年复合增长率(CAGR)预计保持在 3.8%。然而,当美国 2025 年关税框架的潜在变动,已然在全球市场掀起波澜,对印刷电路板市场的竞争格局、区域经济协同以及供应链体系产生着深远影响。 一、印刷电路板基础概述 印刷电路板,又被称作印制电路板或印刷线路板,常见英文缩写为 PCB(Printed circuit board)或 PWB(Printed wire board)。其内部存在金属导体,承担着连接电子元器件线路的重任。传统电路板主要运用印刷蚀刻阻剂的工艺,以此构建电路的线路与图面,这也是其名称的由来。在现代电子技术领域,PCB 通过电子印刷术制造而成,它成功搭建起电子元器件之间的电气连接桥梁,成为各类电子设备的核心组件。无论是体积小巧的智能穿戴设备,还是大型的服务器系统,只要其中配备集成电路等电子元件,PCB 必然 “参与其中”。 二、市场规模增长引擎 (一)中国主导地位凸显 中国在全球印刷电路板市场中占据着举足轻重的地位。据预测,2025 年中国市场规模有望达到 4333.21 亿元,在全球市场的占比将超过 50%。这一卓越成绩的背后,人工智能(AI)与新能源汽车产业功不可没,二者已成为驱动中国 PCB 市场增长的核心动力。以 AI 产业为例,随着 AI 技术的迅猛发展,对算力的需求呈爆发式增长,这使得 AI 服务器的市场需求大幅提升。而每台 AI 服务器中 PCB 的价值量可达 5000 元,预计到 2025 年,全球 AI 服务器相关的 PC
资源下载链接为: https://pan.quark.cn/s/637cf229ceb0 “official_web_copy_redbook” 是一个以小红书官网首页为蓝本,运用多种端技术搭建而成的示例项目。开发者运用了 Bootstrap、jQuery、HTML5、CSS 以及 JavaScript 等一系列技术栈来完成页面制作。以下是对这些技术及其在项目中应用的详细阐述。 HTML5 作为超文本标记语言的最新版本,为网页开发带来了诸多新元素和功能,其核心目标是提升网页的可读性、可访问性与互动性。在本项目中,HTML5 承担着构建网页基本架构的重任,它通过定义头部、导航、主体、底部等不同内容区块,清晰地划分页面结构。新出现的 <nav>、<section>、<article> 等元素,赋予了页面更强的语义化特性,这不仅有利于搜索引擎进行优化处理,也为无障碍访问提供了有力支持。 CSS(层叠样式表)主要负责掌控网页的外观与布局。在该项目里,CSS 被充分运用于定制小红书首页的视觉风格,涵盖颜色搭配、字体选择、间距设置以及整体布局等多个方面。借助 CSS,开发者能够实现响应式设计,确保页面在不同设备和各种屏幕尺寸下都能呈现出良好的显示效果。而 CSS3 的出现,更是引入了动画和过渡效果,这些效果或许被用于增强用户体验,例如制作按钮悬停时的特效、页面滚动时的动画等。 Bootstrap 是一款广受欢迎的开源端框架,它集成了预设的 CSS 样式、JavaScript 组件以及网格系统,大地提高了网页开发的效率。在仿小红书首页项目中,Bootstrap 很可能被用来快速搭建响应式布局,简化栅格设计流程,并提供诸如模态框、下拉菜单、按钮等交互元素。其包含的 CSS 和 JavaScript 库,能够助力开发者维持设计的一致性与专业性。 jQuery 是一个轻量级的 JavaS
内容概要:该蓝皮书全面解析了乳制品行业低温渠道的发展现状与未来趋势,重点关注冷链效率和终端竞争策略。首先介绍了低温乳制品的概念、营养价值及其消费趋势,强调了其在健康意识提升、消费升级和冷链物流完善的背景下需求增长的驱动因素。其次详细阐述了冷链物流在保障乳制品品质中的关键作用,包括储存、运输、加工与包装等环节的低温保持及信息化管理。接着分析了市场现状,指出市场规模的增长态势、消费结构与场景,并剖析了全国性和区域性乳企的竞争格局,以及新进入者面临的挑战和机遇。最后提出了冷链效率提升的具体策略,如需求预测、网络优化、技术创新等,并探讨了终端竞争策略,包括产品差异化、渠道拓展、品牌建设和客户关系管理。; 适合人群:从事乳制品行业及相关冷链物流领域的从业者、投资者、研究者,以及对乳制品市场感兴趣的消费者。; 使用场景及目标:①了解低温乳制品的特点、营养价值和发展趋势;②掌握冷链物流的关键技术和管理方法;③分析市场现状和竞争格局,为企业发展战略提供参考;④探索提升冷链效率和增强终端竞争力的有效途径。; 其他说明:此蓝皮书基于详尽的数据分析和案例研究,为企业决策者提供全面的市场洞察和技术指导,有助于把握行业发展脉搏,制定科学合理的经营策略。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值