1.对原始数据的清洗方式:to,cc,bcc这些字段中可以有多个用户,用户之间用分号隔开,将数据拆分出来。即,每一个收件人,就有一条数据。并且把to,cc,bcc也区分开来。
图的名称:邮件收发关系柱状图。
类型:原生的多组柱状图。
数据来源:邮件的发送地址和邮件的接收地址,内部邮件。内部员工列表。
可分析的内容:
1.横轴是全部的内部员工,纵轴是邮件的数量。
2.蓝色是发送邮件的数目,黄色是接受邮件的数目。
得到的结果:发送邮件数量最多的前三名和接收邮件最多的前三名。
优点:可以清楚的看到各员工收发邮件的数量对比,以及从中得到活动频率高的员工。
缺点:不能看到收发邮件的员工之间的联系。并且信息量较少。
图的名称:接发邮件的主题关联图
图的类型:自己定义的线图(其实我也数不清楚到底是什么图)
数据来源:收发邮件数量分别居于前三的员工名单,他们收发邮件的数量,邮件主题。
可分析的内容:1.左边是sender,右边是 receiver。中间是sucject。
2.左右两边的数字代表邮件的频率。
3.线的颜色:用来区别不同员工。
优点:确实能够得到每个人邮件中的主题多线的频率,来判断他的工作内容
缺点:
线的颜色选择过于随意,没有什么标准,而且线太多,很难定量分析。而且他没有考虑到员工职位变化的可能,而且这种分析方法不一定有