[持续更新]大数据岗位实习日志

入门了解

最近在大数据分析岗位实习,因为尚在入门所以就只能先做一个sqlboy啦,然后慢慢学习一点大数据相关开发的工作.

大数据开发与后端的区别

传统的后端java一般是用的spring全家桶,处理的数据量有上限,基于传统的数据库的CRUD与前端查询的接口

CRUD
增加(Create)、检索(Retrieve)、更新(Update)和删除(Delete)

数据库可以抽象为三个部分:
数据接入部分
数据计算部分(数据计算引擎)
结果存储部分

大数据开发需要会什么

说实话因为专业是智能,第一次听说需要懂这些东西

一些组件
  • Doug Cutting开山鼻祖首创Hadoop
  • 消息队列组件KafKa(乍一听有点像那个作家卡夫卡)
  • 数据存储组件Hadoop HDFS
    分布式文件系统的鼻祖
  • 分布式计算引擎Spark
    先进的思想
    高效的编程模型
    完备的软件生态
  • 分布式仓库HIVE
  • 分布式数据库HBASE
  • 分布式搜索引擎Elasticsearch

开源的数据计算引擎

  • MapReduce、Tez暂时不用考虑
    (只是作为OLAP的内置计算引擎)
  • Strom(只是单一的流式处理没有批处理)
  • Spark兼容性更好
  • Flink

大数据入门为什么要先学计算引擎

  • 不需要额外的设施
    只需要一个IDE工具引入对应的jar包
  • 地位核心承上启下决定运行效率
    上接存储数据的数据源Kfaka、HDFS、Hive
    下接结果存储的数据库Hbase、Elasticsearch、Mysql
  • 使用频繁
  • 与其他组件更紧密,可以读文件系统、数据库、消息队列,只要能存储都有对应的读api和写api
大数据技术与应用实习周记全文共1页,当前为第1页。大数据技术与应用实习周记全文共1页,当前为第1页。大数据技术与应用实习周记 大数据技术与应用实习周记全文共1页,当前为第1页。 大数据技术与应用实习周记全文共1页,当前为第1页。 2020年6月15日,中北大学软件学院与优逸客校企合作大数据方向实训班级UBDF2006班正式开训。本周为软件学院的大数据方向课程第一周,班级人数总共为38人,本周课程实训过程内容主要如下: 一、实训内容 根据OBE(成功导向)的教学理念,深入聚焦学生解决复杂工程问题能力的培养,本周主要为实训学员讲解了软件工程管理相关理论知识以及相关过程文档的编写、相关项目管理工具的使用,比如UML图、Git版本控制系统以及MarkDown文档编写技巧、服务器部署技术等。具体的讲解内容如下: 二、实训过程 1、开班典礼 开班典礼一直为我们的传统,在正式上课之前为学员举办一个典礼,采用员工化思想培养学员,让学员认识到角色的转变,为将来进入职场打下基础。 2、实训授课 本次授课采用全线上直播授课,在讲解过程中为了避免同学中网路波动等问题,在授课过程中学员可随时提出疑问在线解答,同时采用在线连麦方式提问学员的掌握程度,并且为锻炼学员的表达能力,每天中午都会抽取半小时时间让学员进行主题演讲,锻炼学员的自信与表达能力。 在实训过程中每天都会让学员通过平台汇报自己的知识掌握程度以及通过在线考试方式检测学员的学习情况,每日会对学员提出问题进行解答,为学员制造更好的学习氛围。实训过程中学员的在线连线。 3、学员主题演讲风采 4、学员日周报 三、实训感言 在本次一周的上课中,充分感受到了中北学员的热情以及对学习的热爱,在实训过程中学员有不同的问题能积极反馈,并且能在实训过程中为我们的实训课程提出一些宝贵的意见。 实训不仅是一次传道授业的过程中,在和学员的相处过程中,能被学员的刻苦学习的精神感染,在授课过程中,自己也有了更好的心情为学员解决问题,把好学员走向社会的最后几步。 大数据技术与应用实习周记
<think>好的,我现在需要给一位安徽科技学院数据科学与大数据技术专业的大三学生提供就业指导建议。首先,我要考虑用户的具体背景:本科大三,专业是数据科学与大数据技术,学校是安徽科技学院。接下来,我需要思考如何根据这些信息给出真实有效的建议。 首先,我应该分析当前数据科学和大数据行业的就业趋势。这个行业目前发展迅速,特别是在人工智能、云计算和物联网的推动下,对相关人才的需求量大。但竞争也很激烈,尤其是在一线城市。因此,用户可能需要提升自身技能,增强竞争力。 然后,考虑用户所在的学校。安徽科技学院是一所应用型本科院校,可能更注重实践能力的培养。因此,建议应该包括加强实践项目经验,参与实习,以及考取相关证书等方面。 接下来,我需要思考具体的建议点。可能包括技术能力的提升,比如编程语言(Python、R、SQL)、大数据框架(Hadoop、Spark)、机器学习算法等。此外,项目经验非常重要,建议用户多参与校内外的项目,或者自己做一些数据分析项目,积累经验。 另外,实习经历对于就业至关重要。建议用户积极寻找实习机会,尤其是暑假实习,可以到相关企业积累实际工作经验。同时,考取行业认可的证书,比如阿里云ACA/ACP、AWS认证、CDA数据分析师等,也能提升简历的竞争力。 还要考虑行业选择。数据科学和大数据技术可以应用于多个领域,如金融、电商、医疗、教育等。建议用户根据兴趣和实习经历选择细分方向,提前规划职业路径。 另外,考研和就业之间的选择也是一个需要考虑的问题。如果用户对学术有兴趣,考研可能是一个选择,但需要结合个人情况。如果直接就业,则需要提前准备,关注招聘信息,优化简历和面试技巧。 最后,可能需要提醒用户关注行业动态,多参加行业交流活动,扩展人脉,利用校友资源等。同时,保持持续学习的态度,因为技术更新换代快,需要不断学习新工具和技术。 在整理这些思路时,需要注意建议的可行性和针对性,确保符合用户的实际背景,避免过于泛泛而谈。同时,要给出具体的资源和途径,比如推荐学习平台、证书考试时间、招聘渠道等,帮助用户具体操作。</think>以下是针对安徽科技学院数据科学与大数据技术专业大三学生的就业指导建议,结合行业现状和学校特点设计,含具体实施路径: --- ### 一、技术能力强化(校招核心竞争力) **1. 编程能力分层突破** - **基础层**:确保熟练掌握$Python$(NumPy/Pandas/Matplotlib)+ $SQL$,推荐完成《Python数据科学手册》课后项目 - **进阶层**:掌握$Spark$分布式计算框架,可参加阿里云天池平台的[大数据入门赛](https://tianchi.aliyun.com/) - **加分项**:学习$Docker$容器化部署,用[DataCamp](https://www.datacamp.com/)补足工程化能力短板 **2. 机器学习实战路径** - 完成Kaggle入门比赛(如[Titanic](https://www.kaggle.com/c/titanic)) - 在[和鲸社区](https://www.heywhale.com/)复现3个完整数据分析项目 - 掌握特征工程、模型调参(Sklearn/XGBoost)和模型解释工具(SHAP) --- ### 二、实习精准突破(把握大三关键窗口期) **1. 地域选择策略** - **省内机会**:关注合肥"中国声谷"(科大讯飞/华米科技)、芜湖奇瑞新能源车联网部门 - **长三角机会**:苏州工业园区生物医药数据分析、杭州电商企业用户行为分析岗 - **远程实习**:通过[实习僧]平台投递数据分析助理岗(日均处理20+岗位申请) **2. 企业选择梯度** - **Tier1**:争取银行科技部(徽商银行金融科技岗) - **Tier2**:中型互联网公司(如马鞍山华菱星马大数据平台部) - **Tier3**:传统企业数字化转型部门(洽洽食品供应链优化组) --- ### 三、证书考取组合(低成本提升简历通过率) 1. **阿里云大数据ACA认证**(考试费¥600,学校机房可完成实验) 2. **CDA LevelⅠ**(重点掌握AB测试设计) 3. **Tableau Desktop Specialist**(可视化岗必备,考试可申请学生折扣) 注:避免盲目考取证书,优先选择岗位JD中高频出现的认证 --- ### 四、校招备战时间轴 ```mermaid gantt title 大三下学期-大四校招时间轴 dateFormat YYYY-MM-DD section 技术准备 算法刷题 :2024-03-01, 90d 项目优化 :2024-04-15, 60d section 求职准备 简历迭代 :2024-05-01, 30d 模拟面试 :2024-06-01, 90d section 关键节点 暑期实习投递 :crit, 2024-03-15, 15d 秋招提前批 :crit, 2024-06-20, 30d ``` --- ### 五、差异化竞争策略 1. **行业交叉优势**:结合学校农学特色(安徽科技学院优势学科),关注智慧农业领域: - 农业物联网数据分析 - 农产品价格预测模型 - 农业保险精算分析 2. **本地化资源利用**: - 参与凤阳县统计局人口普查数据分析(联系数学与统计学院老师) - 对接蚌埠市高新技术企业(学校地理位置优势) 3. **简历包装技巧**: - 将课程设计转化为项目经历(如《Hadoop应用》课程可包装为"分布式日志分析系统") - 量化项目成果(如"通过特征工程使预测准确率提升12%") --- ### 六、行业趋势把握 1. **重点赛道选择**: - 制造业数字化转型(工业大数据分析师) - 县域经济数字化(乡村振兴数字化解决方案) - ESG数据分析(碳排放核算方向) 2. **薪资参考(2023长三角地区校招)**: | 岗位类型 | 学历要求 | 薪资范围(月) | |----------------|----------|----------------| | 数据分析师 | 本科 | 8-12k | | 大数据开发 | 本科 | 10-15k | | 商业智能分析 | 本科 | 7-10k | --- **行动建议**: 1. 本周内完成LinkedIn档案建立,添加5位校友(搜索"安徽科技学院+大数据") 2. 3月15日前完成暑期实习岗位投递(重点关注企业校招官网) 3. 每日保持2道LeetCode(easy-medium)练习量(SQL必刷[178.分数排名](https://leetcode.cn/problems/rank-scores/))
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值