- 博客(42)
- 资源 (2)
- 收藏
- 关注

原创 CDA Level1复盘总结
18号上午考了一级CDA,提交完当场得到评级,拿到等级B,还是心满意足,将整个复习过程总结一下。上个月月底初步评估了自己要复习的内容,从9.1复习到9.17号,17天时间,有些仓促,但重点抓住了就是妥妥的通过。备考资料:模拟2套卷、官网视频课、CDA网校数据分析题库。复习方法:以模拟卷1作为指引明灯,快速刷一遍视频课,刷课的同时写博客记录,再疯狂刷题查漏补缺。具体来说,第一步、复习开始之前,先计时两小时,模拟真实考试环境,不可以搜答案,裸考状态,看看自己几斤几两。虽然全是选择题,但是及格也不是那么容
2021-09-19 16:47:47
4311
28
原创 论文解读1:《数据基础设施 关键技术发展现状与挑战》
想象一下,你有一个非常大的图书馆,里面有很多书籍。在传统的图书馆中,如果你想要找到一本书,你可能需要亲自去图书馆,然后在书架上一本本地寻找。这个过程就像是科学研究的第三范式,研究者需要亲自参与到数据的查找和处理中。现在,想象一下,图书馆里的每本书都有一个唯一的条形码,而且图书馆有一个电脑系统,你可以通过输入书名或者作者的名字,电脑就会告诉你这本书在哪里。这个电脑系统就像是数据互联技术,它帮助你快速准确地找到你需要的书籍。
2025-04-02 10:16:55
263
原创 探索国际数据空间(IDS)架构(下)
在上一篇文章中,我们介绍了国际数据空间(IDS)的基本概念、架构分层和核心组件。今天,我们将继续深入探讨 IDS 的安全、认证和治理机制,以及它在实际应用中的价值和挑战。
2024-10-29 16:43:23
1769
原创 探索国际数据空间(IDS)架构(上)
在当今数字化时代,数据的重要性日益凸显,而国际数据空间(IDS)作为一个新兴的概念,正逐渐成为数据管理和共享的关键领域。今天,我们就来一起探索一下 IDS 的精妙架构。
2024-10-29 16:35:56
2377
原创 《AI时代职业规划:拥抱变革,逐浪前行》
AI时代充满机遇与挑战,无论处于职业生涯的哪个阶段,只要我们紧跟时代步伐,不断提升自我,就能在AI的浪潮中找到属于自己的发展空间。
2024-10-29 14:51:31
1466
原创 调用openai接口的正确打开方式
为更好使用openai的功能,技术专家建议用py3.10。我个人建议尽可能用anaconda较新的,但用anaconda2022.10的版本即可,可适配python3.10或python3.11。2023.03上新的anaconda仍有难以解决的bug,不推荐(安装后打不开,报错显示为File “C:\Users\bonni\anaconda3\lib\codecs.py”, line 322, in decode。打开jupyterlab,先确保jupyterlab所在环境与你的虚拟环境py310一致。
2023-04-02 11:20:47
3777
转载 MLOps实践指南即将发布,AI工程化论坛精彩议题先睹为快
为引导各行业MLOps成熟度能力建设,激发MLOps工具平台创新主体活力,推动MLOps产业生态健康发展,人工智能关键技术和应用评测工业和信息化部重点实验室、中国信息通信研究院云计算与大数据研究所拟于3月16日在京召开AI工程化论坛暨MLOps实践指南发布会。本次论坛将发布和解读中国信通院《人工智能研发运营体系(MLOps)实践指南(2023年)》。
2023-03-13 17:47:55
375
原创 MLOps专栏介绍
从2016年起,以深度学习为代表的机器学习大火,直到现在,算法工程师、数据科学家、机器学习工程师、数据工程师越来越成为市场上的香饽饽。或许你是他们中的一员,或许你想加入他们。你需要保持一种对AI领域新方向的敏锐感知,才不会一次次错过时代的发展时机。你知道AI从业者都在关注什么吗?他们早已脱离了一味追求实验室理想环境下的超高准确率、召回率、F1-score,而是寻求商业环境下的高质量、低风险的规模化部署,敏捷、标准化的交付流程,实现机器学习全生命周期的闭环。这样一套管理过程脱胎于软件工程项目管理DevOp
2022-06-02 21:17:28
342
原创 Introducing MLOps 解读(一)
一、什么是MLOps?MLOps是一个帮助组织和商业高管创造长期价值并降低机器学习等模型风险的过程。MLOps的核心是机器学习全生命周期的标准化和精简化。而这种精简化是出于模型规模化生产的必然需要。为什么这么说呢?早几年的时候,大多数组织面向生产的机器学习模型的开发和落地部署还是新生事物,模型数量较少易管理,公司领导对理解这些模型及相关依赖的兴趣很少。而随着决策自动化的发展,像个性化推荐、RPA自动化二、践行MLOps面临的挑战是什么?三、MLOps有哪些特点?.........
2022-06-02 21:15:54
596
原创 CDA LEVELⅠ2021新版模拟题二(附答案)
总结整理不易,记得一键三连(关注哦,其他练习题库正在整理中,在评论框发“模拟题”三个字给你们发word版方便自测)考试题型:客观选择题(单选 80 题+多选 20 题+内容相关 20 题+ 案例分析 20 题)第二套单选1:1.数据分析方法论为分析项目提供了基础框架,以下不属于数据分析方法论的选项是• A.CRISP-DM• B.SEMMA• C.AB测试• D.UMLD前三个选项是常用的分析方法论,D选项UML是统一建模语言的缩写,不属于数据分析范畴2.数据分析师是一个科学严谨的岗位,
2022-05-15 16:40:23
12590
19
原创 CDA LEVELⅠ2021新版模拟题一(附答案)
第一套单选1:1.EDIT数字化模型是企业在实现数字化工作的落地模板,以下关于数据分析EDIT模型描述错误的是• A.E指的是Exploration、探索• B.D指的是Data、数据• C.I指的是Instruction、指导• D.T指的是Tool,工具EDIT中的D指的是诊断(Diagnosis)的意思,所以错误选项是B2.数据分析由许多关键的阶段性步骤构成,以下不属于数据分析步骤的是• A.业务理解• B.数据获取• C.数据处理• ...
2022-05-04 12:24:12
16846
34
原创 关于MLOps中的数据工程,你一定要知道的.......
关于MLOps中的数据工程,你一定要知道的.......背景:数据工程是什么:MLOps中的数据工程有哪些看点?1.数据收集2.数据探索3.数据处理5.暗线背景:21世纪以来,以Hadoop、Spark、Hive为代表的大数据工具,和以Google Cloud、AWS、阿里云、华为云等为代表的公共云奠定了当今数据生态系统的基础。随着海量数据处理工具集的发展以及数据源和数据格式在种类和规模上的不断增长,数据工程越来越成为一门多技术综合应用的学科,用以实现最终业务目标。数据工程是什么:数据工程是关注数据
2022-04-06 17:44:59
3600
原创 从Anaconda到TensorFlow到Jupyter一路踩坑一路填平
从anaconda到TensorFlow到Jupyter一路踩坑一路填平
2022-02-19 22:30:07
1072
原创 预测2021年:加速实现RPA以外的超自动化成果
Predicts 2021: Accelerate Results Beyond RPA toHyperautomation Published 4 December 2020文章目录概览核心发现建议分析什么是超级自动化你需要知道的战略规划设想1核心发现近期标志市场影响建议战略规划设想2核心发现市场影响建议战略规划设想3核心发现市场影响建议战略规划设想4核心发现建议这场新冠疫情加速了一种默认的数字需求。飞数字化的业务流程在被迫进入虚拟、远程、随处可见的操作模式时遇到困难或被迫停止。IT领导者可以利用这
2021-12-05 13:01:04
2944
翻译 Hyperautomation for the enhancement of automation in industries 论文翻译
题目:提高工业自动化水平的超自动化作者:Abid Haleem a, Mohd Javaid a,*, Ravi Pratap Singh b, Shanay Rab a, Rajiv Suman c摘要:超自动化是借助先进技术(如机器人过程自动化(RPA)、机器学习(ML)和人工智能(AI)实现的真正的数字化转型。它自动化复杂的业务流程,即使在以前需要主题专家的地方也是如此。这是对传统业务流程自动化流程的扩展。超自动化允许通过将人工智能技术与RPA相结合,实现业务人员执行虚拟任务的自动化。这将提升到
2021-12-03 18:30:12
330
原创 Gartner 2022年顶尖科技趋势之超级自动化
本文总结整理自Gartner文章Top Strategic Technology Trends for 2022:Hyperautomation。写在前面:由于企业向数字化商业模式转变的强烈需求,超自动化已经从可选项迅速转变为关键项。IT领导者必须将超自动化作为一种持续的催化剂,通过流程级赋能来优化任务级数字化,以实现敏捷性和弹性。1.总览机会■ 2021,加特纳调查发现,超过50%的CEO和69%的董事会要求加速增长和卓越运营。超自动化为实现这两个目标提供了关键途径。■ 超自动化举措有所增加,
2021-12-03 13:01:49
1263
原创 AI入门记录(2)
1.排序算法1.1冒泡排序从小到大排序,第一轮将最大的泡浮到最后,第二轮将次大的泡浮到倒数第二个,…def bubble_sort(array): for i in range(1,len(array)): for j in range(0,len(array)-i): if array[j]>array[j+1]: array[j],array[j+1]=array[j+1],array[j] return
2021-12-01 12:46:36
849
原创 AI入门记录(1)
1.anaconda新安装后一直loading applications 解决方案:到第3步就能正常打开:https://blog.youkuaiyun.com/weixin_42529892/article/details/81503261tip:为了配合TensorFlow,需要安装python3.5或3.6,从而anaconda版本要一起对应,是conda 4.3.30。2.机器学习教程推荐李文哲老师https://www.bilibili.com/video/BV1Uf4y157tL?p=553.ai
2021-12-01 11:13:22
1293
原创 MySQL与Navicat安装和踩坑
换了新电脑,重新安装MySQL和可视化Nvicat。1.MySQL官网下载:下载地址:https://dev.mysql.com/downloads/mysql/2.配置环境变量右键点击“我的电脑”-“属性”-“高级”-“环境变量”-“系统 变量”-双击“Path”-将mysql的路径“D:mysql\mysql5.0.51\bin (这里假设您的MYSQL目录和我安装的一样,其实你定位到你的 MYSQL安装目录之后再找到bin目录就可以把全路径写上去了)”添加进去-“确定”这样做以后在cmd中
2021-11-20 10:34:09
1149
1
原创 数据分析面试记录1-5
1.微财数据分析一面:技术面1.1 现场写2个sql题:1)table1有no,name, table2有no,name,写出table1有而table2没有的no和name。延展问:在python的dataframe里怎么表示,在excel中表示。2)写出最近登陆的设备码。1.2 问pandas中iloc和loc的区别。二面:主管面2.1自我介绍2.2为什么从上家公司离职2.3介绍岗位相关的业务,主要是贷后、客服智能语音机器人的策略分析,话术调优。结果:拿到offer,但工资被压,本来
2021-11-19 14:31:16
6915
2
原创 数据分析业务核心
数据分析业务核心搭建指标体系的过程指标体系运作图北极星指标搭建指标体系的过程指标体系运作图北极星指标北极星指标(North Star Metric),也叫作第一关键指标(One Metric That Matters),是指在产品的当前阶段与业务/战略相关的绝对核心指标,一旦确立就像北极星一样闪耀在空中,指引团队向同一个方向迈进(提升这一指标)。...
2021-11-19 13:32:31
479
原创 CDA Level1多选题精选
1.表结构是数据分析中常用的数据结构,以下属于表结构分析工具的是• A.DB2• B.Power BI• C.Excel• D.PPT答。ABC。 D选项PPT属于办公软件2.数据的完整性表示:存储在数据库中的所有数据值均正确的状态,在SQL的CREATE TABLE 语句中实现完整性约束的有()• A.NOT NULL• B.PRIMARY KEY• C.DEFAULT• D.UNIQUE答:ABD。为了保证数据的完整性,可以通过四种方式来实现,约束、规则、默认值、触发器。 题干
2021-09-19 16:04:06
2043
原创 CDA Level1知识点总结之业务分析报告与数据可视化报表
业务分析报告与数据可视化报表策略分析考点精讲可视化分析图表业务图标决策树撰写业
2021-09-19 16:03:48
1543
1
原创 CDA Level1知识点总结之业务数据分析
业务数据分析数据驱动型业务管理方法指标的应用与设计常用场景指标1.流量相关指标2.转化相关指标3.营运、销售相关指标4.库存相关指标(难以理解)5.绩效类指标6.客户相关指标设计新指标客户分析行为效果分析业务分析模型业务分析方法数据驱动型业务管理方法数据的产生和应用:记住企业的目的是为了盈利、挣钱,所有的数据分析、经验参考产生的决策都是为了这一目的。数据分析是锦上添花,而人员经验、执行能力才是雪中送炭。说白了,人才是根本重要的。指标的应用与设计指标的作用–用汇总数据量化业务强弱指标的理解–对度量的
2021-09-19 16:03:22
2276
2
原创 CDA Level1知识点总结之多维数据透视分析
多维数据透视分析策略分析考点精讲多维数据模型概述OLAP多维数据模型创建方法5W2H思维模型基本透视规则透视规则扩展多维透视分析应用习题汇总策略分析本章是新版新加的内容,考试中占较大比重,学习起来有一定难度,需要引起高度重视。考点精讲多维数据模型概述OLAP针对于表数据结构,以字段或记录作为数据的引用、操作和计算的基本单位的数据。维度–业务角度,维度字段–文本型,度量—业务行为结果,度量字段–数值型。数据透视–对零散数据进行汇总分析。维度表–只包含维度信息,事实表–既包含维度信息,也包含度量
2021-09-14 17:27:49
2408
2
原创 CDA Level1知识点总结之描述性统计分析
描述性统计分析策略分析考点总结描述性统计分析介绍描述性统计图表--直方图、散点图、箱型图统计分布相关分析参数估计点估计区间估计假设检验习题整理(易错题、难题)策略分析参数估计与假设检验是重点难点。考点总结描述性统计分析介绍描述性统计分析是研究数据收集、处理和描述的统计学方法。统计学是一门收集、处理、分析、解释数据并从数据中得到结论的科学。数据分类:分类型、顺序型、数值型统计学的基本概念:总体与样本、参数(总体的某种特征值如均值)与统计量(样本的特征值)描述统计5大指标:1.总体规模的描
2021-09-13 20:46:17
3694
5
原创 CDA Level1知识点总结之数据库应用
数据库应用策略分析考点总结数据库概述数据定义语言DDL--增删改查数据操作语言DML--数据填充、修改、删除数据库查询执行顺序select 语句的操作符查询操作符与子查询函数习题整理(易错题、难题)策略分析考试时都是选择题,不会让你直接写sql查询语句,但这一章节很多语法细节点,很多的知识盲区,需要高密度的积累。考点总结数据库概述数据库是存储、调用、分析数据的仓库,分关系型数据库(Oracle、DB2、Microsoft SQL Server、MySQL)和非关系型数据库(MongoDB、Redi
2021-09-13 15:44:08
2180
1
原创 CDA Level1知识点总结之数据结构
数据结构策略分析考点总结表格结构数据特征表格结构数据获取、引用、查询与计算表结构数据特征5%表结构数据获取、加工与使用数据获取数据使用习题整理(易错题、难题)知识升华策略分析PART 2 数据结构(占比15%)a. 表格结构数据特征(占比2%)b. 表格结构数据获取、引用、查询与计算(占比3%)c. 表结构数据特征(占比5%)d. 表结构数据获取、加工与使用(占比5%)这一章节重要在于理解表格结构和表结构的特征和区别,主键考点总结数据类别:结构化数据(企业系统可触达的业务范围内,数据信息完
2021-09-13 10:14:01
2183
原创 CDA Level1知识点总结之数据分析概述与职业操守
数据分析概述与职业操守策略分析考点总结前导课数据分析概述与职业操守1. 数据分析概念、方法论、角色2. 数据分析师职业道德与行为准则3. 大数据立法、安全、隐私习题整理(易错题、难题)知识升华策略分析PART 1 数据分析概述与职业操守(占比3%)a. 数据分析概念、方法论、角色(占比1%)b. 数据分析师职业道德与行为准则(占比1%)c. 大数据立法、安全、隐私(占比1%)这一节占比很小,1小时内搞定。可凭常识回答,无易混淆或难理解的点。考试时单选3道,多选1道。考点总结前导课前导课的
2021-09-13 10:13:07
5134
8
原创 CDA Level1知识点总结之总论
CDA Level1 系列文章目录总论考试形式与试卷结构报考须知PART 1 数据分析概述与职业操守(占比3%)PART 2 数据结构(占比15%)PART 3 数据库应用(占比17%)PART 4 描述性统计分析(10%)PART 5 多维数据透视分析(10%)PART 6 业务数据分析(30%)PART 7 业务分析报告与数据可视化报表(15%)学习方法总论来自一个只有15天复习时间的拖延症晚癌期学渣的碎碎念。考试形式与试卷结构考试方式:线下考试,上机答题考试题型:客观选择题(单选80 题+内
2021-09-10 10:56:34
2842
12
原创 数据分析方法论
1. 理解数据分析在工作上,数据分析就是把隐藏在一大批看似杂乱无章的数据背后的信息集中和提炼出来,总结出所研究对象的内在规律,帮助管理者进行有效的判断和决策。数据分析在企业的日常经营分析中主要有三大作用------现状分析、原因分析和预测分析。现状分析就是告诉你在短暂的过去发生了什么,一方面让你了解企业现阶段的整体运营情况,好坏的程度如何,另一方面告诉你企业各项业务的构成,了解各项业务的发展及变动情况。现状分析一般通过日报、周报、月报等形式。原因分析则告诉你某一现状为什么发生。原因分析一般通过专题分
2021-05-25 17:24:30
1749
原创 Python办公自动化之收发邮件--163和qq邮箱
利用Python发送接收邮件1.邮件相关概念POP3:Post Office Protocol 3的简称,即邮局协议的第3个版本,它规定怎样将个人计算机连接到Internet的邮件服务器和下载电子邮件的电子协议。SMTP:Simple Mail Transfer Protocol,即简单邮件传输协议。IMAP:Internet Mail Access Protocol,即交互式邮件存取协议,它是跟POP3类似邮件访问标准协议之一。tips:注意!!写代码发邮件时一定要注意不能频繁发送!容易被当做垃
2021-04-19 15:24:33
2288
1
原创 不确定建模学习笔记
一、介绍:了解我们不知道的事物的重要性二、不确定性语言三、贝叶斯深度学习四、不确定性质量五、应用六、深入洞察七、研究展望第一节:知道我们所不知道的。1.1Aleatoric uncertainty and epistemic uncertainty 任意不确定性和认知不确定性认知不确定性也称model uncertainty(模型不确定性),包含unce...
2021-04-01 05:55:37
1602
原创 git 学习问题集锦
1.切换到某盘下的文件,属性中是E:\Git_Files\story1,但命令行不识别\.2.git push origin master 显示everything up-to-date有三种可能原因:一、忘记git add,git commit二、远程库也做了修改,且远程库更新,需要git fetch ,git log,将远程更新下载再将本地库提交。三、远程库是空的,没
2021-04-01 05:54:46
210
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人