- 博客(57)
- 收藏
- 关注
原创 coze ai assistant Task5
没想到coze的组队学习这么快就过去了,我也从一个不懂coze的小白变成了一个能简单尝试小程序的懵懂小白。虽然几次学习并不能掌握很多的技能,但也让我知道coze的无限可能,组队结束后我会继续努力学习,做更多使自己偷懒的小工具~需要注意,API分享只能分享智能体,应用并没有找到,应该是用OAuth,但还没学会……
2025-03-21 00:08:59
255
原创 AI+办公 Task3
不符合我的预期,目前AI制作的PPT的美观度有待改善,而且文字占比过高,看起来不易读取。暂时也没有其他可以解决的办法,只能下载后另行修改。你认为讯飞智文做的PPT符合你的预期吗?如果没有,展开讲讲用AI做PPT的局限性以及如何解决问题的思路。要求:PPT必须能准确、形象的表达出你的中心思想。· 有详实的内容,PPT页数下限30;· 可以不用具体数据图表;· 可以用写意类配图;
2025-03-18 08:46:21
130
原创 coze ai assistant Task 3
Coze工作流支持通过可视化的方式,对插件、大语言模型、代码块等功能模块进行组合,从而实现复杂、稳定的业务流程编排。当目标任务场景包含较多的步骤,且对输出结果的准确性、格式有严格要求时,适合配置工作流来实现。
2025-03-16 23:31:48
415
原创 AI+办公 Task2
如果数据量过大,可将表格按时间、部门等维度拆分,分批次上传分析;判断AI表格正确:可以对关键指标(如平均值、总和)手动抽样计算。
2025-03-13 21:36:39
322
原创 AI+办公 Task1
AI幻觉,是指大语言模型编造它认为是真实存在的甚至看起来合理或可信的信息。大模型出现幻觉,简而言之就是“胡说八道”,准确而言,是指模型生成的内容与现实世界事实或用户输入不一致的现象。研究人员将大模型的幻觉分为事实性幻觉(Factuality Hallucination)和忠实性幻觉(Faithfulness Hallucination)。致使大模型产生幻觉的原因主要有数据缺陷、数据中捕获的事实知识的利用率较低,长尾知识回忆不足、难以应对复杂推理的情况等。<引用自百度百科>
2025-03-10 21:54:40
861
原创 Binary classification
以下是数据集 churn_df 的前几行(.head())的示例。你可以预期数据集中其余部分包含类似值。监督学习有两种类型——分类和回归。二元分类用于预测仅包含两个标签的目标变量,通常用0或1的数值表示。查看这些数据,哪一列可能是二元分类的目标变量?
2025-02-10 13:46:50
125
原创 动手学深度学习 Task03:线性神经网络
假设1:影响房价的关键因素是卧室个数,卫生间个数和居住面积,记为。线性回归是对n维输入的加权,外加偏差。线性回归有显示解(只有线性回归有)假设2:成交价是关键因素的加权和。权重和偏差的实际值在后面决定。1/2是因为求导时候容易消去。训练数据:过去6个月卖的房子。线性回归是单层神经网络。
2023-03-23 23:52:57
844
原创 动手学深度学习 Task02:预备知识
4-d:N个三维数组(一个RGB图片批量)2-d(矩阵):一个样本的特征矩阵。3-d:RGB图片(宽、高、通道)1-d(向量):一个特征向量。0-d(标量):一个类别。5-d:一个视频的批量。
2023-03-21 23:29:37
922
1
原创 大话设计模型 Task05 状态、适配、单例
状态模式(State),当一个对象的内在状态改变时允许改变其行为,这个对象看起来像是改变了其类。适配器模式(Adapter),将一个类的接口转换成客户希望的另外一个接口。Adapter模式使得原本由于接口不兼容而不能一起工作的那些类可以一起工作单例模式(Singleton),保证一个类仅有一个实例,并提供一个访问它的全局访问点。通常我们可以让一个全局变量使得一个对象被访问,但它不能防止你实例化多个对象。一个最好的办法就是,让类自身负责保存它的唯一实例。
2022-12-24 23:49:23
1641
原创 大话设计模型 Task01:设计原则
我们在做任何系统的时候,都不要指望系统一开始时需求确定,就再也不会变化,这是不现实也不科学的想法,而既然需求是一定会变化的,那么如何在面对需求的变化时,设计的软件可以相对容易修改,不至于说,新需求一来,就要把整个程序推倒重来,怎样的设计才能面对需求的改变却可以保持相对稳定,从而使得系统可以在第一个版本以后不断推出新的版本呢?类之间的耦合越弱,越有利于复用,一个处在弱耦合的类被修改,不会对有关系的类造成波及.也就是说,信息的隐藏促进了软件的复用。即对于扩展是开放的,对于更改是封闭的。也即这个类只有一个职责。
2022-12-13 23:17:35
1227
原创 西瓜书Task01
这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Mar
2021-07-13 08:12:04
1122
原创 学术前沿趋势分析Task05
一、任务说明学习主题:作者关联(数据建模任务),对论文作者关系进行建模,统计最常出现的作者关系;学习内容:构建作者关系图,挖掘作者关系学习成果:论文作者知识图谱、图关系挖掘二、数据处理步骤将作者列表进行处理,并完成统计。具体步骤如下:将论文第一作者与其他作者(论文非第一作者)构建图;使用图算法统计图中作者与其他作者的联系;三、社交网络分析图是复杂网络研究中的一个重要概念。Graph是用点和线来刻画离散事物集合中的每对事物间以某种方式相联系的数学模型。Graph在现实世界中随处可见,
2021-01-24 00:05:16
1024
原创 学术前沿趋势分析Task04
一、任务说明学习主题:论文分类(数据建模任务),利用已有数据建模,对新论文进行类别分类;学习内容:使用论文标题完成类别分类;学习成果:学会文本分类的基本方法、TF-IDF等;二、数据处理步骤在原始arxiv论文中论文都有对应的类别,而论文类别是作者填写的。在本次任务中我们可以借助论文的标题和摘要完成:对论文标题和摘要进行处理;对论文类别进行处理;构建文本分类模型;三、文本分类思路思路1:TF-IDF+机器学习分类器直接使用TF-IDF对文本提取特征,使用分类器进行分类,分类器
2021-01-22 20:56:02
1007
原创 学术前沿趋势分析Task03
一、任务说明任务主题:论文代码统计,统计所有论文出现代码的相关统计;任务内容:使用正则表达式统计代码连接、页数和图表数据;任务成果:学习正则表达式统计;二、数据处理步骤在原始arxiv数据集中作者经常会在论文的comments或abstract字段中给出具体的代码链接,所以我们需要从这些字段里面找出代码的链接。确定数据出现的位置;使用正则表达式完成匹配;完成相关的统计;三、正则表达式正则表达式(regular expression)描述了一种字符串匹配的模式(pattern),可
2021-01-18 22:10:29
873
原创 学术前沿趋势分析Task02
一、任务说明任务主题:论文作者统计,统计所有论文作者出现评率Top10的姓名;任务内容:论文作者的统计、使用 Pandas 读取数据并使用字符串操作;任务成果:学习 Pandas 的字符串操作;二、数据处理步骤在原始arxiv数据集中论文作者authors字段是一个字符串格式,其中每个作者使用逗号进行分隔分,所以我们我们首先需要完成以下步骤:使用逗号对作者进行切分;剔除单个作者中非常规的字符;在原始数据集中authors_parsed字段已经帮我们处理好了作者信息,可以直接使用该字段
2021-01-16 11:57:02
880
原创 编程实践(Pandas)期末综合练习
1. 显卡日志下面给出了3090显卡的性能测评日志结果,每一条日志有如下结构:Benchmarking #2# #4# precision type #1##1# model average #2# time : #3# ms其中#1#代表的是模型名称,#2#的值为train(ing)或inference,表示训练状态或推断状态,#3#表示耗时,#4#表示精度,其中包含了float, half, double三种类型,下面是一个具体的例子:Benchmarking Inference f
2021-01-13 23:17:56
1499
原创 学术前沿趋势分析Task01
一、任务说明任务主题:论文数量统计,即统计2019年全年计算机各个方向论文数量;任务内容:赛题的理解、使用 Pandas 读取数据并进行统计;任务内容:任务成果:学习 Pandas 的基础操作;二、数据集介绍数据集的格式如下:id:arXiv ID,可用于访问论文;submitter:论文提交者;authors:论文作者;title:论文标题;comments:论文页数和图表等其他信息;journal-ref:论文发表的期刊的信息;doi:数字对象标识符,https://www
2021-01-11 23:40:20
1070
原创 编程实践(Pandas)Task10
一、时序中的基本对象几个概念:时间戳(Date times)的概念:在 pandas 中称为 Timestamp 。同时,一系列的时间戳可以组成 DatetimeIndex ,而将它放到 Series 中后, Series 的类型就变为了 datetime64[ns] ,如果有涉及时区则为 datetime64[ns, tz] ,其中tz是timezone的简写。时间差(Time deltas)的概念:两个 Timestamp 做差就得到了时间差,pandas中利用 Timedelta 来表示。类似
2021-01-10 23:52:32
917
原创 编程实践(Pandas)Task09
一、cat对象1. cat对象的属性在 pandas 中提供了 category 类型,使用户能够处理分类类型的变量,将一个普通序列转换成分类变量可以使用 astype 方法。df = pd.read_csv('data/learn_pandas.csv', usecols = ['Grade', 'Name', 'Gender', 'Height', 'Weight'])s = df.Grade.astype('category')s.head()0
2021-01-07 23:23:16
165
原创 编程实践(Pandas)Task08
一、str对象1. str对象的设计意图str 对象是定义在 Index 或 Series 上的属性,专门用于逐元素处理文本内容,其内部定义了大量方法,因此对一个序列进行文本处理,首先需要获取其 str 对象。在Python标准库中也有 str 模块,为了使用上的便利,有许多函数的用法 pandas 照搬了它的设计:var = 'abcd'# 字母转为大写str.upper(var)>>> 'ABCD's = pd.Series(['abcd', 'efg', 'hi'])
2021-01-06 23:47:19
389
1
原创 编程实践(Pandas)Task07
一、缺失值的统计和删除1. 缺失信息的统计缺失数据可以使用 isna 或 isnull (两个函数没有区别)来查看每个单元格是否缺失,结合 mean 可以计算出每列缺失值的比例:df = pd.read_csv('data/learn_pandas.csv', usecols = ['Grade', 'Name', 'Gender', 'Height', 'Weight', 'Transfer'])df.head() Grade Name Gender H
2021-01-03 19:56:11
191
原创 编程实践(Pandas)综合练习1
心得:花了一天时间做出来了三道题,但是办法实在太笨了,后面希望可以看一下优秀笔记的写法,多学习多练习。时间已经过去了半个多月,从不会写代码到现在已经可以独立做出综合练习(虽然办法很笨,感觉有很多地方想复杂了),自己感觉还是很开心的,继续努力!1. 企业收入的多样性一个企业的产业收入多样性可以仿照信息熵的概念来定义收入熵指标:I=−∑ip(xi)log(p(xi))\rm I=-\sum_{i}p(x_i)\log(p(x_i))I=−∑ip(xi)log(p(xi)),其中p(xi)\rm p
2021-01-01 21:45:49
367
原创 编程实践(Pandas)Task06
一、关系型连接1. 连接的基本概念把两张相关的表按照某一个或某一组键连接起来是一种常见操作,在关系型连接中, 键 是十分重要的,往往用 on 参数表示。另一个重要的要素是连接的形式。在 pandas 中的关系型连接函数 merge 和 join 中提供了 how 参数来代表连接形式,分为左连接 left 、右连接 right 、内连接 inner 、外连接 outer 。2. 值连接两张表可以根据某一列的值来连接,还可以通过几列值的组合进行连接,这种基于值的连接在 pandas 中可以由 merge
2020-12-29 23:24:23
137
原创 编程实践(Pandas)Task05
一、长宽表的变形什么是长表?什么是宽表?这个概念是对于某一个特征而言的。pd.DataFrame({'Gender': ['F','F','M','M'], 'Height':[163, 160, 175, 180]}) Gender Height0 F 1631 F 1602 M 1753 M 180pd.DataFrame({'Height: F':[163, 160], 'Height: M':[175, 180]}) He
2020-12-27 22:05:35
443
2
原创 编程实践(Pandas)Task04
一、分组模式及其对象1. 分组的一般模式想要实现分组操作,必须明确三个要素:分组依据 、 数据来源 、 操作及其返回结果 。一般模式:df.groupby(分组依据)[数据来源].使用操作df = pd.read_csv('data/learn_pandas.csv')# 按照性别统计身高中位数df.groupby('Gender')['Height'].median()GenderFemale 159.6Male 173.4Name: Height, dtype: f
2020-12-25 22:21:50
757
原创 编程实践(Pandas) Task03
一、索引器1. 表的列索引列索引是最常见的索引形式,通过[列名]可以从 DataFrame 中取出相应的列,返回值为Series。如果单列且列名中不含有空格,也可以使用.列名的方式取出,与[列名]等价。df['Name'].head() #使用 [列名] 取出相应的列0 Gaopeng Yang1 Changqiang You2 Mei Sun3 Xiaojuan Sun4 Gaojuan YouName: Name, dtype
2020-12-22 23:47:32
1041
2
原创 编程实践(Pandas) Task02
一、文件的读取和写入excelcsvtxt文件读取pd.read_excel()pd.read_csv()pd.read_table()数据写入to_excel()to_csv()to_csv()1. 文件读取csv文件读取:pd.read_csvpandas.read_csv(filepath_or_buffer, sep=’,’, delimiter=None, header=‘infer’, names=None, index_col=Non
2020-12-19 23:39:02
621
1
原创 编程实践(Pandas) Task01
1. PIP安装第三方库pip install + 包名 #安装包pip uninstall + 包名 #卸载包pip freeze #查看已安装的包及其版本pip list --outdated #查看可升级的包pip install -U <包名> #升级指定包(包括pip本身)python -m pip install --upgrade pip #升级pip版本2. Python基础2.1 列表推导式案例中给出的初始写法:L = []def my_func
2020-12-16 23:24:51
233
2
原创 DataCamp课程:Transactions and Error Handling in SQL Server
1. Starting with error handling
2020-08-06 23:11:24
1694
原创 DataCamp课程:Introduction to Python
1. Python Basics</> The Python InterfaceExperiment in the IPython Shell; type 5 / 8, for example.Add another line of code to the Python script on the top-right (not in the Shell): print(7 + 10).Hit Submit Answer to execute the Python script and r
2020-07-31 13:52:48
9272
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人