- 博客(42)
- 资源 (4)
- 收藏
- 关注
原创 【阅读笔记】Three ways ChatGPT helps me in my academic writing
关于GPT进行润色的文章,摘取了里面的提示词做个记录。
2024-12-04 16:31:57
940
原创 大语言模型技术相关知识-笔记整理
这个系列攒了很久。主要是前段之间面试大语言模型方面的实习(被拷打太多次了),然后每天根据面试官的问题进行扩展和补充的这个笔记。内容来源主要来自视频、个人理解以及官方文档中的记录。方便后面的回顾。
2024-12-04 15:59:29
1338
原创 langchain报错记录(js)
后面查找安装包的路径发现在dist下面。后面又出现了如上错误,发现是langchain中的package.json中没有export相关路径。报错: import { PromptTemplate } from “langchain/dist/prompts”;中文的js文档写的是。
2024-09-20 01:42:59
299
原创 AI 音频/文本对话机器人:Whisper+Edge TTS+OpenAI API构建语音与文本交互系统(简易版)
在本篇博客中,我将分享如何利用Whisper模型进行语音转文本(ASR),通过Edge TTS实现文本转语音(TTS),并结合OpenAI API实现文本生成的语音与文本交互系统。这个系统可以用于构建智能助手、语音交互应用等场景。前段时间学了英伟达系列课程,最近有时间基于视频中的demo设计了一个支持文本和语音问答的ai机器人。一个内网ip可供访问,一个公网ip 72小时有效视频效果展示AI 音频/文本对话机器人。
2024-08-26 00:01:54
1761
原创 使用Node.js和Cheerio爬取百度搜索结果并提取相关信息
本文将介绍如何使用Node.js和Cheerio库从百度搜索结果中抓取指定关键词的相关网页链接,并进一步提取这些网页的内容。通过以上步骤,我们实现了从百度搜索结果中抓取指定关键词的相关网页链接,并进一步提取这些网页的内容。此外,还利用了一个AI模型对抓取的内容进行了处理,以提取出更具体的信息。需要注意的是,实际应用中可能还需要考虑更多因素,比如反爬虫策略、请求频率限制等。Cheerio: 一个快速、灵活且健壮的HTML解析器,类似于jQuery,用于处理HTML文档。Axios: 用于发起HTTP请求。
2024-08-24 23:42:13
439
原创 Bert学习笔记
被替换的token中80%的机率替换成掩码,10%的几率替换成别的token,剩下10的几率从vocab中替将标签换成对应位置的索引。句子位置编码:[0, 0, 0, 0, 0, 0, 1, 1, 1, 1] (0表示第一句话,1表示第二句话)注意力掩码:[1, 1, 1, 1, 1, 1, 1, 1, 1, 1] (1表示非填充,0表示填充。用于给定序列中每个位置的词添加位置信息,以便模型能够区分序列中不同位置的词。位置编码:[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
2024-07-31 14:49:34
983
原创 实现基于LLM的VSCode代码补全插件及网络搜索功能
最近在开发vscode插件相关的项目,网上很少有关于大模型作为AI 编程助手这方面的教程。因此,借此机会把最近写的几个demo分享记录一下。
2024-07-23 09:46:04
1241
原创 【遇坑笔记】Node.js 开发环境与配置 Visual Studio Code
最近部署vscode插件的代码,主要用的是javascript和node.js,这里记录一下遇到的几个坑。
2024-07-01 13:42:55
536
原创 统计分析方法-非参数检验-python
记录一下自非参数检验的学习过程,如有不对请纠正。Cliff’s Delta表示两个组的效果大小,范围在-1到1之间:δ = 1 表示所有值在样本A中都大于样本B。δ = -1 表示所有值在样本B中都大于样本A。δ = 0 表示两个样本没有差异。具体的假设,例如δ>0.33时,则认为ES(effect size)较大。该检验用于评估在一组配对数据中的差异是否显著。适用于:1.两个配对样本。2.相关样本之间的比较。
2024-06-18 15:13:33
2611
原创 头歌python
本关任务:顺序查找是一种简单的查找算法,它遍历待查找的元素列表,按照元素出现的频次进行查找。给定一个包含 N 个整数的列表,设计一个 Python 算法,查找列表中出现频次最高的元素,并返回该元素。这里的i in dict中,i指的是字典中的key。思路:用字典进行存储,考字典的操作。思路:用列表list存储。主要是考强制类型转换。
2023-11-25 20:57:01
598
2
原创 解决python Process finished with exit code -1073741571 (0xC00000FD)问题
参考链接:https://blog.youkuaiyun.com/qq_31293215/article/details/88350910。参考链接: https://blog.youkuaiyun.com/ztf312/article/details/81296772。(2)修改-Xmx750m 成-Xmx3072m或其他,不要超过电脑内存,保存重启pycharm生效。修改方法:return 改为yeild,然后后面加上尾递归改造的函数。(1)Help->Find Action->搜VM->**解决方案:**尾递归优化。
2023-09-27 20:05:09
2414
原创 【学习笔记】Python+Selenium4
id一般来说是唯一的,如果有重复的id,网页可以展示,但是JS会报错。一般来说只有第一个jd是有效的。第一行代码默认点击第一个元素。第二行代码点击第五个对应的元素。CSS中可能有多个重复的class_name。如下图所示,含有href链接。一般在表单元素会出现。python基础语法。2.点击”新闻“标签。
2023-08-29 19:34:23
503
原创 【文献笔记】系统文献综述系列
记录一下论文中有帮助的点以及自己的理解。如有不对请批评指正。持续更新中。。。背景:应用多语言的异构软件应用呈现上升趋势,逆向工程师需要解决跨语言链接和之间的依赖关系。动机:通过系统文献综述总结了不同的方法、工具,技术缺陷,并在对最先进的软件应用程序进行逆向工程时,了解XXL和它们依赖。选取了76篇文献。创建了‘go-to’文献数据库,软件工程专业人员可以在其中找到与Java企业应用、Android应用等主要多语种应用的分析和XLL检测相关的所有内容。分析了现有技术在当代软件应用中面临的问题和局限。
2023-08-27 20:29:17
241
原创 文本相似度系列-python代码复现
模型我这里用的是:xmnlp-onnx-models-v5.zip,可以在github中安装。安装指令:pip install -U xmnlp。
2023-06-30 11:54:41
533
1
原创 Pytorch安装配置
3. 我目前的电脑是英伟达的显卡,所以只能用cup,不需要下载cuda,直接pytorch里面下载# CPU only对应的版本即可。命令行指令(nvidia-smi)查看最高的可安装的cuda版本。2. 根据cude,安装对应版本pytorch。4. python终端看torch和cuda是否安装成功。
2023-06-28 20:24:43
156
原创 基于目标速度约束的节能列车运行控制优化策略(2023年数维杯B题)
在城市交通电气化进程快速推进的同时,与之相应的能耗增长和负面效应也在迅速增加。为发掘城轨系统减碳节能的潜力,准确分析列车牵引能耗的影响因素并研究节能降耗措施,实现列车的运行能耗优化,达到节能目的。
2023-06-03 15:41:34
4716
5
原创 java代码打包成.exe文件(便携版和安装版)
这里记录一下如何在win10系统中将java代码打包成便携版和安装版的过程。便携版:1、在myeclipse中导出为可运行的jar文件和zip文件。2.导出成功后,找到java源代码(1中的.zip文件可以直接解压找到),将java文件的图片、jar包复制粘贴在一起。并准备一张后缀为.ico的图片作为.exe文件的图标。3、关键一步:在电脑中找到自己安装的jre包,我的路径是C:\Program Files\Java,复制粘贴到存放jre的文件夹中。4、将文件名改为jre。5、打开exe
2022-12-22 01:56:38
933
原创 基于SIR模型对某市新型冠状病毒疫情趋势的分析(matlab)
上数学建模课写的。小白记录一下(数据为2020年6月的数据)思路:首先我们从官网上收集了武汉市从一月份到六月份的官方疫情数据,并将数据进行筛选处理等。然后根据数据选择了SIR传染病模型进行建模。再根据真实的数据初步确定SIR模型中未知的参数的范围,并确定一组初始值。之后使用ode45函数得数值解,并与真实数据一起构造残差平方和,得到需优化的的目标函数。采用不同的数据量来比较目标函数的标准差,从而得到最优值。最后根据使用fmincon函数粒子群等智能求解微分方程。最后通过敏感性分析的改变移出率的值,
2022-05-30 23:46:26
1998
4
原创 2018年泰迪杯数据挖掘比赛c题
一、题目提升景区及酒店等旅游目的地美誉度是各地文旅主管部门和旅游相关企业非常重视和关注的工作,涉及到如何稳定客源、取得竞争优势、吸引游客到访消费等重要事项。游客满意度与目的地美誉度紧密相关,游客满意度越高,目的地美誉度就越大。因此掌握目的地游客满意度的影响因素,切实提高游客满意度、最终提升目的地美誉度,不仅能够保证客源稳定,而且对于旅游企业科学监管、资源优化配置以及市场持续开拓具有长远而积极的作用。第一问:景区及酒店印象分析依据附件1中景区及酒店网评文本,按赛题表1格式计算出目的地TOP20热门词,并
2022-05-30 23:25:52
1697
5
原创 浙大版《C语言程序设计(第3版)》题目集习题8-4 报数(数组实现)
报数游戏是这样的:有n个人围成一圈,按顺序从1到n编好号。从第一个人开始报数,报到m(<n)的人退出圈子;下一个人从1开始报数,报到m的人退出圈子。如此下去,直到留下最后一个人。本题要求编写函数,给出每个人的退出顺序编号。函数接口定义:void Countoff(int n,int m,int out[])其中n是初始人数;m是游戏规定的退出位次(保证为小于n的正整数)。函数Countoff将每个人的退出顺序编号存在数组out[]中。因为C语言数组下标是从0开始的,所以第i个位置上的人是第o
2022-03-23 10:15:30
164
原创 同构数(c语言)
【问题描述】具有下面性质的数a称为"同构数":设b是a的平方,a与b的低若干位相同。例如,5是25的同构数,25是625的同构数编程序满足如下要求:输入两个整数a,b(0<=a,b<=99),找出a、b之间全部的同构数。【输入形式】从键盘输入0-99之间的两个整数a和b,以空格隔开。【输出形式】在屏幕上按照由小到大的顺序输出所有同构数,每一个整数占一行。【输入样例】0 30【输出样例】05625代码示例:#include<stdio.h>#includ
2022-03-09 20:38:33
8829
原创 猴子选大王(c语言,循环链表)
题目描述:n只猴子围坐成一个圈,按顺时针方向从1到n编号。然后从第q号猴子开始沿顺时针方向从q开始报数,报到m的猴子出局,再从刚出局猴子的下一个位置重新开始报数,如此重复,直至剩下一个猴子,它就是大王。输入:输入两个整数n和m,1<=m<=n<=100。输出:输出猴王的编号样例输入7 4 3样例输出4样例说明:n=7 m=4 n=3代码思想:一共四个函数,第一个函数:创建链表,得到头结点第二个函数:显示链表(方便测试)第三个函数:p,q分别指向头结点和尾节点。第一次
2022-03-09 19:56:31
4072
2
原创 银行客户违约信息分析(数据挖掘)
一、摘要“data.xsl”文件中的数据是某银行收集到的客户违约信息,现设待分析的因变量是违约,其他变量是可能影响客户是否违约的因素。本文对数据进行了数据探索,对数据的基本情况、相关性进行了一定的分析;数据清洗使用了填充、取均值、删除异常值的方法;利用绘制热力图选择了合适的特征向量;最后,采用决策树、若决策数、AdaBoost分类模型进行比较分析并比较几种分类方法的准确率。AdaBoots分类模型的准确率比较高。二、实验内容1、数据探索模块:(1)将xls文件转换为csv文件(2)了解数据表的基
2022-01-18 14:14:21
13388
原创 手写体识别
sklearn 中有个手写数字数据集,调用的方法是 load_digits(),(1)请创建一个 CART 分类树,对手写数字数据集做分类。(2)请另外选取一部分测试集,统计下分类树的准确率?(1)CARD分类树创建:(2)准确率:(3)代码展示:...
2022-01-18 14:06:29
674
原创 基于Xgboost的wine分类
(1)将wine的数据进行多分类,分成三类:(2)代码展示:注意:1、y, x = np.split(data, (1,), axis=1)在分类问题上要注意y是哪一个,(1,)代表的是第一列和第二列之间进行分类,axis=1代表横向分类2、x = StandardScaler().fit_transform(x)标准化注意导包:from sklearn.preprocessing import StandardScaler...
2022-01-18 14:04:26
640
原创 第一次下载社区版pycharm,打不开
步骤:先下载anaconda,然后window+R,输入cmd输入python,表示配置环境成功但是pycharm的最新版下载后我就一直打不开我查询了网上的,试了以下的几个方法一、换了一个落后版本的anacon,卸载重装了anaconda和pycharm二、C:\Users\ygw\AppData\Roaming\JetBrains (删除该目录即可,一般由于升级安装 或 安装两个不同版本 会存在老旧文件影响导致)三、打开任务管理器,在后台进程里找到pycharm关闭即可。四、电脑可能缺少了
2021-03-10 19:03:17
2220
1
原创 数值分析(代码)-梯形公式、辛普森公式、复合梯形公式、复合辛普森公式
习题5.4运行代码:main.h:clc;clear;format long;h=1/6;%h=1/8;%例5.4N=(1-0)/h;x=0:h:1;s_t=f(x(1));for n=1:N-1 s_t=s_t+2*f(x(n)+h);ends_t=s_t+f(x(N+1));s_t=s_t*h/2;s_ts=0;for n=1:4 s=s+2*f((2*n-1)/8)+f(n/4);ends=2*s+f(0)-f(1);s=s/24f.m:fun
2021-02-04 13:29:17
3348
原创 数值分析(代码)-Lagrange插值、Newton插值、曲线拟合方法
Lagrange插值-习题4.1习题代码:main.h:clc;clear;format long;x0=-5:1:5;y0=cos(x0)./sqrt(1+(sin(x0)).^2);x=-5:0.1:5;y=lagrange(x0,y0,x);figure;plot(x,y,'r--','LineWidth',3);hold onw=-5:0.01:5;v=cos(w)./sqrt(1+(sin(w)).^2);plot(w,v,'b-','LineWidth',3);
2021-02-04 13:27:42
616
原创 数值分析(代码)-Gauss-Seidel迭代法
``Gauss-Seidel迭代法-例3.8clc;clear;format longA=[5,-1,-1,-1;-1,10,-1,-1;-1,-1,5,-1;-1,-1,-1,10];b=[-4;12;8;34];x=[1,2,3,4]’;D = diag(diag(A));B = -(D+tril(A,-1))\triu(A,1);f= (D+tril(A,-1))\b;x0 = zeros(length(b),1);x1 =Bx0+ f;n= 1;while norm(x-x1,
2021-02-04 13:24:35
580
原创 数值分析(代码)-Doolittle分解法、改进的Cholesky分解法、追赶法
Doolittle分解法-习题3.2习题代码:main.h:clc;clear;format long;A=[3,2,-1,2;1,4,0,2;2,1,2,-1;1,1,-1,3];b=[-2;1;3;4];lux(A,b)lux.m:function x=lux(A,b)[n,n]=size(A);L=zeros(n); U=zeros(n);x=zeros(n,1); y=zeros(n,1);for r=1:nfor i=r:nU(r,i)=A(r,i)-sum(L(r,1:r
2021-02-04 13:22:55
932
原创 数值分析(代码)-Picard迭代法、Newton迭代法
Picard迭代法-习题2.5代码:Main.h:clc;clear;format long;tol=10^(-8);x0=0.5;x1=(cos(0.5)*x0-sin(x0)+1)/(1+cos(0.5));k=1;while abs(x1-x0) >=tolx0=x1;x1=(cos(0.5)*x0-sin(x0)+1)/(1+cos(0.5));k=k+1;endkx1运行结果:x1=0.510973429388219k=4Newton迭代法-习题2.6代
2021-02-04 13:19:29
5470
selenium+python代码合集
2023-08-29
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人