- 博客(120)
- 收藏
- 关注
原创 ChatBI≠NL2SQL:关于问数,聊聊我踩过的坑和一点感悟
"如果说数据是新时代的石油,智能问数就是能让普通人也能操作的智能钻井平台。"这里是**AI粉嫩特攻队!** ,这段时间真的太忙了,不过放心,关于从零打造AI工具的coze实操下篇正在进行中。今天,我们先聊聊另一个很热闹的主题——ChatBI。还记得那些陷入Excel地狱的日子吗?当同事问你"上个季度我们的销售增长率是多少",你只能叹口气,打开庞大的数据库,编写一段复杂的SQL语句,然后祈...
2025-03-09 14:29:00
796
原创 当懒惰遇上AI:我如何用Coze让大模型帮我整理2.5万字课程笔记
能写代码绝不动手,能用AI绝不写代码 —— AI粉嫩特攻队信条通过本文学会打造这个AI工具,只有一个要求:识字且会上网!一个小困扰有朋友最近在上一位大佬的线上直播课程,感叹道:"老师讲得很好但节奏太快,根本来不及记录详细笔记,只能速记要点。课后想不起完整内容又怕有遗漏,只能来回拖动进度条找对应时间点,既耗时又耗心力。"作为一名坚守"能写代码绝不动手,能用AI绝不写代码"信条的特攻队...
2025-03-05 00:42:00
895
原创 AI时代的灵魂拷问:我们真正的核心竞争力到底是什么?
“当所有人都在谈论AI+的时候,今天我想聊一点不一样的...”上周,朋友看着我用Cursor在30分钟内完成了他过去需要两天才能完成的工作。那一刻,一种强烈的危机感涌上心头,他问我:“如果AI可以做得和我们一样好,甚至更好,那我们存在的价值是什么?”这恐怕是当下许多人都在思考的问题。时代变了,我们该怎么办?从对各行各业的影响程度来看,上一个时代属于互联网、大数据,而如今毫无疑问属于AI...
2025-03-02 21:46:00
667
原创 DeepSeek-R1的“思考”艺术,你真的了解吗?
大家好~,这里是AI粉嫩特攻队!今天咱们来聊聊一个有趣的话题——DeepSeek-R1到底什么时候会“思考”,什么时候又会选择“偷懒”?最近有朋友问我:“听说现在的AI都会‘推理’了,那它们是不是每次回答问题都要走一遍复杂的思维链(CoT)?”嗯……这个问题听起来简单,背后其实藏着R1设计的智慧和取舍。举个例子,当你问R1“你好”时,它显然不会给你甩出一串哲学式的推理过程吧?但如果问题是“如...
2025-02-22 19:57:00
322
原创 程序员的生产力神器Cursor -新手实操指南
不得不说这个Cursor AI简直是神器中的神器!???? 代码自动补全就算了,关键是它能直接读懂我的意图,秒懂需求!为你自动生成整个项目级别的代码!开发过程丝滑得像在跟老朋友聊天,代码质量贼高,效率提升1000%!这哪是什么AI助手,简直就是贴心小棉袄!???? 程序员的生产力神器 ,多一点时间做更有意义的事不香吗~本篇指南从科普、安装、配置、学习(bai)研究(piao)、项目实战演练几个方面助你上手...
2025-02-16 17:42:00
2418
原创 AI开源项目层出不穷,MIT 和 Apache2.0究竟有什么区别?
AI 开源的黄金时代,开源协议你会区分吗?这几年,AI 技术的开源浪潮席卷全球。无数个人开发者和团队贡献的AI工具和框架层出不穷,AI 开源项目正以前所未有的速度涌现。开源不仅推动了技术的普及,也让更多开发者有机会参与到前沿技术的创新中。但你有没有想过,这些开源项目背后,协议的区分有多重要?作为开源作者,你希望自己的代码被更多人使用,但也想保护自己的权益;作为 Fork 开发者,你希望合法...
2025-02-16 17:25:00
604
原创 人人都看得懂的DeepSeek入门科普
当大家都在好奇下一代AI会怎样改变我们的工作与生活时,中国公司 DeepSeek 正以惊人的速度和态度闯进大众视野。它究竟是什么,能做什么,又为何能在AI热潮里高调崭露头角?本文带你了解 DeepSeek 及其最新推出的两款大模型,顺便一起讨论它如何搅动整个 AI 行业的水面。1. DeepSeek是什么?DeepSeek = AI + 国产 + 免费 + 开源 + 强大DeepSeek...
2025-02-16 17:04:00
681
原创 DeepSeek普照的阳光下,继续RAG还是Distillation?
什么是RAGRAG概述RAG,全称为Retrieval-Augmented Generation(检索增强生成),是一种结合了信息检索和文本生成的人工智能技术。简单来说,RAG通过从大量文档或数据库中查找相关信息,并基于这些信息来生成更准确、更有针对性的回答或内容。为什么需要RAG?在传统的文本生成模型中,比如一些大型语言模型,它们虽然能够生成流畅的文本,但有时候会因为训练数据有限或者记...
2025-02-16 16:39:00
532
原创 在windows主机本地快速部署使用deepseek-r1大模型
一台配备 Windows 操作系统、12GB 或以上显存的英伟达显卡、8GB 或以上内存,并能连接互联网的电脑可以继续阅读以下内容。简介Ollama(用于下载和启动大模型)Ollama 专注于本地大型语言模型(LLM)的快速、极简安装和使用,例如 LLaMA 3.3 和 DeepSeek-R1。它提供开箱即用的体验,适合个人开发者和小规模实验研究,但不适用于高可用性和高并发的生产环境。...
2025-02-16 16:13:00
793
原创 用python做时间序列预测十:时间序列实践-航司乘客数预测
本文以航司乘客数预测的例子来组织相关时间序列预测的代码,通过了解本文中的代码,当遇到其它场景的时间序列预测亦可套用。航司乘客数序列预测步骤# 加载时间序列数据_ts = load_data()# 使用样本熵评估可预测性print(f'原序列样本熵:{SampEn(_ts.values, m=2, r=0.2 * np.std(_ts.values))}')# 检验平稳...
2020-06-16 09:32:00
2590
1
原创 用python做时间序列预测九:ARIMA模型简介
本篇介绍时间序列预测常用的ARIMA模型,通过了解本篇内容,将可以使用ARIMA预测一个时间序列。什么是ARIMA?ARIMA是'Auto Regressive Integrated Moving Average'的简称。ARIMA是一种基于时间序列历史值和历史值上的预测误差来对当前做预测的模型。ARIMA整合了自回归项AR和滑动平均项MA。ARIMA可以建模任何存在一...
2020-06-16 09:30:00
7560
2
原创 用python做时间序列预测八:Granger causality test(格兰杰因果检验)
如果想知道一个序列是否对预测另一个序列有用,可以用Granger causality test(格兰杰因果检验)。Granger causality test的思想如果使用时间序列X和Y的历史值来预测Y的当前值,比仅通过Y的历史值来预测Y的当前值得到的误差更小,并且通过了F检验,卡方检验,则X对Y的预测是有一定帮助的。了解了Granger causality test的思想之...
2020-06-10 09:30:00
10080
2
原创 用python做时间序列预测七:时间序列复杂度量化
本文介绍一种方法,帮助我们了解一个时间序列是否可以预测,或者说了解可预测能力有多强。Sample Entropy (样本熵)Sample Entropy是Approximate Entropy(近似熵)的改进,用于评价波形前后部分之间的混乱程度,熵越大,乱七八糟的波动越多,越不适合预测;熵越小,乱七八糟的波动越小,预测能力越强。具体思想和实现如下:思想Sample ...
2020-06-10 09:28:00
1564
1
原创 用python做时间序列预测六:相关函数图、偏相关函数图、滞后图
经典的时间序列预测方法都是假设如果一个时间序列有显著的自相关性,那么历史值对预测当前值会很有帮助,但是究竟取多少阶的历史值,就需要通过分析相关函数图和偏相关函数图来得到。本文介绍如何什么是相关函数图和偏相关函数图,另外还会介绍一下滞后图。什么是自相关和偏自相关函数?先来解释下滞后阶数n,如果当前值和前2期的值有关,则n=2,那么可以用时间序列和它的2阶滞后序列来训练一个自回归...
2020-06-08 20:17:00
3586
2
原创 用python做时间序列预测五:时间序列缺失值处理
有的时候,一些时刻或连续时间段内的值无法采集到,或者本身就没有值,本文将介绍如何处理这种情况。一般而言,有以下几种方法:对所有的缺失值用零填充。前向填充:比如用周一的值填充缺失的周二的值后向填充:比如用周二的值填充缺失的周一的值采用n最近邻均值法填充:比如n取2,则用t-2,t-1,t+1,t+2时刻的平均值来填充缺失的t时刻的值。单线性插值:取某个缺失值的时间点,做...
2020-06-08 20:06:00
6369
1
原创 用python做时间序列预测四:平稳/非平稳时间序列
上篇文章简单提到了应该用平稳时间序列做预测,本文将介绍具体概念和原因。Stationary Series 平稳序列平稳序列有三个基本标准:1、序列的均值(mean)不应该是时间的函数(意思是不应该随时间变化),而应该是一个常数。下面的左图满足这个条件,而右图的均值受时间的变化影响。2、序列的方差(variance)不应该是时间的函数。这种特性称为homoscedastici...
2020-06-02 16:39:00
4423
2
原创 用python做时间序列预测三:时间序列分解
在初始概念篇中,我们简单提到了时间序列由趋势、周期性、季节性、误差构成,本文将介绍如何将时间序列的这些成分分解出来。分解的使用场景有很多,比如当我们需要计算该时间序列是否具有季节性,或者我们要去除该时间序列的趋势和季节性,让时间序列变得平稳时都会用到时间序列分解。加法和乘法时间序列时间序列的各个观测值可以是以上成分相加或相乘得到:Value = Trend + Seasonal...
2020-06-02 16:37:00
4375
2
原创 用python做时间序列预测二:时间序列的一般数据格式和可视化
本文将介绍如何通过python来读取、展现时间序列数据。读取时间序列数据一般用cvs等电子表格的形式存储,这里以cvs为例:from dateutil.parser import parse from datetime import datetimeimport matplotlib as mplimport matplotlib.pyplot as pltimport...
2020-06-02 16:36:00
1137
原创 用python做时间序列预测一:初识概念
利用时间序列预测方法,我们可以基于历史的情况来预测未来的情况。比如共享单车每日租车数,食堂每日就餐人数等等,都是基于各自历史的情况来预测的。什么是时间序列?时间序列,是指同一个变量在连续且固定的时间间隔上的各个数据点的集合,比如每5分钟记录的收费口车流量,或者每年记录的药物销量都是时间序列。时间序列的类型根据时间间隔的不同,时间序列可以是按年度(Annual)、...
2020-06-02 16:33:00
635
原创 深度学习环境搭建:window10+CUDA10.0+CUDNN+pytorch1.2.0
去年底入手一台联想Y7000P,配置了Nvidia GeForce GTX 1660 Ti GPU,GPU内存6G,但是因为有GPU服务器,所以一直没有在这台笔记本上跑过模型,如今经过一番折腾,终于在此笔记本上搭建好了环境,并成功使用GPU训练了一些模型,本篇记录了环境搭建的过程。检查你的GPU首先确保你的电脑有Nvidia的GPU,并且支持CUDA,可以参考这个网址。安装vs...
2020-05-06 20:22:00
1146
原创 理解中台
前段时间参加了IAS2019(互联网架构峰会),本次峰会以中台为主题,所以又称中台战略大会,据说是全国首届关于中台战略的会议,会议上有许多优秀的企业架构师带来了他们各自在实践中台过程中的心得。本文就笔者对自己参与的会场的情况做一些分享,同时也写写自己参会以及查阅相关资料后关于中台这一概念的理解和体会。什么是中台?中台不是一个新名词。然而你如果想找到它的源头,可能真不太好找...
2020-01-14 16:10:00
327
原创 OAuth2.0概念以及实现思路简介
一、什么是OAuth?OAuth是一个授权规范,可以使A应用在受限的情况下访问B应用中用户的资源(前提是经过了该用户的授权,而A应用并不需要也无法知道用户在B应用中的账号和密码),资源通常以REST API的方式暴露。二、什么是OAuth2.0?有2.0自然有1.0,相比1.0,2.0有如下不同:授权过程比1.0更简洁全程使用https,保证...
2020-01-10 11:05:00
849
原创 理解CART决策树
CART算法原理CART全称为Classification and Regression Tree。回归树相比ID3,CART遍历所有的特征和特征值,然后使用二元切分法划分数据子集,也就是每个节点都只会分裂2个分支。接着计算数据子集的总方差来度量数据子集的混乱程度,总方差越小数据子集越纯,最后选择总方差最小的划分方式对应的特征和特征值,而二元切分的依据就是将小于等于这个特征值和大...
2020-01-07 17:19:00
321
原创 理解ID3决策树
决策树是一个树形结构,类似下面这样:上图除了根节点外,有三个叶子节点和一个非叶子节点。在解决分类问题的决策树中,叶子节点就表示所有的分类,比如这里的分类就有3种:无聊时阅读的邮件、需及时处理的邮件、无需阅读的邮件。使用决策树来分类某个样本数据,就是利用根节点选取的特征,将当前输入样本划分到根节点下的某个子节点上,然后再利用子节点表示的特征来将当前样本划分到该子节点下的某个子节点上...
2020-01-07 12:20:00
354
原创 信息熵为什么要定义成-Σp*log(p)?
信息熵为什么要定义成-Σp*log(p)?在解释信息熵之前,需要先来说说什么是信息量。信息量是对信息的度量,单位一般用bit。信息论之父克劳德·艾尔伍德·香农(Claude Elwood Shannon)对信息量的定义如下:在解释这个公式之前,先看看下面的例子。比如一个黑箱里有2个苹果,8个橙子我们把从黑箱里取苹果、橙子看成是一个随机过程,X={苹果,橙子}。当我们了解到...
2020-01-07 12:01:00
1364
1
原创 用机器学习打造聊天机器人(七) 总结篇
本文是用机器学习打造聊天机器人系列的最后一篇啦,请耐心看完吧。本系列文章展示了一个聊天机器人的打造过程,现阶段更高级的聊天机器人会加入更多语料,更多意图模式,用更好的算法,以及其他更多的小技巧,比如:我们可以结合上一个系列《手把手教你做命名实体识别》中介绍的bert模型,来代替这里的词向量模型,让句向量更好的表示出原句子中各词汇之间的相关性,比如“我喜欢苹果”和"我喜欢苹果笔记...
2019-12-20 17:46:00
633
原创 用机器学习打造聊天机器人(六) 原理篇
本文是用机器学习打造聊天机器人系列的第六篇,主要介绍代码中用到的相关算法的原理。了解算法原理,可以让我们知道程序背后都做了些什么,为什么有时候会出现错误以及什么场景下选择哪种算法会更合适。word2vec我们使用的词向量模型就是基于word2vec训练的,word2vec 是 Google 在 2013 年推出的一个 NLP 工具,它的特点 是将所有的词向量化,这样词与词之间就...
2019-12-20 17:44:00
331
原创 用机器学习打造聊天机器人(五) 接入篇
本文是用机器学习打造聊天机器人系列的第五篇,在特性介绍中提到过,我们采用非侵入式设计,通过几个简单的 API 就可以接入聊天机器人到其他项目中,下面来看看具体步骤。接入步骤提供符合要求的领域问答语料的 txt 文件,按照意图类型划 分成不同的txt文件,替换本引擎自带的txt语料文件,txt语料文件示例如下:可以看到,闲聊的语料文件以QA_talk-开头,业务类的以QA_s...
2019-12-20 17:41:00
324
原创 用机器学习打造聊天机器人(四) 代码篇
本文是用机器学习打造聊天机器人系列的第四篇,将先对主要模块的代码进行展示和解读,末尾会给出完整代码的地址。建议先看主要模块的代码解读,有助于理解核心代码的思路,然后浏览完整项目代码的README文档,将项目跑起来体验以下,再针对性的根据接口去阅读各模块代码的实现。主要模块代码构造特征向量特征向量的构造有两种思想,一种是one-hot,一种是Dristributed Repres...
2019-12-10 16:45:00
295
原创 用机器学习打造聊天机器人(三) 设计篇
本文是用机器学习打造聊天机器人系列的第三篇,通过阅读本文你将对聊天机器人的实现有一个大致的思路。我们的聊天机器人将具备什么样的特性?用户可以使用人类自然语言的方式来表达自己的意图。可以依据用户的反馈进行在线增量学习,使用的越久,能回答得问题越多。采用非侵入式设计,通过几个简单的API就可以接入。语料数据使用简单的txt格式,只要更换txt,就可以服务于不同的知识领域。提...
2019-12-09 17:00:00
248
原创 用机器学习打造聊天机器人(二) 概念篇
本文是用机器学习打造聊天机器人系列的第二篇,有助我们先了解下聊天机器人的相关概念。什么是聊天机器人?聊天机器人是一个程序,该程序会回应人类的话,其载体可以是一个网页、一个桌面应用、一个app。人类使用文字或者语音的方式和其交流,其同样以文字或者语音的方式反馈给人类。如果为这样的程序套上一个音箱外表,就是智能音箱;套上一个动物外表,就是机器宠物;套上一个高仿真妹子外表,就是机器...
2019-12-09 16:43:00
163
原创 用机器学习打造聊天机器人(一) 前言
还记得手把手教你做物体检测、手把手教你做命名实体识别系列的文章吗?满满的干货有没有O(∩_∩)O,大部分读者跟着步骤来,最后都实现了其中的物体检测和命名实体识别项目。物体检测命名实体识别本系列文章,依然秉承实践为主,理论为辅,让大家"做的出,看的懂"的原则,效果展示、特性介绍、设计思路、代码实现(python)、算法原理等多个方面的内容都有涉及,通过学习本系列文章,...
2019-12-05 20:27:00
331
原创 做为GPU服务器管理员,当其他用户需要执行某个要root权限的命令时,除了告诉他们root密码,还有没有别的办法?...
通常一台GPU服务器(这里指linux系统)不可能只有一个帐号能用的,比如当其他用户想要在GPU服务器上安装一些软件的时候,会需要用到apt-get命令,但是apt-get命令需要root用户的操作权限,如果GPU服务器由你管理,那么你如何在不直接给root密码的情况下,让其他用户可以执行该命令呢?可以使用sudo命令,sudo命令就是为了让普通用户可以在不知道root密码的情况下...
2019-11-30 14:04:00
411
原创 Viterbi(维特比)算法在CRF(条件随机场)中是如何起作用的?
之前我们介绍过BERT+CRF来进行命名实体识别,并对其中的BERT和CRF的概念和作用做了相关的介绍,然对于CRF中的最优的标签序列的计算原理,我们只提到了维特比算法,并没有做进一步的解释,本文将对维特比算法做一个通俗的讲解,以便大家更好的理解CRF为什么能够得到最优的标签序列。通过阅读本文你将能回答如下问题:什么是维特比算法?为什么说维特比算法是一种动态规划算法?维特比...
2019-11-26 20:16:00
661
1
原创 使用t-SNE做降维可视化
最近在做一个深度学习分类项目,想看看训练集数据的分布情况,但由于数据本身维度接近100,不能直观的可视化展示,所以就对降维可视化做了一些粗略的了解以便能在低维空间中近似展示高维数据的分布情况,以下内容不会很深入细节,但足以让你快速使用这门技术。什么是降维可视化?简而言之,降维是在2维或3维中展现更高维数据(具有多个特征的数据,且彼此具有相关性)的技术。降维思想主要有两种:仅...
2019-11-15 10:41:00
1245
原创 用深度学习做命名实体识别(七)-CRF介绍
还记得之前介绍过的命名实体识别系列文章吗,可以从句子中提取出人名、地址、公司等实体字段,当时只是简单提到了BERT+CRF模型,BERT已经在上一篇文章中介绍过了,本文将对CRF做一个基本的介绍。本文尽可能不涉及复杂晦涩的数学公式,目的只是快速了解CRF的基本概念以及其在命名实体识别等自然语言处理领域的作用。什么是CRF?CRF,全称 Conditional Random Field...
2019-10-17 12:38:00
1077
原创 用深度学习做命名实体识别(六)-BERT介绍
什么是BERT?BERT,全称是Bidirectional Encoder Representations from Transformers。可以理解为一种以Transformers为主要框架的双向编码表征模型。所以要想理解BERT的原理,还需要先理解什么是Transformers。Transformers简单来说是一个将一组序列转换成另一组序列的黑盒子,这个黑盒子内部由编码器和解...
2019-10-10 12:01:00
1543
原创 BERT论文解读
本文尽量贴合BERT的原论文,但考虑到要易于理解,所以并非逐句翻译,而是根据笔者的个人理解进行翻译,其中有一些论文没有解释清楚或者笔者未能深入理解的地方,都有放出原文,如有不当之处,请各位多多包含,并希望得到指导和纠正。论文标题Bert:Bidirectional Encoder Representations from Transformers一种从Transformers...
2019-10-10 10:03:00
2614
1
原创 我是如何通过高级系统架构师软考的?
今年的系统架构师考试又临近了,你是否准备好成为一名持证上岗的架构师了呢?先看看证书长什么样O(∩_∩)O考试时间一般是每年的11月份,是的,一年只能考一次。其他的高级软考一年都可以考两次。这也体现了系统架构师证书的含金量。考试内容共3部分,上午是选择题,下午是案例分析和论文。一般情况是3门都达到45分或以上就算是过了。考证过程笔者备考了一个月的时间,因为还要工作,所...
2019-10-09 11:04:00
2394
原创 目标检测中常提到的IoU和mAP究竟是什么?
看完这篇就懂了。IoUintersect over union,中文:交并比。指目标预测框和真实框的交集和并集的比例。mAPmean average precision。是指每个类别的平均查准率的算术平均值。即先求出每个类别的平均查准率(AP),然后求这些类别的AP的算术平均值。其具体的计算方法有很多种,这里只介绍PASCAL VOC竞赛(voc2010之前)中采用的mAP...
2019-09-26 09:33:00
1104
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人