自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(129)
  • 收藏
  • 关注

原创 词权重 (term weight)方案总结

目录1 无监督 (unsupervised) 方法1.1 统计方法(TF, TF-IDF, YAKE)1.2 图方法 (TextRank, SingleRank, TopicRank, PositionRank)2 有监督 (supervised ) 方法2.1 Delta TF-IDF2.2 TF-IDF-ICF2.3 TF-RF2.4 TF-IGM3 语义学习方法3.1 基于关键词学习3.2 基于文本分类3.3 基于检索语义向量匹配4 文本分计算4.1 BM254.2 结合term weight1 无

2021-09-06 19:47:03 5837 1

原创 BiLSTM, CRF,BiLSTM+CRF原理讲解以及viterbi算法python实现

目录1 bilstm2 CRF3 bilstm+crf4 约束关系应用bilstm+crf解读:1 bilstm1.只有bilstm,只学习token到label的关系,但是分词还有一个特性,就是label与label之间存在约束bilstm的计算和学习过程loss,以及预测过程流程说明2 CRF3 bilstm+crf2.bilstm+crf解读crf分值:发射概率+转移概率路径的分值:发射分值:x1+x2+x3,+ 转移分值:y1->y2+y2->y3 =s最终 t

2021-08-08 17:08:02 3990

原创 正则化(regularization)方法总结

8.7 归一化和正则化的区别https://arxiv.org/pdf/1706.05350.pdf?source=post_page(https://arxiv.org/pdf/1706.05350.pdf?source=post_pagehttps://ai-pool.com/a/s/understanding-of-regularization-in-neural-networks

2021-06-30 23:19:15 19637 5

原创 深度学习归一化 (normalization) 方法总结: BN, LN, WN, IN, GN, SN

方差是协方差的一种特殊情况,即变量与自身的协方差。https://zhuanlan.zhihu.com/p/37609917首先对各原理介绍讲解清楚然后综合考虑在DL模型中以及自己实际的业务场景,这样做的一个意图

2021-05-29 21:38:02 2194 1

原创 中文纠错(Chinese Spelling Correct)最新技术方案总结

目录1 传统技术2 深度学习技术2.1 FASPell2.1.1 技术方案2.1.2 优点和缺点2.2 SpellGCN2.2.1 技术方案2.2.2 优点和缺点2.3 Soft-Mask BERT2.3.1 技术方案2.3.2 优点和缺点2.4 Stand-alone2.4.1 技术方案2.4.2 优点和缺点2.5 Spelling Correction as a Foreign Language2.5.1 技术方案2.5.2 优点和缺点2.6 Hierarchical Attention2.6.1

2021-03-20 15:49:23 11505 3

原创 经典CTR预估模型:LR, FM, FFM, Wide&Deep, DeepFM, DSSE 算法对比总结

目录1 LR1.1 原理1.2 优点1.3 缺点2 FM (Factorization Machines)2.1 多项式回归模型2.2 为什么FM两两特征交叉的权重参数学习由n2n^2n2减少到n×kn\times kn×k?2.3 FM模型的时间复杂度如何从O(kn2)O(kn^2)O(kn2)降低到O(kn)O(kn)O(kn)?3 FFM3.1 引入Field-aware3.2 为什么权重数量为n×k×fn\times k \times fn×k×f,计算复杂度为k×n2k\times n^2k×n2

2021-01-17 22:30:31 2117

原创 噪声对比估计NCE (Noise-contrastive estimation)采样方法,提高训练速度,解决源码中正label个数必须相等问题

目录1 目的2 tensorflow源码解读3 batch正样本不一致解决方案3.1 pad label对应为负样本3.2 pad label 对应loss mask4 参考1 目的降低模型计算复杂度的一种方法2 tensorflow源码解读3 batch正样本不一致解决方案3.1 pad label对应为负样本3.2 pad label 对应loss mask4 参考Noise-contrastive estimation: A new estimation principle foru

2020-12-12 14:59:52 1330

原创 计算机求导方法:自动微分(Automatic Differentiation)

目录目的参考目的1.归纳求导方法2. tensorflow怎么求导3. 平时自己定义的loss,怎么求导的,有没有有些loss没法求导的?参考https://www.youtube.com/watch?v=wG_nF1awSSYhttps://www.youtube.com/watch?v=ZGSUrfJcXmAhttps://www.youtube.com/watch?v=sq2gPzlrM0ghttps://www.youtube.com/watch?v=boIOgsu-Q8Ehtt

2020-11-29 12:16:24 8699 1

原创 NLP中的attention机制总结

目录1 attention机制原理2 attention类型2.1 依据attention是否参数化可导分类2.1.1 Soft attention2.1.2 Hard attention2.2 依据输入是否全部用来计算attention向量分类2.2.1 Global attention2.2.2 Local attention2.3 依据attention实现功能分类2.3.1 Self Attention2.3.1.1 原理2.3.1.2 典型代表2.3.1.3 代码实现2.3.2 Multi-Hea

2020-11-01 14:58:44 2302 1

原创 seq2seq model: beam search和attention机制理解

目录1 seq2seq模型结构1.1 Encoder和Decoder1.1.1 Encoder1.1.2 Decoder1.2 attention机制1.2.1 为什么需要attention1.2.2 attention结构1.2.3 attention计算方法2 模型训练2.1 数据格式2.2 优化目标函数2.3 代码实现3 模型预测3.1 beam search3.1.1 为什么需要beam search3.1.2 与viterbi区别1 seq2seq模型结构1.1 Encoder和Decoder

2020-10-21 20:54:06 1428

原创 关键词提取(keyword extraction)技术

目录1 统计方法(Statistical Method)1.1 TF1.2 TFIDF1.3 YAKE2 图方法(Graph Based Approaches)2.1 TextRank2.1.1 PageRank2.2 SingleRank2.3 TopicRank2.4 PositionRank3 语义模型(Semantic Models)1 统计方法(Statistical Method)基于统计方法的核心思想就是计算文本中每个term的分值,有了分值,就可以对所有的term进行排序,然后获取top

2020-10-08 10:31:10 9759

原创 Deep Learning模型中常见的optimizer优化器算法总结

目录1. 优化算法在DL中的挑战1.1 优化算法定义1.2 挑战:局部最小值与鞍点2. 常见的优化算法2.1 梯度下降 (gradient descent)2.1.1 梯度下降算法可以降低目标函数值原因2.1.2 学习率设定2.2 随机梯度下降 (stochastic gradient descent)2.3 批量随机梯度下降 ( batch gradient descent)2.4 Momentum2.5 Adagrad2.6 RMSProp2.7 Adadelta2.8 Adam1. 优化算法在DL中

2020-10-01 11:20:24 2126

原创 Sigmoid,tanh,Relu,Leaky ReLu,ELU,GeLu 激活函数理解

为什么需要激活函数?SigmoidtanhReluLeaky ReluRectifier Nonlinearities Improve Neural Network Acoustic ModelsEluFAST AND ACCURATE DEEP NETWORK LEARNING BYEXPONENTIAL LINEAR UNITSGeluGAUSSIAN ERROR LINEAR UNITS (GELUS)参考文献添加链接描述添加链接描述......

2020-05-29 14:12:42 9186 1

原创 层次softmax (hierarchical softmax)理解

基于word2vec模型学习词的语义向量表示,已在NLP许多任务中都发挥了重要的作用,接下来对词向量学习中的hierarchical softmax的应用做一个分析和学习CBOW(Continuous Bag-of-Word)One-word context假设我们vocabulary size 为VVV,hidden layer 神经元个数为NNN,假设我们只有一个上下文单词,则根据这个上下文单词预测目标词,类似于一个bigram model,如下图所示:输入是一个one-hot编码的vecto

2020-05-17 17:29:29 9183 2

原创 A股涨停股次日溢价空间分析:投资者如何精准把握

A股涨停股次日溢价空间分析:投资者如何精准把握

2025-04-03 20:37:31 392

原创 金融市场中的时间序列预测:思考与方法

所以,在金融市场股市建模时,我们可以尝试将 ==机器学习(处理 X)+ 时间序列模型(处理 Y)+ 强化学习(优化决策) 结合起来==,以更全面地预测市场走势。

2025-03-29 15:15:49 1008

原创 基于DeepSeek精准解析涨停股:揭秘主力动向,把握市场风口!

基于DeepSeek精准解析涨停股:揭秘主力动向,把握市场风口!

2025-03-29 10:13:54 230

原创 AI智能解析A股(2025.03.27涨停股复盘)

AI智能解析A股(2025.03.27涨停股复盘)

2025-03-28 08:15:29 300

原创 AI智能解析A股:掘金热点板块,精准把握交易先机!

🚀 AI智能解析A股:掘金热点板块,精准把握交易先机!

2025-03-27 08:16:41 1247

原创 2025.03.21首板涨停股票分析

每日涨停股票分析

2025-03-23 19:19:43 256

原创 基于DeepSeek-R1推理逻辑的数学公式化方法的市场车险保费预测

基于DeepSeek-R1推理逻辑的数学公式化方法的市场车险保费预测

2025-02-28 15:54:07 420

原创 《金融怪杰》受益语句记录

《金融怪杰》经典语录

2025-02-07 12:36:02 833

原创 DeepSeek核心关键技术 (冷启动,拒绝采样,蒸馏,多头潜注意力,MoE等) 解读

DeepSeek核心关键技术(冷启动,拒绝采样,蒸馏,多头潜注意力,MoE等)解读

2025-02-06 20:41:03 2268

原创 影响市场车险保费预测的外部信息汇总

保险市场竞争、保费调整策略、客户行为变化等对市场保费预测有重要影响。经济环境对车险市场有显著影响,例如GDP、通货膨胀率、收入水平等。政府对保险市场的监管、政策调整、税收政策等直接影响车险保费的变化。车辆的销售趋势、燃油价格、维修成本等对车险保费构成影响。:汽车市场趋势,政策等。:维修成本、质量问题。

2025-01-24 12:29:45 261

原创 yfinance vs Tushare vs efinance

yfinance, tushare, efinance对比

2025-01-15 19:07:14 849

原创 alpha_vantage包中的timeseries和fundamentaldata模块获取股票基本信息和序列信息

获取股票基本面信息和序列信息

2025-01-15 18:09:05 694

原创 探索AGI:智能助手与自我赋能的新时代

在这篇博文中,我从AGI(通用人工智能) 的基本概念出发,探讨了各类基于 AI 的自动化 Agent 工具如何改变我们的工作方式与生活方式。通过分析这些工具的特点和应用场景,我不仅展示了 AI 在自动化任务中的强大潜力,还分享了我个人的实践经验——如何利用 AI 开发工具提升工作效率,同时让兴趣爱好更加有趣和高效

2025-01-09 19:32:02 1167

原创 教你如何使用Copilot提高个人编程效率+PyCharm安装Copilot编程插件

Copilot编程助手,PyCharm使用Copilot

2024-12-31 17:40:04 2935

原创 国内外大模型代码编程项目汇总: OpenAI Codex, GitHub Copilot, Tabnine, DeepMind AlphaCode等

现在国内外大模型编程工具重点集中在提升代码生成、调试、优化的智能化水平,并加强跨语言、跨框架的支持。集成化开发平台:未来的代码编程工具将不仅限于代码生成,它们将集成更多的开发功能,包括自动化测试、代码评审、性能优化等,成为全功能的智能编程助手。码智能化与自学习:这些工具将越来越智能,不仅能根据已有代码生成,还能根据项目历史和团队风格进行自学习,提供更加个性化的编码建议。跨语言与跨框架支持随着技术的进步,未来的编程工具将支持更多种类的编程语言、框架和库,能在多语言、多平台的环境下无缝工作。

2024-12-22 14:13:55 2342

原创 如果你有200万,如何科学合理的进行投资理财,实现财富的增长

投资规划需要根据个人的风险承受能力、财务目标、时间跨度 和 个人兴趣偏好来设计。如果你有200万,可以这样规划你的理财方案,在我们实现收益最大化的同时控制风险。

2024-12-18 18:24:38 4412

原创 编程实现爱心浪漫表达:python实现最受欢迎的10种语言表达“我爱你“

【代码】编程实现爱心浪漫表达:python实现最受欢迎的10种语言表达"我爱你"

2024-12-11 20:04:21 328

原创 Ngrok快速将你的本地Streamlit应用创建一个公共的 URL,供外网访问

Ngrok搭建外网访问Streamlit应用

2024-12-04 20:39:21 1046

原创 Streamlit 应用从本地部署到服务器并进行访问

LLM Web APP and Streamlit

2024-11-30 20:53:23 3249

原创 一行命令获取Hadoop 文件系统 (HDFS) 的主节点地址

我们就会得到类似:hdfs://namenode_host HDFS 主节点地址,方便后续脚本操作中使用。

2024-11-30 16:27:07 152

原创 如何在Spark中使用gbdt模型分布式预测

spark中使用gbdt

2024-11-29 19:09:01 1854

原创 多约束条件线性规划求解最优解 (python编程实现)

多约束条件线性规划求解最优解

2024-08-27 11:42:02 1375 1

原创 Agent理解以及基于大模型LLM的智能体Agent框架LlamIndex和LangChain介绍

Agent介绍以及如何基于LlamIndex和LangChain构建自己的Agent应用

2024-07-31 12:13:06 878

原创 英语语法大全:英语基本成分+从句分析+时态分析

英语语法讲解:基本成分,从句分析,时态讲解

2024-07-12 19:54:13 1266

原创 基于pycharm对每个工程配置python环境

基于pycharm的python环境配置

2024-07-01 19:16:18 890

原创 股票核心因子解读以及如何从接口获取股票数据信息

股票因子解读,如何从接口获取股市数据信息

2024-06-20 18:46:20 1740

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除