
笔记
文章平均质量分 92
biyezuopinvip
biyezuopin
展开
-
基于Python的宋词生成器
高楼处在高处,后面的文本也体现了“高”的特色,“高楼望街”是一番意境,“高楼望夜”又是另一番意境,最后出了一个“俯看五色”,一个“俯”字,也是体现了居高临下,整篇文本无不围绕“高”的主题。这么做的目的就是告诉神经网络,如果前面是“看山”,后面跟一个词语是“不是”。当前面变成“看山 不是 山 , 看山”时,这时“看山”后面就变成“又是”了。这里要重点说明一下,因为要做文本预测的训练,需要从上面的词语推断出下面的词语,所以这里做了一些加工。我找到了一个宋词数据集,是一个csv格式的文件,里面有2万首宋词。原创 2022-01-18 11:05:10 · 4597 阅读 · 0 评论 -
基于Python的对网络评论情感分析:主题与情感词抽取
从数据示例看,数据集只提供了角度词(aspectTerm)的抽取结果,没有情感词的抽取结果,训练加测试数据总共3841条,需要人工标注情感词结果(WTF…问题抽象:其实可以看作一个类似于分词问题的 “序列标注” 问题,如下图所示,给出分词后的输入序列,输出两个同等长度的 BIO 序列,一个作为角度词抽取的输出序列结果,一个作为情感词抽取的输出序列结果,这里 BIO 标记为序列标注问题的惯用标记法,“B” 即为欲标记的目标内容的开始词,“I” 为欲标记内容的中间词(或结尾词),“O” 为不标记的内容。原创 2022-01-18 11:04:58 · 3394 阅读 · 0 评论 -
基于Python的股市市场情绪分析
这份代码仅为了演示如何从互联网中提取投资者情绪,并研究情绪与股市的关系。源码下载地址源码下载地址。原创 2022-01-18 11:04:31 · 5091 阅读 · 0 评论 -
基于Python的卷积神经网络(CNN)识别MNIST数据集
深度学习发展迅速,MNIST手写数字数据集作为机器学习早期的数据集已经被公认为是机器学习界的果蝇实验(Hinton某年),卷积神经网络是识别图像非常有效的一种架构,于是用CNN识别手写数字也就成为了机器学习界的经典实验。在这个repo中我会呈现最基本的CNN识别MNIST数据集过程。载入数据看看数据啥样儿(也即Visualization)建立模型训练模型测试模型(看看训练的好不好)原创 2022-01-16 01:09:46 · 4517 阅读 · 0 评论 -
基于Jupiter Notebook的回归、分类和聚类可视化分析
本次设计在 Jupiter Notebook 上通过 scikit-learn 对两个数据集分别实现了:1、回归(Air quality dataset):逻辑回归;3、聚类(BLE&RSSI dataset):DBScan、kmeans、GMM、层次聚类算法(其中聚类算法以 t-SNE 实现了结果可视化)。表内数据存在一些值为-200 的缺失值,为了回归的准确性,采用去除含缺失值数据项的方法。代码路径:./BLE_RSSI_dataset/BR_2_classification.ipynb。原创 2022-01-13 01:35:14 · 3244 阅读 · 0 评论 -
基于Python的深度神经网络的中文期刊分类系统
数据文件下载好放入 2_word2vec 中模型文件下载好放入 2_word2vec 中。原创 2022-01-13 01:35:03 · 680 阅读 · 0 评论 -
基于Python的循环神经网络股票价格预测
"""循环神经网络实现,采用LSTM:param input_size: 输入的特征维度""""""前向传播:param x: 输入数据:return:"""return out。原创 2022-01-13 01:34:43 · 5802 阅读 · 0 评论