- 博客(33)
- 收藏
- 关注
原创 人工智能入门(2)
过程一般分为,正确的提取文字信息----------正确的分离单个文字-------------正确识别单个文字-------------正确连接单个文字。:只抽出部分图像与字典进行匹配,然后根据各部分形状以及相对位置关系,与保存再字典里的知识进行对照,从而识别出每一个具体的汉字。1.数据采集与预处理:将数据写入数据仓库,数据采集包括文件日志的采集,数据库日志的采集,关系型数据库的接入和应用程序的接入。颜色分离技术、分光技术、分时技术、光栅技术、全息显示技术。3.真实感实时绘制技术。大数据通用型处理框架。
2025-03-29 23:55:35
356
原创 【数学建模】001
产生一系列正互反矩阵,进而产生判断矩阵,可以得出各个评判指标之间的权重向量。“两两”比较发来确定指标重要性。:确定评级价指标形成评价体系。1.评价的目标是什么。一致矩阵和不一致矩阵。
2025-03-11 09:38:17
401
原创 【经济学通识——国债】
于是会向全社会去借钱。美国债务上限,象征性的(一直上调)全球政府债务都在上升。亚当斯密觉得市场竞争最有效率市场自由竞争会不可避免的出现萧条。于是,凯恩斯提出政府调节市场经济MMT现代货币理论认为政府就应该借贷支出一个国家用本币发行的国债就是内债(政府印钱来避免违约)(经济的缓冲器)海外借的钱就是外债,容易出现违约(经济活动的放大器)
2025-01-17 23:37:18
216
原创 【中国经济学通识——化债】
税收上升,地价上升,土地出让金的收入上升,地方政府再给城投公司还债,来新一轮投资。中央政府会给地方政府给一个债务上限(限制无节制的融资),地方政府会找一个,城投公司(地方政府融资平台),来进行。博弈存在)1994 分税制改革:之前一小部分上交,剩下自己分配(会形成地方保护主义,中央入不敷出),之后改革后两者财政收入差不多,但地方的财政责任多,中央于是给出转移支付、土地出让金(卖地收入都给地方)。一般公共预算(税收)、政府性基金(土地出让金)、国有资本经营、社会保障基金(社保)地方显性债务:专业债、一般债。
2025-01-17 00:30:30
495
原创 图像数据分析pt2
用基于区域的几个矩作为形状特征,这些矩对于图像的变换、旋转和缩放不敏感(优点是速度快,缺点是识别率比较低)RGB空间内两个颜色之间距离为: 其中,C1 C2表示颜色1和颜色2,C1R表示颜色1的R通道。位置:用物体面积的中心表示物体位置,面积中心是单位面积恒定的相同形状图形 的质心。偏心度:区域的偏心度常用区域主轴和辅轴的比来表示,另外一种方法是计算惯性 主轴比。区域面积:描述区域的大小,对属于区域的像素计数, 为区域中的像素总数。方向:如果物体是细长的,可以将较长方向的轴定义物体的方向。
2025-01-11 19:57:35
444
原创 全球供应链中国家物流绩效评估的非结构化大数据方法
需要进一步的研究来解决技术文本提取挑战,并在政策制定和管理决策场景中实证开发物流绩效评估方法。- 提出的方法能够生成物流绩效评估结果,并有助于更明智地确定不同国家物流绩效类别的权重。- 该方法有助于更好地处理复杂性,提供更平衡的评估,并在一定程度上生成排名和基准。- 使用设计科学原则,通过分析2006-2014年20个国家的物流系统文本数据。- 需要更大的文本语料库和迭代分类器训练以产生更稳健的评估方法。- 需要更多的迭代和训练数据来提高方法的准确性和实用性。
2024-12-19 23:49:03
449
原创 CS61a.1 textbook1.2 编程要素
Python 内置了对各种常见编程活动的支持, 例如,操作文本、显示图形以及通过 互联网。Python 代码行是一个 import 语句,用于加载用于访问 互联网。特别是,它提供了一个名为 urlopen 的函数,该函数 可以访问统一资源定位符 (URL) 中的内容,该位置为 互联网上的东西。
2024-12-18 23:58:59
364
原创 博弈论与信息经济学(pt2)不完全信息动态博弈 Dynamic Games with Incomplete Information
纳什均衡很难说是动态博弈的一个合理解,因为在动态博弈中,参与人的行动 有先有后,后行动者的选择空间依赖于前行动者的选择,前行动者在选择自己的战略时不可能不考虑自己的 选择对后行动者选择的影响。• Player 2知道Player 1会知道“Player 2如果来到了信息集一定会选择U”从而必选M,所以Player 2就会认为p=100%, 也就是说在PBE的定义下,Player 2 100%相信:只要来到信息集,自己就必在 节点M。如果去往 (M,U),则自己收益为2。SPNE又会是什么?
2024-12-18 17:13:33
682
原创 非结构化数据分析与应用(Unstructured data analysis and applications)(pt3)图像数据分析1
数字图像表示为像素构成的两维矩阵•二维离散亮度函数f(x,y),f代表了在点(x,y)处像素的灰度值xy•二维矩阵——F[m,n],m,n说明图像的宽和高。
2024-12-17 22:04:33
1203
原创 数据挖掘与机器学习(part 10)推荐算法Recommendation Algorithm & 隐语义模型(LFM)& 协同过滤算法 & SVD
假设:用户兴趣的连贯性(用户未来喜欢的东西,与过去喜欢的东西是相似的优点:直观,可解释;缺点:覆盖率、多样性、新颖度、惊喜度均不高协同过滤推荐(Collaborative Filtering)优点:简单,预测准确度高;缺点:对数据稀疏性非常敏感对策:矩阵分解技术(降维)
2024-12-17 00:04:26
2477
原创 数据挖掘与机器学习(part 9) 规则挖掘Rules Mining&关联规则(Association Rules)& Apriori算法
分类器包含互斥规则,如果这些规则彼此独立。每条记录最多被一条规则覆盖。
2024-12-16 13:03:48
2678
原创 数据挖掘与机器学习DM&ML(part 8)K近邻(KNN)
KNN 概念简单,却能解决复杂问题能在信息相对较少的情况下工作学习简单(根本无需学习!内存和 CPU 成本-特征选择问题对表示敏感受维度诅咒的困扰。
2024-12-13 22:51:37
1012
2
原创 数据挖掘与机器学习DM&ML(part 8)聚类分析Clustering&K-Means
密度式--基于密度概念;网格式--基于多级网格结构;模型式--为每个聚类假设一个模型,其目的是找到最适合彼此的模型
2024-12-12 17:55:53
814
原创 数据挖掘与机器学习(DM&ML)(part 7 ANN 人工神经网络)
拟合 ANN 的问题--数据准备预处理步骤-将变量刻度为 0-1-分类变量-如果类别相等,则映射到 0-1 范围内的等距区间点-否则,创建虚拟变量-转换(如对数)倾斜变量
2024-12-10 22:37:03
1927
原创 博弈论与信息经济学(part 0)
策略:简单地说,就是博弈者可以做出的选择。但即使是这一基本概念也需要的进一步研究和阐述回报:一个完整的数字表,用来比较所有逻辑上可以想象的结果。
2024-11-28 18:10:43
588
原创 博弈论与信息经济学 (part 1)
在N玩家的正规形式博弈中,对于玩家i,如果策略S∗在给定其他玩家策略组合S−i的情况下,使得玩家i的效用Ui(S∗,S−i)大于或等于任何其他策略S的效用Ui(S,S−i),则称S∗是玩家i对S−i的最佳反应。美国国会与联邦储蓄银行,国会希望预算平衡,预算赤字,银行希望低利率,双方有冲突,国会预算平衡,银行低利率,皆大欢喜,高利率时,对国会来说收益降低,国会采取预算赤字,银行收益降低,对联邦银行,没有其占优策略。纳什均衡是指在博弈中,每个玩家的策略都是对其他玩家策略的最佳反应。一个个体的每个条件下,其他;
2024-11-22 01:02:14
323
原创 区块链(part 1)
工作证明机制(proof of work)与哈希现金,hashcash 类似,其中巨大的进步是取得了防止“双重支付”的原理,即保持价值传递的唯一性,就是给予每个交易一个唯一的可信时间,也就是时间戳。节点数量越多,系统可以容忍崩溃的节点越多;参与节点的人(组织)越分散,就代表一条链的去中心化程度越高,反之,一条链就趋向于中心化。区块链是一个连续增长的数据结构,每个区块都包含了前一个区块的哈希值。区块链是一种分布式账本技术,共识机制发动节点来共同记账,防止信息纂改,采用链状数据结构,密码学技术进行数据存储。
2024-11-04 22:49:34
270
原创 数据挖掘与机器学习(DM&ML)(PART 4)(逻辑回归)
回归系数b1–衡量y与x之间的关联–当x变化一个单位时,y平均变化的数量–最小二乘法。
2024-10-24 18:53:59
525
原创 数据挖掘与机器学习(DM&ML)(part 6)(决策树)
分类: 定义-给定一组记录(训练集)-每条记录包含一组属性,其中一个属性是类别。每条记录包含一组属性,其中一个属性就是类别。目标:应尽可能准确地为以前未见过的记录分配一个类别。通常,给定的数据集分为训练集和测试集,训练集用于建立模型,测试集用于验证模型。分类任务示例-预测肿瘤细胞是良性还是恶性-将信用卡交易分类为合法还是欺诈-将蛋白质二级结构分类为α-螺旋、β-薄片或随机线圈-将新闻报道分类为金融、天气、娱乐、体育等。
2024-10-22 15:36:39
353
原创 非结构化数据分析与应用(Unstructured data analysis and applications)(自然语言处理NLP&文本分析)(part 2)
英文分词:将长的篇章或者段落句子分解成最基本的结构词语。4.1 文本分析的层次,词法句法语义语用篇章分析。词性标注 :判断句子里每个词的词性并加以标注。词性分析----专有名词和特殊的识别。中文:粗粒度分词和细粒度分词。课程实践 爬虫环境配置。数据爬取代码(部分)第四章 文本数据分析。
2024-10-17 01:10:53
313
原创 数据挖掘与机器学习(DM&ML)(PART3) (DATA)
给定一个有序或连续属性\(x\)以及一个介于 0 到 100 之间的数字p,第p百分位数是一个x的值,使得x的观测值中有p%小于这个值。如果数据集中存在异常值,箱线图中的 whiskers(箱线图的上下须)会相应地变长,并且可能会有一些数据点超出 whiskers 的范围。丢失数据、噪声数据、重复数据(不一定都不好有时是人为设置):可以在数据输入阶段进行数据验证,确保输入的数据是唯一的。p.s. 数据挖掘的操作过程步骤会有很多经验性的,关于数据智能与人的交互。一个属性的众数是出现最频繁的属性值。
2024-09-26 13:57:26
796
原创 数据挖掘与机器学习(DM&ML)(PART2)
的定义: 给定一组数据点,每个数据点都有一组属性,以及它们之间的一种相似性度量,找到聚类使得: 一个聚类中的数据点彼此之间更加相似。•其他特定问题的度量。找到相似客户的聚类-----------------------------------------------------------------------------------------------------------------------------------通过观察同一聚类中的客户与不同聚类中的客户的购买模式来衡量聚类质量。
2024-09-24 14:59:43
809
原创 数据挖掘与机器学习(DM&ML)(PART 1)
1956 dartmounth conference------2007 DBN(深度信念网络) (hinton et ai 2007) -----2016 XGboost ResNet ------ (以前是模型表征)2017 Attention/Transforms。将底层的分布式信息在前端按需求调用出来(赋用) -------仪表盘展示。早期商业智能与分析:使用硬数据,统计模型进行客户画像---------发展成使用软数据(非结构化数据)、深度学习、可视化、AIGC。
2024-09-21 15:09:02
578
原创 非结构化数据分析与应用(Unstructured data analysis and applications)(part 1)(更新中)
非结构化数据分析与应用.
2024-09-16 00:21:00
576
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人