1990-2025年上市公司股票名称相似度

数据简介

股票名称相似度是指通过量化分析不同股票名称之间的文本相似性,评估它们在名称结构、语义、行业关联等方面的接近程度。这种相似性不仅体现在字面拼写(如“腾讯控股”与“腾讯音乐”),还可能涉及行业关键词(如“新能源”“科技”等)、地域特征(如“上海”“深圳”)或企业属性(如“集团”“股份”)的关联。股票名称相似度具有丰富的科研价值:一、可以对市场异常行为进行监控,通过分析股票名称相似度和股价波动的关系识别市场操纵或非理性投资(2015年匹凸匹改名事件);二、可以判断投资者行为是否存在认知偏差,通过构建名称相似度因子,量化名称对投资者决策的影响;三、可以判断股价是否合理,通过股票名称相似度,可以判断投资者是否因为相似名称而误判了企业的发展趋势。本数据通过使用Levenshtein距离和Jaccard距离来构建上、京、深交易所A股非ST的上市公司股票名称相似度,在计算得到企业与其他所有早于该企业上市且不在同一行业和同一地区的企业之间的Levenshtein和Jaccard距离均值后,通过将均值映射到[0-100]范围内得到每一个企业的股票名称相似系数。

数据来源

数据来源于国泰安金融数据库(CSMAR),人工整理,全部内容真实有效。

数据范围

上、京、深交易所A股非ST的上市公司

时间跨度

1990-2025

数据格式

数据格式为Excel形式

数据指标

证券代码

证券简称

Levenshtein距离相关系数

Jaccard距离相关系数

数据展示

参考文献

[1]王意德,张兵,于琴.股票名称相似度与股价信息损失效应[J].证券市场导报,2025,(02):58-67+79.

【下载→

方式一(推荐):主页↓个人↓简介
经管数据库-优快云博客

方式二:数据下载地址汇总-优快云博客

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值