知识图谱类产品-开题报告构想(一)

知识图谱类产品-开题报告构想

整体技术路线是GNN,降低前期语料的爬取成本,化团队力量为自己用,开始日益发现团队力量的重要性,在一个团队中可以相互成就一个产品,形成能力的互补和简历的递进,but像去年那种技术组的过于分裂,导致技术壁垒在团队内部产生的现象一定要注意避免,做到技术的可互通性的同时,也要做好项目的完善工作。

1.信息源获取难度以及合法性

   自然语言处理较为依赖于信息源的获取,本团队不希望将重心放在前期的语料爬取中,虽然这对于结果很重要,但是发展初期的主要方向还是把整个框架能够成功跑出来结果。

信息源获取的难度决定了本团队在项目初期产品框架设定中的投入成本和精力大小,不希望在此处耗费过多人力物力。对于前期可以直接先从企查查等二次信息获取网站进行二次获取,以方便、快速为目的,哪怕爬取数据不完整有差错,先求有再求好。等到产品可以商用之后,需要扩大规模,签署商业协议的时候再改为从原新闻渠道进行获取。采用照猫画虎的方式,已有的企查查、天眼查等二次信用检索网站用什么数据源,我们就用什么爬取,他们不行的话,我们肯定也不行。

1.1、信息源获取难度

详见链接(待补充详解)

1.2、信息源获取合法性

 

必须先做出来个东西,然后尽快申请知识产权保护起来,外包给王闻申请经费。跟风做数据,已经有的征信产品在做的,肯定是能够爬取,允许爬取的数据源!你不行他们肯定也不行,墙倒猢狲散

天眼查、企查查、启信宝这类第三方企业信息查询公司有什么不同吗? - 知乎

天眼查,企查查,启信宝三类第三方企业信息查询公司数据来源

  1. 全国企业信息公示系统,中国裁判文书网,中国执业信息公开网,国家知识产权网,商标网,版权局网

做出来的产品预期,可以做出个推荐系统,推荐的是企业,并且检索出真正的可联系对象,明了其业务以及投资额,重点新闻,快速排查

这类产品宣传的都是全国企业信息查询系统,但是如果你是做TO B业务的,通过这类产品找大客户、找批量企业KP的联系方式,或者是作为老板、业务负责人想为销售团队提供大批量的目标客户,那么两查一宝的信息就不太适用,即便是开了会员。

它们之间的区别在哪儿呢?

首先就是数据源:

依靠更先进的爬虫技术,市面上主流的获客系统攻克了全网1000+网站数据源,其中数据源包含:

政府公开数据

比如工商信息网、资质网、招标网、融资网、税务网、法律信息网等

商务型网络数据

比如企业官网、垂直网站、行业网站、招聘网站、门户网站、地图网站等其他和公司业务贴合更紧密的数据。

新闻媒体网站数据

比如新浪、微博、头条、凤凰、贴吧、小程序、app、脉脉等

至少3倍以上的主流数据源,其实就完爆了上述三类产品。

更重要的是丰富的数据来源,其实就决定了数据的精准程度、完整程度。尤其是对于TO B客户的联系方式。

相比两查一宝仅收录了年报信息。此类系统收录了至少8个主要渠道数千个来源:1.官网 2.年报 3.B2B网站 4.地图 5.企业信息 6.行业网站 7.招聘网站 8.招标信息等其他平台。

空号检测、智能推荐功能帮助用户全方位触达企业相关负责人。并非只是挂在公司旗下的法人。解决的痛点和问题——直接检索也不确定到底怎么样,点击进去之后可以更加深入的了解这个工具如何去实现

目前to B的线索平台主要有以下几种:

1、企查查、天眼查、启信宝等等。这类平台一般是会员制,价格比较亲民,可以说职场人人手一套。其定位主要是查企业信息,信息里有联系人这一栏,来源比较单一,主要是公商年检信息,无效联系方式也比较多。这个平台适合产品面向众多大众的业务,可结合群呼或者机器人批量外呼,做客户筛选。

2、探迹、搜客宝、销氪等,这类平台数据整合的比较好。相比较企查查这种平台,主要有以下几点不同:(1).数据的来源维度更丰富,它包函了这些企业的官网、百度地图、招聘信息、各类平台发布的信息&#x

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值