- 博客(32)
- 收藏
- 关注
原创 大模型Agents总结白皮书
React(Reasoning and Acting)框架是一种旨在通过逻辑推理和行动序列的构建,使大型语言模型(LLM)能够达成特定目标的方法。这一框架的核心思想是赋予机器模型类似人类的推理和行动能力,从而在各种任务和环境中实现更高效、更智能的解决方案。总结来说,React框架通过结合推理和行动,使模型能够更灵活、更可靠地解决复杂问题,并且提高了模型的可解释性和可信度。Agent的架构和组件?Agent中的模型?
2025-01-16 09:12:00
859
原创 SQL面试题-留存率计算
计算的是整段时间范围内,每一天为基准的所有的留存1、2、7天的用户数。计算的是用户首次登陆时间为基准时间,计算该基准时间之后的n日留存率。方法一的优势是可以一次性计算出,每天的不同时间范围的留存率。缺点:如果要计算n天留存需要增加代码量。但是不是很直观,并且计算量比较大。优点:代码直观好理解。
2024-07-07 13:24:38
715
2
原创 量化交易入门——盘口
第四是竞买和竞卖:“竞买”指的是竞相购买股票的投资者,他们愿意花更高的价格买入该股票,而“竞卖”指的是竞相出售股票的投资者,他们愿意以较低的价格卖出该股票。如果你想买入股票,当你报价高于卖1的5.07.高于5.07的的任何价位,都可以即时成交,成交价是5.07.如果你的报价是5.05.那么你就需要在5.05这个价格等候排队,直到股价跌到了5.05.你才可能有机会成交。每个炒股软件上,都会有某只个股的成交信息,在其中会出现一个五档的行情列表,里面列出了买家和卖家各五个价格及其对应的数量。最后,注意风险控制。
2024-06-13 23:44:15
3118
原创 量化交易入门——从零开始搭建自己的量化交易系统
一般的量化交易系统包含如下的功能模块参考数据收集模块数据是量化交易的基础,因此数据收集模块是整个系统的核心之一。它负责从各种数据源收集市场数据,如股票、期货、外汇等。这些数据可能包括历史价格、成交量、财务信息等。数据的质量和准确性对整个系统的表现有着至关重要的影响。数据清洗模块由于原始数据可能存在各种问题,如缺失值、异常值、重复数据等,因此需要进行数据清洗。这个模块负责对收集到的数据进行预处理,以确保数据的准确性和完整性。它通常包括数据筛选、异常值处理、缺失值填充等功能。策略回测模块。
2024-05-10 21:31:38
3346
原创 DSSM 模型技术介绍
本文属于新闻推荐实战-召回阶段-DSSM召回模型。区别于策略召回,基于向量召回也是目前工业界常用的一种召回方法。这里我们将介绍一个比较经典的召回模型DSSM,希望读者可以快速掌握模型原理以及细节,同时可以了解具体的实践过程。
2024-04-22 15:13:09
1583
原创 SentenceTransformer 之论文解读
尽管Bert和RoBERTa在句子对回归任务上,例如语义文本相似度(Semantic Text Similarity),取得了新的sota结果。但是,需要将两个句子都输入到模型中,造成较大的计算延时:在10,000个句子中需要相似的句子对,需要BERT计算50,000,000次,需要大概65个小时。因此,BERT的模型结构决定了,不适合用来做相似文本检索或者是无监督文本聚类。因此,本文提出了基于孪生网络或者三元网络结构的BERT模型,可以用来计算具有语义的句子向量,该向量可以使用余弦相似度进行比较。
2023-10-01 10:39:55
732
转载 转~京东智能推荐卖点技术
AI-flow是推荐模块,执行召回和排序,以获取推荐候选产品,根据产品的库存和受欢迎程度进行筛选,最后确定要推荐的产品同时将请求发送给卖点模块,进行卖点的提取和个性化分发。卖点精筛模型区别于粗筛模型,将生成后的卖点文案,输入到一种递归锐化的BERT模型中进行训练。用户兴趣嵌入表征:通过work2vector方式获得产品词里每个字的word embedding,将产品词中每个字的表征向量求和获取该产品词的表征,结合用户对每个产品词的喜好权重,然后对所有的产品词进行加权平均,获取用户对产品词的喜好的表征向量。
2023-09-18 09:57:01
461
原创 Python报错:Cannot convert a symbolic Tensor (bert/encoder/strided_slice:0) to a numpy array
参考网上搜索安装numpy==1.19还是报错。
2023-09-11 09:57:08
274
转载 mysql in 子查询 效率慢 优化
解决方法:(举例)mysql> select * from abc_number_prop where number_id in (select number_id from abc_number_phone where phone = '82306839');为了节省篇幅,省略了输出内容,下同。67 rows in set (12.00 sec)只有67行数据返回,却
2016-04-13 13:35:53
673
转载 解决:Mysql exceeds the lock table size 不指定
故障现象view plainprint?mysql> delete FROM `tablesname` WHERE datetimeERROR 1206 (HY000): The total number of locks exceeds the lock table size 解决步骤1、锁表写操作view plainprint?mysql> lock ta
2016-04-12 22:17:28
943
转载 SQL :多条记录取最前面一条或根据条件任取N条。。。。。。
--按某一字段分组取最大(小)值所在行的数据/*数据如下:name val memoa 2 a2(a的第二个值)a 1 a1--a的第一个值a 3 a3:a的第三个值b 1 b1--b的第一个值b 3 b3:b的第三个值b 2 b2b2b2b2b 4 b4b4b 5
2016-04-01 15:30:56
1891
转载 MySQL的转义字符“\”
MySQL的转义字符“\” MySQL识别下列转义字符: \0 一个ASCII 0 (NUL)字符。 \n 一个新行符。 \t 一个定位符。 \r 一个回车符。 \b 一个退格符。 \' 一个单引号(“'”)符。 \ " 一个双引号(“ "
2016-03-31 22:28:56
1623
转载 mysql常用字符串操作函数大全,以及实例
今天在论坛中看到一个关于mysql的问题,问题如下good_id cat_id12654 665,56912655 601,4722goods_id是商品idcat_id是分类id当我,怎么根据这种分类ID查数据(一个商品有多个分类,而且用逗号隔开了)我现在用的是like 这样的话,输入一个分类id是688,或者4722都能出来这
2016-03-31 22:28:08
489
转载 mysql update语句的用法详解
首先,单表的UPDATE语句:UPDATE [LOW_PRIORITY] [IGNORE] tbl_nameSET col_name1=expr1 [, col_name2=expr2 ...][WHERE where_definition][ORDER BY ...][LIMIT row_count]其次,多表的UPDATE语句: UPDATE [LO
2016-03-31 22:27:00
2755
原创 c++中vector的用法详解
vector(向量): C++中的一种数据结构,确切的说是一个类.它相当于一个动态的数组,当程序员无法知道自己需要的数组的规模多大时,用其来解决问题可以达到最大节约空间的目的. 用法: 1.文件包含: 首先在程序开头处加上#include以包含所需要的类文件vector 还有一定要加上
2016-03-12 19:44:05
449
转载 C++ 购物车代码
//good.h#ifndef _GOOD_H#define _GOOD_H#include using std::string;class good{ private: string goodname; //唯一标识商品 double price; //价格 double rate; //折扣率 public: good(){ //无参构造函数 go
2016-03-12 19:35:03
2082
转载 scrapy爬虫代理——利用crawlera神器,无需再寻找代理IP
由于工作需要,利用scrpay采集某个商业网站的数据。但是这个网站反扒非常厉害。因此不得不采用代理IP来做,但是做了几天后几乎能用的代理IP全被禁掉了。而且这种找代理、然后再验证的流程非常麻烦,于是博主想到了第三方平台crawlera.
2016-02-10 18:40:07
20991
转载 常见的反爬虫和应对方法
0x01 常见的反爬虫这几天在爬一个网站,网站做了很多反爬虫工作,爬起来有些艰难,花了一些时间才绕过反爬虫。在这里把我写爬虫以来遇到的各种反爬虫策略和应对的方法总结一下。从功能上来讲,爬虫一般分为数据采集,处理,储存三个部分。这里我们只讨论数据采集部分。一般网站从三个方面反爬虫:用户请求的Headers,用户行为,网站目录和数据加载方式。前两种比较容易遇到,大多数网站都
2016-02-10 18:28:13
1141
转载 零基础写python爬虫之使用Scrapy框架编写爬虫
网络爬虫,是在网上进行数据抓取的程序,使用它能够抓取特定网页的HTML数据。虽然我们利用一些库开发一个爬虫程序,但是使用框架可以大大提高效率,缩短开发时间。Scrapy是一个使用Python编写的,轻量级的,简单轻巧,并且使用起来非常的方便。使用Scrapy可以很方便的完成网上数据的采集工作,它为我们完成了大量的工作,而不需要自己费大力气去开发。首先先要回答一个问题。问:把网站装进爬虫
2016-01-18 23:01:58
1116
原创 废柴
你我,只不过想把一生过好。有时候就会这样,遇到不顺,心情低落,特别想做一只废柴,逃避能力越大,责任越大的托词,逃避一人肩负的任务,变成芝士面包、法式长棍或是缱绻的猫,流浪的狗。还不是因为没有做好而自知,当别人向我倾诉的时候,当别人向我抱怨的时候,当别人向我吐苦水的时候,过去的我会说,这人真矫情、为什么总是向我吐槽负面情绪;现在我却感到幸福
2015-12-24 10:02:17
20862
转载 Mysql in子查询效率慢的解决方法
现在的CMS系统、博客系统、BBS等都喜欢使用标签tag作交叉链接,因此我也尝鲜用了下。但用了后发现我想查询某个tag的文章列表时速度很慢,达到5秒之久!百思不解(后来终于解决),我的表结构是下面这样的,文章只有690篇。文章表article(id,title,content)标签表tag(tid,tag_name)标签文章中间表article_tag(id,tag_id,arti
2015-12-16 22:12:13
1805
原创 MYSQL使用inner join 进行 查询/删除/修改示例
mysql 使用inner join对表进行修改代码如下:--查询 SELECT tp.tp_id, tp.tpmc, tp.leveid, tp.tpdz, tp.jgm, tp.scsj, tp.pbzyid, tp.ksbfsj, tp.jsbfsj, tp.status, tp.tpbz FROM qdgl_tupian tp INNER JOIN qdgl_pqb p
2015-12-12 01:23:51
694
转载 mysql insert操作
insert的语法INSERT [LOW_PRIORITY | DELAYED | HIGH_PRIORITY] [IGNORE] [INTO] tbl_name [(col_name,...)] VALUES ({expr | DEFAULT},...),(...),... [ ON DUPLICATE KEY UPDATE col_name=expr, ..
2015-12-11 23:46:48
479
原创 Group By和Having,Where,Order by语句的执行顺序
Group By和Having,Where,Order by语句的执行顺序 一个SQL语句往往会产生多个临时视图,那么这些关键字的执行顺序就非常重要了,因为你必须了解这个关键字是在对应视图形成前的字段进行操作还是对形成的临时视图进行操作,这个问题在使用了别名的视图尤其重要。 Group By 和 Having, Where ,Order by这些关键字是按照如下顺序进行执行的:Wh
2015-12-11 23:38:08
804
转载 sql取记录中的第一条或是最大的一条
--按某一字段分组取最大(小)值所在行的数据/*数据如下:name val memoa 2 a2(a的第二个值)a 1 a1--a的第一个值a 3 a3:a的第三个值b 1 b1--b的第一个值b 3 b3:b的第三个值b 2 b2b2b2b2b 4 b4b4b 5 b5
2015-12-11 23:21:51
8590
原创 mysql中UNIX_TIMESTAMP和FROM_UNIXTIME时间戳
select unix_timestamp('2012-07-30 20:54:12');返回1970-1-1 8:00:00开始到date所代表的时间为止的秒数;from_unixtime把时间戳转化成date;
2015-12-11 23:04:56
481
转载 mysql数据库优化总结
1. 优化你的MySQL查询缓存在MySQL服务器上进行查询,可以启用高速查询缓存。让数据库引擎在后台悄悄的处理是提高性能的最有效方法之一。当同一个查询被执行多次时,如果结果是从缓存中提取,那是相当快的。但主要的问题是,它是那么容易被隐藏起来以至于我们大多数程序员会忽略它。在有些处理任务中,我们实际上是可以阻止查询缓存工作的。复制代码 代码如下: // query cache
2015-12-11 22:53:45
571
原创 杂想
因为经历过许多,所以明白有些话不会说破,所以她才接受了一些哀伤,接受了一些无能为力。所以她才有了与别人不同的那一点点寂寥,一点点冷漠,一点点倔强,一点点胡闹,一点点天真,一点点野蛮,一点点坚持,一点点随便,一点点不愿点明的心愿。当我不想忘记也不想曾经,但是没有资格说出我爱你。
2015-12-11 22:10:32
388
原创 Mysql问题及解决——Error code2014
问题描述:使用mysql workbench执行一段存储过程,如下,实现分段插入的功能,但是会出现Error Code: 2014 Commands out of sync; you can't run this command now,设定SQL editor——Query Editor——Max number of result set:从10改到500,会出现同样的错误,但是出现的时
2015-12-10 22:24:35
2991
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人