- 博客(3)
- 收藏
- 关注
原创 基于 apache-arrow 的 duckdb rust 客户端
基于 apache-arrow 的 duckdb rust 客户端目录基于 apache-arrow 的 duckdb rust 客户端背景libduckdb-sys基于 SQLite3 接口基于 C++ 接口基于 C 接口duckdb-rs小试牛刀通过 Apache Arrow 查询数据总结参考背景duckdb 是一个 C++ 编写的单机版嵌入式分析型数据库。它刚开源的时候是对标 SQLite 的列存数据库,并提供与 SQLite 一样的易用性,编译成一个头文件和一个 cpp 文件就可以在程序中使用
2021-07-29 09:21:36
372
原创 Simple: SQLite3 结巴分词插件
一年前开发 simple 分词器,实现了微信在两篇文章中描述的,基于 SQLite 支持中文和拼音的搜索方案。具体背景参见这篇文章。项目发布后受到了一些朋友的关注,后续也发布了一些改进,提升了项目易用性。最近重新体验微信客户端搜索功能,发现对于中文的搜索已经不是基于单字命中,而是更精准的基于词组。比如搜索“法国”,之前如果句子中有“法”和“国”两个字时也会命中,所以如果一句话里包含“国法”就会被命中,但是这跟“法国”没有任何关系。本文描述对 simple 分词器添加的基于词组命中的实现,从而实现更好的查
2021-02-21 14:10:17
730
原创 Simple: 一个支持中文和拼音搜索的 sqlite fts5插件
之前的工作关系,需要在手机上支持中文和拼音搜索。由于手机上存储数据一般都是用 sqlite,所以是基于 sqlite3 fts5 来实现。这段时间再次入门 c++,所以想用 c++ 实现一下,一来用于练手,二来当时做的时候发现网络上这方面开源的实现不多,也造福下其他人。背景搜索现在几乎是每个 APP 必备的功能,用户已经习惯了搜索框搜一下,避免到处去找。搜索也是帮助用户查找旧信息,发现新功能的...
2020-03-08 16:24:24
1532
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人