- 博客(14)
- 资源 (10)
- 收藏
- 关注
原创 awk 过滤 + 拼接
输入的是两个文件,用NR和FNR的关系可以区分。NR==FNR就是在前面的文件,NR!=FNR指的是在后面的文件。基于此,灵活的操作就可以尽情展开,速度快,代码量少,随用随写。需要从content_ori.list中过滤 filter.list文档中第二列为0的id。给定一个原始文档,content_ori.list,内容如下。既要过滤掉第二列为0的,又要将第三列接在过滤后的文本中。再给定一个过滤文档,filter.list,内容如下。再进一步,过滤文档中有额外增加的字段,比如。
2023-09-07 15:20:47
336
原创 shell读取文件中的行(比较保守的方法)
【shell 小白】有数据如下,文件名为debug.list,现在需要按行读取处理。如果直接用下面的方式读取debug.list,filename="debug.list"while read LINEdo echo $LINE done < $filename会出错,读取不完整,比如下图中的第二行的key的“13”被忽略了。【网上有很多解释这个现象的原因】用下...
2020-03-23 10:45:31
292
原创 Faiss建立索引并保存(C++)
Faiss 建立索引并保存。如果用IndexHNSWFlat,就采用IndexIDMap进行映射。#include "index_io.h"//#include "IndexIVF.h"//#include "IndexIVFFlat.h"#include "IndexHNSW.h"//#include "IndexIVFPQ.h"#include "MetaIndexes.h"...
2020-03-02 17:49:36
3601
4
原创 shell根据时间遍历处理
shell根据时间遍历处理#! /bin/sh test.shdate=`date -d "+0 day $1" +%Y%m%d`enddate=`date -d "+1 day $2" +%Y%m%d`echo "------------------------------"echo "date=$date"echo "enddate=$enddate"echo "--...
2020-02-27 10:35:28
287
原创 手工数据分片shell代码
split -n的问题:分割文件会在行的中间截断。因此 采用 如下方法 。先数文件行数,然后计算每个部分的平均行数file=demo.txtpart=50WORKSPACE=./FN=$(wc -l < ${file})spn=$[$[${FN}/${part}]+1]echo "split..."rm -f ${WORKSPACE}/*split -l ${spn...
2020-02-27 10:31:45
187
原创 uint32_t相减的abs
uint32_t a;uint32_t b;cout << abs(a-b) << endl; //会出错cout << abs(int(a-b)) << endl; //对了
2020-02-19 10:29:30
792
原创 Json存储树形结构
Json写入树形结构,并转成string,可被其他模块(比如,cgi)调用:#include <json/json.h> ...struct Node{ string tag_name; vector<string> children_tag_key;};unordered_map<string, Node> tag_n...
2019-11-14 14:06:14
1681
原创 ctime 输出时间会换行的解决方法
输入时间自动换行的原因:char *ctime(const time_t *time); 该返回一个表示当地时间的字符串指针,字符串形式day month year hours:minutes:seconds year\n\0。 用这个方法可以解决#include <ctime>time_t now = time(0);char* dt = ctim...
2019-10-31 16:57:28
2741
3
原创 C++图像存储成二进制文件
//C++图像存储成二进制文件:Mat img_target = Mat::zeros(cv::Size(target_w, target_h), CV_8UC3);Mat img_resize;cv::resize(input_img_color, img_resize, Size(padded_img_w, padded_img_h));img_resize.copyTo...
2019-10-28 11:33:39
1262
原创 base64图片编码
#include "iBase64.h"...std::vector<unsigned char> data_encode;cv::imencode(".png", img, data_encode);std::string padded_img_buffer;padded_img_buffer.assign(data_encode.begin(), data_encode....
2019-10-28 11:30:05
92
原创 cv::imdecode segmentation fault
cv::imdecode 在将string类型图像解码的时候,会出现segmentation fault。程序直接崩溃,让人崩溃的是,catch 不到任何错误。通过各种方法定位到是各种格式奇葩的4通道图片导致,比如某些编辑器输出的png图片。在持续怼了3天之后,发现是协程导致的问题。关掉协程,哪怕用多进程跑,只会抛出以下warning,程序继续运行。libpng error: bad...
2019-10-24 15:11:32
1829
3
原创 Linux 读取二进制文件,速度逐渐加快现象
While True: fd = open(“bin.file”, 'rb') # Size: 8G fd.seek(int(po_start), 0) t1 = time.time() content = fd.read(int(content_len)) t2 = time.time() fd.close()观察每次read的时间(t2 ...
2019-10-14 15:06:43
388
原创 Keras 0.2.0 + Theano Bleeding Edge 的一些问题
更新了Keras 0.2.0。需要最新的Theano,于是安装了Theano Bleeding Edge.新版本Keras实现了Merge中的mul和concat。以便于多通道的融合。训练出现问题。原来的双层LSTM运行一段时间后会出现loss = nan的问题。这个问题在Keras 0.1.0上没有出现过。如果改用一层LSTM就没有什么问题了。目前还在探索如何重新让双层LSTM训练起
2015-11-23 09:59:51
1184
原创 Keras框架下LSTM的一种实现
第一次发帖,做个测试,以后逐一添上细节和代码。目标:实现以Kinect为sensor的连续手语手别特性:使用非常简单用GPU能加速4倍以上,但是散热需要“格力“牌电风扇,没错。Stacked LSTM能够利用LSTM网络对一个序列的最后一个输出,实现孤立词(已经标注开始和结束位置)的识别能够利用LSTM网络对所有帧的输出结果,实现连续句子(原始视频,没有分割开始和结束,
2015-09-23 14:57:11
12454
1
C#实现单链表的增删改查
2009-08-08
C#用栈实现表达式计算
2009-08-08
floyd算法 C#实现
2009-07-27
数值分析三次样条插值画小狗和小鸭的背部曲线.rar
2009-07-10
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人