本文主要利用tesseract-ocr对中文进行识别,所做的工作就是对图片进行分割处理,把需要的部分利用tesseract-ocr去识别。主要识别昵称,地区,个性签名。
大体的思路就是利用每一区域间的灰度变化把图像分块,确定具体的某一块代表什么。昵称里含有性别标志,我们可以从右往左找直到遇到黑色区域,由于性别标志的大小固定,我们就可以从第一个遇到黑色区域的位置开始裁掉性别标志。由于不同手机的分辨率不同,我们可以分情况去考虑。同时由于一些用户没有个性签名,或者没有填写 地区,也可以分情况去考虑。在程序中要加入try except,一旦有异常情况,我们可以知道程序哪里出错了,同时我们要打印日志,知道程序运行到什么地步了,不能只是等程序输出最后的结果。
linux 系统下常用指令
kill 进程号 杀掉一个进程 cd进入某个目录下
ps 显示当前进程,
Python2.7 +程序目路径(先进入Python环境下,然后输入这个就可以运行程序了。)
命令加& 表示在后台运行
管道 就是上一个命令的输出作为下一个命令的输入
sed 对文件进行编辑
awk 对文件进行数值分析
whereis which locate 表示查找系统指令的位置
who 显示当前用户
man 用于查询指令的具体用法
linux 下一切接文件 文件 当前用户权限 该用户组权限 其他人权限
r 可读 w可写 x可执行
chmod 用于修改权限 4 2 1 读 写 执行
ctrl+z 暂停当前的指令
cat +文件 显示文件内容
mikdir 创建新的文件夹
pwd 显示当前目录
rz 上传文件
rf 删除文件
touch 123.txt 新建文件
vim 123.txt (编辑123.txt) i (插入) hello (编辑的内容) ESC(退出当前命令) :wq(保存并退出) :q!(强制退出vi)
rm 123.txt(删除文件) rm -rf abc(删除文件夹)
ll (显示当前目录下的文件夹,创建时间,)alias(对指令进行重命名)
ls(列出当前目录下的文件名)
cd + 文件夹名(进入某个目录下)
tail-f +文件名(跟踪某个文件)
Tab (自动补全)
ctrl +c(终止当前命令)
ctrl +向上箭头(退到上一个命令)
kill-9 强杀
sz 1.jpg(导出1.jpg)
cd /(返回根目录)
cd …(返回上一层目录)
cd ~ 当前用户的主目录
python2.7 zxcvbn.py (启python程序)
nohup java -jar asd.jar &(启Java程序)
ps -ef | grep java(显示进程)
pip3 install -i https://pypi.tuna.tsinghua.edu.cn/simple gevent(python中使用指定镜像下载依赖包)
find 用于查找文件名(完全匹配) grep 是对文件内容进行查找(包含匹配),找出目标行
tar -zcvf 打包并压缩文件 tar -zxvf 解压文件
zip hello.zip hello.txt unzip hello.zip (zip 压缩文件,不能压缩文件夹)
shutdown -r 重启 shutdown -h 关机
网关的作用:内部ip和公网ip的转换 访问外网时的数据报
DHCP: 自动获取ip
ARP :把ip地址转换成mac地址
ipconfig /all 查看详细的网路链接相关 包含mac地址
Mac地址:Mac地址是网卡的地址,是唯一的
ip地址:ip地址反应在某一网络中的位置 同一电脑在不同网络中ip地址不同
netstat:查看网络层的状态 包括 udp tcp 协议的状态,各个端口的情况。
tcp协议是有连接的(发送方和接收方通过三次握手确认连接建立)http协议使用tcp 如果发生错误会重新发送,udp协议是无连接(不管接受方处于什么状态直接发)速度比较快,dns解析中使用udp 视频传输中也使用协议。
端口号:每一个端口代表某个特定应用。22 ssh http 80 ftp 21
smtp(邮件发送)25 mysql3306 redis 6379
10000 以下代表系统内部定义的 ,10000以上表示自定义的
加密:对称加密 :加解密使用同一密钥
ssh 协议:先拿到对方公钥,然后进行加密,传输,接受方使用私钥进行解密
ip地址包含网段号和主机号 掩码用于对ip中的网段号和主机号进行标识
mysql中默认使用升序排列 desc 表示降序
添加索引 :就是对某一列进行排序,可以加速查找速度
进程有三种状态:阻塞,就绪,运行 运行到阻塞:等待某一事件发生
阻塞到就绪:等待的时间发生 就绪到运行:cpu调用 运行到就绪:时间片用完。
gcc g++ 是用来编译c c++的
我们可以把gcc.exe g++.exe加入环境变量中。编辑hello.cpp
g++ hello.cpp 然后就会生成 a.exe 双击就能运行了
在指定目录下打开cmd,打开指定路径,按住shift,鼠标右键选择在此处打开命令窗口, 还可以在目录下直接输入cmd,也可以打开命令窗口。
grep ‘name’ -r / 递归查找包含name的文件