- 博客(196)
- 资源 (20)
- 收藏
- 关注
原创 unstructured的安装
Unstructured是一个开源的Python库,专门用于提取和预处理图像和文本文档(例如PDF、HTML、Word文档等),简化数据提取和预处理,使其能够适应不同的平台,并有效地将非结构化数据转换为结构化输出。这个案例展示了如何使用LangChain对文本进行总结,类似于chatPDF的功能llm = OpenAI(temperature=0, model_name='gpt-3.5-turbo') # 初始化LLM模型这个案例通过传递一段长文本给LLM模型,让模型生成文本的总结。
2024-12-09 12:16:38
1700
1
原创 常用数据官方网站
名称 网址 数据类型、所在行业 宏观数据 国家统计局 http://www.stats.gov.cn/tjsj/ 关乎国计民生与经济发展的各类数据;经济、人口普查报告;统计年鉴 年鉴汪 https://www.nianjianwang.com/ 各省市的统计年鉴 国家各部门数据 人力资源和社会保障部 中华人民共和国人力资源和社会保障部 工伤保险、失业保险、养老保险、城镇就业率等 国家医疗保障局 国家医疗保障局 统计数据
2023-09-25 23:17:09
1957
原创 城市编码对照表
citycode cityName provinceName 130100 石家庄市 河北省 130200 唐山市 河北省 130300 秦皇岛市 河北省 130400 邯郸市 河北省 130500 邢台市 河北省 130600 保定市 河北省 130700 张家口市 河北省 130800 承德市 河北省 130900 沧州市 河北省 131000
2023-09-25 23:15:44
8548
转载 响应式网页设计
这个话题最近很火爆,我也一直在关注,响应式网页设计和移动互联网密切相关,并因移动终端的丰富和普及而兴盛,并且是一个颇具争议的话题,我今天将和大家探讨下。上周写了个简单的ppt在组内大概介绍了下,感兴趣的话可以先看下这个PPT。移动互联网的现状和未来在说到这个话题前,我们先看下网页设计和前端开发的现状:全球有超过53亿手机用户(包括传统手机)国内3G用户超过1亿iPh
2014-08-25 23:24:42
997
转载 javascript之数组操作
1、数组的创建var arrayObj = new Array(); //创建一个数组var arrayObj = new Array([size]); //创建一个数组并指定长度,注意不是上限,是长度var arrayObj = new Array([element0[, element1[, ...[, elementN]]]]); 创建一个数组并赋值 要
2014-08-25 22:28:29
660
转载 Nginx开启Gzip压缩大幅提高页面加载速度
刚给博客加了一个500px相册插件,lightbox引入了很多js文件和css文件,页面一下子看起来非常臃肿,所以还是把Gzip打开了。环境:Debian 61、Vim打开Nginx配置文件vim /usr/local/nginx/conf/nginx.conf2、找到如下一段,进行修改gzip on;gzip_min_length 1k;gzip_
2014-08-23 17:09:19
705
转载 Cocos2d-JS打包, cocos2dx-3.0
Cocos2d-JS打包zeroyang2014-08-14 10:37:36831 次阅读Cocos2d-JS是Cocos2d-x的Javascript版本,融合了Cocos2d-html5和Cocos2d-x JSBinding。它支持Cocos2d-x的所有特性并提供更简单易用的Javascript风格API。使用Cocos2d-HTML5,我们可
2014-08-23 15:10:40
5762
转载 cocos2dx常见的46中+22中动作详解
bool HelloWorld::init(){ ///////////////////////////// // 1. super init first if ( !CCLayer::init() ) { return false; } CCSprite * sp= CCSprite::create("Ic
2014-08-23 14:54:08
652
原创 vim 配置文件,经过修改,比较好用的版本
"""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""" " 显示相关 """"""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""
2014-05-25 21:33:56
721
转载 Python写的简单的端口监听,显示端口上收到的数据,TCP的
# Filename: PortListner.py# @author: RobinTang# Created on 2012-9-5 1:42:05import threadingimport socketencoding = 'utf-8'BUFSIZE = 1024# a read thread, read data from remoteclass Reader
2014-01-15 20:46:20
25884
原创 mysql-python安装 _mysql.c:602: error: expected expression before ‘)’ token
在安装mysql-python的时候遇到这么个问题:[root@centos01 MySQL-python-1.2.4b4]# python setup.py buildrunning buildrunning build_pycopying MySQLdb/release.py -> build/lib.linux-i686-2.4/MySQLdbrunning build_
2014-01-13 13:17:57
1829
1
转载 利用JavaScript破解验证码
原文:http://ejohn.org/blog/dom-insertadjacenthtml/ 近日,网上惊现可以破解验证码的JavaScript脚本——GreaseMonkey!由“Shaun Friedle”开发的这段脚本可以轻松搞定Megaupload站点的CAPTCHA。如果您不相信的话,可以到http://herecomethelizards.co.uk/mu_captcha/
2014-01-11 01:06:11
1162
转载 实例解说常见验证码的弱点与验证码识别
一、简介验证码作为一种辅助安全手段在Web安全中有着特殊的地位,验证码安全和web应用中的众多漏洞相比似乎微不足道,但是千里之堤毁于蚁穴,有些时候如果能绕过验证码,则可以把手动变为自动,对于Web安全检测有很大的帮助。全自动区分计算机和人类的图灵测试(英语:Completely Automated Public Turing test to tell Computers and H
2014-01-11 01:03:33
1528
转载 Android使用NDK开发项目时的一些问题
1、在使用NDK的过程中,有一个步骤是根据生成的 .class 文件生成相应的 .h 文件。网上相关文档给出的方式是使用如下命令:cd mkdir jnijavah -calsspath bin -d jni 即,进入工程目录,创建一个jni的文件夹。然后调用javah命令通过bin目录下的 .class 文件生成 .h 文件并放到jni文件夹中。需要注
2014-01-04 15:03:56
721
转载 ios NSString 字符串常用方法
1.有时获取的网页编码是GB2312的,转换为UTF-8 格式代码:NSStringEncoding enc = CFStringConvertEncodingToNSStringEncoding(kCFStringEncodingGB_18030_2000);NSString *retStr = [[NSString alloc] initWithData:data encoding
2012-12-05 00:50:55
617
转载 Shell读文件的几种方法总结(b shell)
Shell读文件的几种方法总结(b shell)胡亮 on October 12th, 2010<br /> 读文件的方法:<br />第一步: 将文件的内容通过管道(|)或重定向(<)的方式传给while<br />第二步: while中调用read将文件内容一行一行的读出来,并付值给read后跟随的变量。变量中就保存了当前行中的内容。<br /> 例如读取文件/sites/linuxpig.com.txt<br />1)管道的方式:<br /> <br />
2010-10-12 12:00:00
1251
转载 NoSQL数据库探讨 -- 非关系型数据库
<br /><br /> 随着互联网web2.0网站的兴起,非关系型的数据库现在成了一个极其热门的新领域,非关系数据库产品的发展非常迅速。而传统的关系数据库在应付web2.0网站,特别是超大规模和高并发的SNS类型的web2.0纯动态网站已经显得力不从心,暴露了很多难以克服的问题,例如: <br /><br />1、High performance - 对数据库高并发读写的需求 <br />web2.0网站要根据用户个性化信息来实时生成动态页面和提供动态信息,所以基本上无法使用动态页面静态化技术,
2010-06-22 16:34:00
527
原创 Squid 限制用户并发连接数
<br />Squid 限制用户并发连接数<br /><br /><br />在squid.conf 下加如下配置<br /><br />client_db on<br />acl maxcons maxconn 20<br />http_access deny maxcons<br /> <br /> <br />网上找的,还没来得及测试,测试好了再过来修改。。
2010-06-07 18:47:00
4492
转载 调整linux提高squid并发
<br /> <br />Linux下高并发的Squid服务器,TCP TIME_WAIT套接字数量经常达到两、三万,服务器很容易被拖死。通过修改Linux内核参数,可以减少Squid服务器的TIME_WAIT套接字数量。<br /><br />vi /etc/sysctl.conf<br /><br /><br />增加以下几行:<br />引用<br />net.ipv4.tcp_fin_timeout = 30<br />net.ipv4.tcp_keepalive_tim
2010-06-07 17:42:00
2686
原创 js对文字进行编码的方式对比
js对文字编码有3个函数: escape,encodeURI,encodeURIComponent, 对应的解码函数:unescape,decodeURI,decodeURIComponent 1、escape对ansi码0-255以外的字符进行编码输出%u****格式即unicode值,escape 方法返回一个包含了 charstring 内容的字符串值( Unicode 格式)。所有空格
2010-05-25 13:28:00
670
转载 URL最大长度限制
URL不能大于255bytes的说法确实存在,在RFC2616中提到:The HTTP protocol does not place any a priori limit on the length of a URI. Servers MUST be able to han
2010-05-25 13:16:00
781
转载 Grep学习笔记
Grep学习笔记整理:Jims of 肥肥世家 yjnet@21cn.com>Copyright © 2004 本文遵从GPL协议,欢迎转载、修改、散布。第一次发布时间:2004年7月16日Table of Contents1. grep简介2. gre
2010-05-19 18:18:00
499
原创 sort uniq cat grep apache_log
分析 特定url 哪些ip 访问次数分别是多少cat /log/access.log | grep downfile | awk ‘{printf(”%s/n”,$1)}’ | sort | uniq -c | sort -n分析apache日志得到蜘蛛ip的简单方法cat access_log | grep spider | awk -F ” ” ‘{print $1}’ | sor
2010-05-19 17:24:00
675
转载 Shell编程基础
本文作者:Leal编辑人员:FireHare, Dbzhang800 我们可以使用任意一种文字编辑器,比如gedit、kedit、emacs、vi等来编写shell脚本,它必须以如下行开始(必须放在文件的第一行): # !/bin/sh...注意:最好使用“!/bin/bash”而不是“!/bin/sh”,如果使用tc shell
2010-05-19 16:23:00
438
转载 lsyncd+rsync实现实时自动同步
一、概述一般rsync软件是通过crond这支后台进行(计划任务)来实现自动同步数据,如今已有更好的开源软件来代替使用crond了,那就是lsyncd( Live Syncing (Mirror) Daemon),它的工作原理:监视本地(rsync client)的目录,当源数据有文件或目录更新时,更新本地文件或目录到远端机器(rsync server),保持实时文
2010-05-19 11:04:00
1162
转载 编译php支持curl和pdo_mysql
安装curl 1. curl 是 php 標準庫,所以可以在原來的 phpX.X.X.tar.gz 中找到。 2. 進入 php 目錄中的 ext 找到 curl 3. 在 curl 目錄中執行 /usr/local/php5-fastcgi/bin/phpize 4. 再來將他生成的檔案進行 ./configure –with-php-config=/
2010-05-18 17:07:00
921
转载 nginx+PHP+PHP-FPM(FastCGI)在Ubuntu上的安装和配置
0 之前知识回顾: 1) 目前各种服务器HTTP Server对PHP的支持一共有三种: a.通过HTTPServer内置的模块来实现,例如Apache的mod_php5,类似的Apache内置的mod_perl可以对perl支持;b.通过CGI来实现,这个就好比之前perl的CGI,该种方式的缺点是性能差,因为每次服务器遇到这些脚本都需要重新启动脚本解析器来执行脚
2010-05-05 11:21:00
1688
转载 p3p header相关的文章
场景一:A网站全站均为UTF-8编码,B网站全站为GB2312编码。A网站提供一段JS代码供B网站调用,该代码会动态生成一个FORM表单,以收集提交上来的数据。B网站此时开始提交数据,但提交上来的中文均为乱码。现象的产生是由于二个网站编码不一致而导致的,一般情况下使二个网站的编码一致即可。如果无法统一编码该怎么办?FORM有一个accept-charset属性
2010-04-30 18:04:00
796
转载 (squid+nginx+varnish)资料整理
http://www.sudone.com/archie/archi_bbs.html http://forum.ziy.cc/t11022/http://www.wangchao.net.cn/bbsdetail_39189.htmlhttp://www.shouker.com/user4/ayou/2008/4/9/114840.html http://su
2010-04-30 14:09:00
1490
1
原创 vimperator 回复ctrl-c ctrl-v快捷键
vimperator是firefox的一个插件,使得你可以向vim一样浏览网页。。很好用。但是原本的ctrl c 和 ctrl v 被vim映射为其他用途了,很不习惯。 这样可以修改回来! :noremap
2010-04-26 17:45:00
1323
转载 三种web性能压力测试工具http_load webbench ab小结
原文:http://www.askwan.com/post/6/题记:压力和性能测试工具很多,下文讨论的是我觉得比较容易上手,用的比较多的三种http_load下载地址:http://www.acme.com/software/http_load/http_load-12mar2006.tar.gz程序非常小,解压后也不到100K
2010-04-09 11:05:00
641
转载 查看Apache并发请求数及其TCP连接状态
[文章作者:张宴 本文版本:v1.1 最后修改:2007.07.27 转载请注明出处:http://blog.s135.com] 这两天搭建了一组Apache服务器,每台服务器4G内存,采用的是prefork模式,一开始设置的连接数太少了,需要较长的时间去响应用户的请求,后来修改了一下Apache 2.0.59的配置文件httpd.conf:引用# prefo
2010-04-06 18:40:00
502
原创 php获取https协议内容的两种方法
第一种: 直接使用函数: file_get_contents(); 前提是需要php编译时候支持 ssl,也就是加上with=openssl选项,windows下则需要将extention=openssl.dll选项打开。 比如:echo file_get_contents(https://www.paypal.com/c2);即可打印出结果!
2010-04-06 14:48:00
2793
原创 VSFTP安装和配置
一、安装部分 首先去vsftp他们家下载源码:ftp://vsftpd.beasts.org/users/cevans/ 我装的是vsftpd-2.2.2.tar.gz安装和配置过程中没出现什么问题。 然后解压缩 tar -xzvf vsftpd-2.2.2.tar.gz cd ... make
2010-04-06 11:55:00
673
转载 压力测试工具apache-ab讲解
最近在做webservices,得到的数据是从德国那边的服务器。要将这些数据整合到现在网站中去。不知道性能如何。就做个压力测试。现在有些压力测试工具都是收费的。在开源的apache中自带个ab工具。就在C:/Apache2.2/bin/ab.exe。用它可以检测自己的程序性能如何。用下吧!,可以提高自己代码质量。APACHE的bin目录下。格式.ab [opti
2010-04-01 17:27:00
655
转载 apache2配置优化以及性能测试小结
转自:http://blog.youkuaiyun.com/phphot/archive/2008/06/13/2544949.aspx 一、优化目的: 公司中现有多个apache平台,其中网元管理
2010-04-01 14:20:00
641
Oracle 11g R2所有需要的包
2015-01-24
openGL开发库大全 GL\GLUT\GLAUX\GLUI .lib, .h and .dll
2012-01-19
游戏数值策划-暴雪式平衡的探究.pdf
2012-01-05
fckeditor for JAVA所需要的所有文件
2009-02-02
进程知识库.part3.rar(第三部分,共三部分) -- 介绍常见进程的书,很全
2009-01-09
进程知识库.part1.rar(第一部分,共三部分) -- 介绍常见进程的书,很全
2009-01-09
知识点网络可视化表示的系统设计
2008-11-24
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人