
Python语言
xywlzd
这个作者很懒,什么都没留下…
展开
-
python 内置函数
__import__( name[, globals[, locals[, fromlist[, level]]]]) 被import语句调用的函数。 它的存在主要是为了你可以用另外一个有兼容接口的函数 来改变 import 语句的语义. 为什么和怎么做的例子, 标准库模块ihooks和rexec. 也可以查看imp, 它定义了有用的操作 ,你可以创建你自己的 __import__()函数.转载 2012-09-11 17:11:41 · 616 阅读 · 0 评论 -
用 Apache Tika 理解信息内容
简介在本教程中,我们将通过解释性的例子介绍 Apache Tika 框架并解释它的概念(比如 N-gram、解析、mime 检测以及内容分析),这些例子不仅适用于老练的软件开发人员,而且也同样适用于内容分析和编程的初学者。我们假设您具有 Java™ 编程语言的应用知识以及用于分析的足够内容。通过本教程,您将学会:Apache Tika 的 API、最相关的模块以及相关的转载 2012-09-14 10:37:22 · 1423 阅读 · 0 评论 -
python 面向对象
一、类基础1、类的定义class : class (父类名): [>>> class human:... age=0... sex=''... name = ''...>>> class student(human):... school = ''... number = 0转载 2012-09-11 17:20:02 · 340 阅读 · 0 评论 -
python 字符串操作
(一)字符串操作 >>> str = 'hi, python!'>>> str'hi, python!'>>> str.capitalize() #将字符串的第一个字母大写'Hi, python!'>>> str.count('p')1>>> str.find('hello') #获得字符串hello的起始位置,-1表示为找到-1>>转载 2012-09-11 17:13:35 · 335 阅读 · 0 评论 -
python 模块
模块是包含函数和其他语句的python脚本文件,它以 .py 为后缀名。在python中可以通过导入模块,然后使用模块中提供的函数或者数据。1、导入模块:import 模块名import 模块名 as 新名字from 模块名 import 函数名[python] view plaincopyprint?>>> import string #只转载 2012-09-11 17:20:55 · 658 阅读 · 0 评论 -
python 数据类型:列表和元组
列表是以方括号[]包围的数据集合,不同成员以‘,’隔开。列表中可以包含任何数据类型,也可以包括另一个列表。列表页可以通过序号来访问其中的成员。在脚本中可以对列表中的数据进行排序、添加、删除等操作,改变列表中的中某一成员。 元组是以圆括号()包围的数据集合。与列表不同的是,元组中的数据一旦确定就不能被改变。元组可以使用在不希望数据被其他操作改变的场合。[pyth转载 2012-09-11 17:14:40 · 585 阅读 · 0 评论 -
python 异常处理
一)捕获异常格式一:try: except : except : else: 如果没有异常,则执行else块中的语句 格式二:try: finally: 不管try语句块中是否发生异常,都将执行finally语句块。>>> l = [1,2,3]>>> l[5]T转载 2012-09-11 17:26:09 · 543 阅读 · 0 评论 -
python 函数
(一)函数声明:def (参数列表): return 1)无返回值的函数声明[>>> def printAll(X):... for x in X:... print x...>>> l = [1,2,3,4] #定义一个列表>>> print l[1, 2, 3, 4]>>> pri转载 2012-09-11 17:22:21 · 396 阅读 · 0 评论 -
python 基本语句
(一)if语句:>>> m = 'hi'>>> n = 'hello'>>> print m,nhi hello>>> if m == n:... print 'true'... elif m > n:... print 'false'... else:... print m,n...false转载 2012-09-11 17:23:15 · 413 阅读 · 0 评论 -
python 文件操作
(一)列出目录下的文件名:[python] view plaincopyprint?# -*- coding:utf-8 -*- #必须有以上的注释,否则中文会出现乱码 import os print '你当前的目录为:' , os.getcwd() path = raw_input('请输入文件夹的路径:') if os.path.isdir(p转载 2012-09-11 17:28:07 · 440 阅读 · 0 评论 -
python 多线程编程
一)线程基础1、创建线程:thread模块提供了start_new_thread函数,用以创建线程。start_new_thread函数成功创建后还可以对其进行操作。其函数原型: start_new_thread(function,atgs[,kwargs])其参数含义如下: function: 在线程中执行的函数名 args:元组形式的参数列表。转载 2012-09-11 17:25:22 · 455 阅读 · 0 评论 -
python 数据类型:文件
open(filename,mode,bufsize)其参数的意义:filename:要打开的文件;mode:可选参数,文件打开的模式。'r' 只读方式打开,'w'写方式打开,'b'表示以二进制方式打开bufsize: 可选参数,缓冲区大小。常用的文件操作函数如下:file.read() 将整个文件读入字符串中file.readline() 读入文件中的一行字符转载 2012-09-11 17:24:08 · 481 阅读 · 0 评论 -
python 数据类型:字典
[python] view plaincopyprint?>>> dic = {'apple':2,'orange':1}#定义一个字典 >>> dic {'orange': 1,'apple': 2} >>> newdic = dic.copy() >>> newdic {'orange': 1,'apple': 2} >>> dic['banan转载 2012-09-11 17:16:03 · 302 阅读 · 0 评论 -
Apache tika -- 解析多种类型(word、pdf、txt 等)文件!
apache 是个伟大的组织。在lucene 检索 如火如荼时, apache不忘继续努力,近期提供了对各种格式文件进行解析的解决方案 -- apache旗下的tika. 虽然还没有1.0版 , 但已经很好用:Java代码 /** * 解析各种类型文件 * @param 文件路径 * @return 文件内容字符串 *转载 2012-09-14 11:02:23 · 3546 阅读 · 1 评论