
开源项目
iteye_20360
这个作者很懒,什么都没留下…
展开
-
libjingle 中文文档(翻译) 二 开发者指引
发者指引: libjingle SDK 由 C++源码和文档构成,你可以据此来设计网络互联、交换数据的应用程序(基于p2p的数据连接)。 这个SDK 包括源码、一些应用程序、在windows机器上编译所需要的vs 2005 的解决方案文件以及其他平台和编译器所需的 configuration 和 makefile 文件。 需要注意的是,源码还依赖了一些第三方库,(例如,语音聊天的...2012-09-11 15:34:11 · 241 阅读 · 0 评论 -
libjingle 中文文档(翻译) 一 关于libjingle
关于libjingle libjingle 是一个开源的C++源码和简单应用程序的集合,使用libjingle可以搭建 p2p的应用。代码实现了建立网络连接(基于NAT和防火墙穿透、转发服务器、代理)、协商session 的细节(编码解码、格式化等)和交换数据。它还提供了一些其他的功能,如:解析XML、处理网络代理。你可以使用libjingle 创建以下类型的应用程序:...2012-09-11 16:23:51 · 309 阅读 · 0 评论 -
文本提取调研(一)
背景:全文检索项目需要处理一些非文本文档格式的文件,提取其中的内容,已便建索引。比如html、pdf、office系列等。本文总结一下对pdf和office系列 格式的文件内容提取的调研。 一、word/ppt/excel 文本提取调研 主要调研的是 apache 的 poi ; 1、官方网站 http://poi.apache.org/ ;最新的版...2012-05-15 11:06:23 · 240 阅读 · 0 评论 -
文本提取调研(二)
除了 pdfbox 和 poi 还调研了另外一些开源项目,并做了一些简单验证。 DF文本提取的库一、iText: 只支持pdf的制作;二、iTextSharp: iText 的 C#版本,支持简单的导出;---未验证三、PDFClown: 作者在持续更新,目前最高版本 0.1.0 , 用提供的jar包做了个demo;验证结论:支持中文,繁体,处理效果 同 pdfbox ...2012-05-15 11:10:37 · 172 阅读 · 0 评论