Thrift 是什么?

Thrift 是什么?
2011年03月19日
  Thrift 是什么?
  Thrift源于大名鼎鼎的facebook之手,在2007年facebook提交Apache基金会将Thrift作为一个开源项目,对于当时的facebook来说创造thrift是为了解决facebook系统中各系统间大数据量的传 输通信以及系统之间语言环境不同需要跨平台的特性。所以thrift可以支持多种程序语言,例如: C++, C#, Cocoa, Erlang, Haskell, Java, Ocami, Perl, PHP, Python, Ruby, Smalltalk. 在多种不同的语言之间通信thrift可以作为二进制的高性能的通讯中间件,支持数据(对象)序列化和多种类型的RPC服务。Thrift适用于程序对程 序静态的数据交换,需要先确定好他的数据结构,他是完全静态化的,当数据结构发生变化时,必须重新编辑IDL文件,代码生成,再编译载入的流程,跟其他IDL工具相比较可以视为是Thrift的弱项,Thrift适用于搭建大型数据交换及存储的通用工具,对于大型系统中的内部数据传输相对于JSON和xml无论在性能、传输大小上有明显的优势。
  Thrift是IDL(interface definition language)描述性语言的一个具体实现,关于IDL的话题我们可以追溯到CORBA盛行1999-2001年(Common Object Request Broker Architecture/公用对象请求代理体系结构),在 IDL 中我们似乎不会忘记到这几个关键字:module、interface、string、long 和 int,我还记得IDL利用module来创建名称空间,并且准确地映射为 Java 的 package,这些特性几乎和现在thrift的特性完全相同,所以thrift的设计思想和理念绝不是什么从火星来的new idea,看看在那个CORBA盛行的年代人们提出的概念,如图所示CORBA 请求的各个部分,回头我们再与thrift进行对比一下:
  
  Thrift 基础架构
  Thrift是一个服务端和客户端的架构体系,从我个人的感官上来看Thrift是一个类似XML-RPC+Java-to- IDL+Serialization Tools=Thrift 的东东,Thrift 具有自己内部定义的传输协议规范(TProtocol)和传输数据标准(TTransports),通过IDL脚本对传输数据的数据结构(struct) 和传输数据的业务逻辑(service)根据不同的运行环境快速的构建相应的代码,并且通过自己内部的序列化机制对传输的数据进行简化和压缩提高高并发、 大型系统中数据交互的成本,下图描绘了Thrift的整体架构,分为6个部分:1.你的业务逻辑实现(You Code) 2.客户端和服务端对应的Service 3.执行读写操作的计算结果4.TProtocol 5.TTransports 6.底层I/O通信
  
  图 中前面3个部分是1.你通过Thrift脚本文件生成的代码,2.图中的褐色框部分是你根据生成代码构建的客户端和处理器的代码,3.图中红色的部分是2 端产生的计算结果。从TProtocol下面3个部分是Thrift的传输体系和传输协议以及底层I/O通信,Thrift并且提供 堵塞、非阻塞,单线程、多线程的模式运行在服务器上,还可以配合服务器/容器一起运行,可以和现有JEE服务器/Web容器无缝的结合。
  数据类型
  * Base Types:基本类型
  * Struct:结构体类型
  * Container:容器类型,即List、Set、Map
  * Exception:异常类型
  * Service: 定义对象的接口,和一系列方法
  协议
  Thrift可以让你选择客户端与服务端之间传输通信协议的类别,在传输协议上总体上划分为文本(text)和二进制(binary)传输协议, 为节约带宽,提供传输效率,一般情况下使用二进制类型的传输协议为多数,但有时会还是会使用基于文本类型的协议,这需要根据项目/产品中的实际需求:
  * TBinaryProtocol 二进制编码格式进行数据传输。
  * TCompactProtocol 这种协议非常有效的,使用Variable-Length Quantity (VLQ) 编码对数据进行压缩。
  * TJSONProtocol 使用JSON的数据编码协议进行数据传输。
  * TSimpleJSONProtocol 这种节约只提供JSON只写的协议,适用于通过脚本语言解析
  * TDebugProtocol 在开发的过程中帮助开发人员调试用的,以文本的形式展现方便阅读。
  传输层
  * TSocket- 使用堵塞式I/O进行传输,也是最常见的模式。
  * TFramedTransport- 使用非阻塞方式,按块的大小,进行传输,类似于Java中的NIO。
  * TFileTransport- 顾名思义按照文件的方式进程传输,虽然这种方式不提供Java的实现,但是实现起来非常简单。
  * TMemoryTransport- 使用内存I/O,就好比Java中的ByteArrayOutputStream实现。
  * TZlibTransport- 使用执行zlib压缩,不提供Java的实现。
  服务端类型
  * TSimpleServer - 单线程服务器端使用标准的堵塞式I/O。
  * TThreadPoolServer - 多线程服务器端使用标准的堵塞式I/O。
  * TNonblockingServer 多线程服务器端使用非堵塞式I/O,并且实现了Java中的NIO通道。
  谁在用thrift ?
  
  Thrift用于Quara系统后端数据的通信,服务端是用C++来实现的,客户端则是python。
  Quara背景:Quara是在线问答服务公司,类似新浪微博和百度知道的合体,消息灵通人士透露,去年Quara获得了1400万美元投资,目前他们只有9名员工。
  原文:http://www.philwhln.com/quoras-technology-examined #thrift
  
  Thrift用于在多种Evernote API平台开发的客户端与Evernote服务器之间的通信与数据传输,Evernote API定义了自己的Evernote Data Access and Management (EDAM) 协议规范,让客户端使用更小的网络带宽上传、下载文件和在线即时搜索服务。
  Evernote 背景:EverNote是一款非常著名的免费软件,它最大的特点就是支持多平台,而且数据能通过网络互相同步。譬如说,你可以随时在手机上的Evernote新增笔记,回家后在电脑上也能看到它了!
  原文:http://www.evernote.com/about/developer/api/everno te-api.htm
  HBase 中的Thrift
  Thrift用于HBase中是为了提供跨平台的服务接口,在HBase 中可以使用[hbase-root]/bin/hbase thrift start 命令启动涵盖Thrift的HBase服务端,客户端通过thrift的命令生成不同版本的客户端代码,根据定义的数据格式,对远程HBase服务端进行 操作,是除了REST远程方法调用的另一种途径。
  参见:http://wiki.apache.org/hadoop/Hbase/ThriftApi
  更多资料请阅读:http://wiki.apache.org/thrift/PoweredBy
  Thrift与其他传输方式的比较
  xml与JSON相比体积太大,但是xml传统,也不算复杂。
  json 体积较小,新颖,但不够完善。
  thrift 体积超小,使用起来比较麻烦,不如前两者轻便,但是对于1.高并发、2.数据传输量大、3.多语言环境, 满足其中2点使用 thrift还是值得的。
  假定需要传输相同的内容,但使用不同的方式从 1、传输内容所产生的大小 2、传输过程中服务端和客户端所产生的开销,这2个方便进行比较。使用Thrift和其他方式的所产生的内容大小比较结果如下:
  
  在上图中我们能明显看出,最臃肿的是RMI,其次是xml,使用Thrift的TCompactProtocol协议和Google 的 Protocol Buffers 相差的不算太多,相比而言还是Google 的 Protocol Buffers效果最佳。
  使用Thrift 中的协议和其他方式的所产生的运行开销比较结果如下:
  
  在上图中我们能明显看出,最占资源是REST2中协议,使用Thrift的TCompactProtocol协议和Google 的 Protocol Buffers 相差的不算太多,相比而言Thrift的TCompactProtocol协议效果最佳。
<think>嗯,用户想了解Thrift网络协议,我需要根据提供的引用内容构建清晰的解释。引用1提到Thrift的核心是RPC通信协议,通过IDL定义方法和数据结构并生成多语言代码;引用2强调了协议可选择性,重点在文本和二进制传输协议的区别;引用3补充了Apache背景和跨语言优势,特别指出Go语言的适用性。 用户的问题聚焦在"协议"本身,但根据引用,Thrift实际包含三层概念:核心的IDL接口定义层、传输层协议(如TCP/HTTP)、以及序列化层协议(二进制/文本)。需要明确区分这些层级以避免混淆。引用2中关于文本协议调试便利性的细节值得保留。 考虑到用户可能的技术背景,解释时需要平衡专业性和易性:先用IDL生成代码的机制说明跨语言原理,再用分层架构图直观展示协议栈。传输协议部分要对比二进制的高效和文本的可性,特别说明实际开发中通常优先选择二进制协议。 安全性和生产实践是潜在延伸点,但当前回复篇幅已足够。最后提出的三个问题覆盖了核心拓展方向:分层细节帮助理解架构设计,协议选择指导实际开发,性能优化则满足进阶需求。 </think>Thrift网络协议是Apache基金会开发的**跨语言RPC(远程过程调用)框架的核心通信协议**,它通过分层设计实现高效的跨语言服务通信。以下是核心特点和架构解析: --- ### **核心组件与工作流程** 1. **IDL(接口定义语言)** - 用户使用`.thrift`文件**定义服务接口和数据结构**(如方法名、参数类型、返回值)。 - 示例IDL片段: ```thrift service Calculator { i32 add(1:i32 num1, 2:i32 num2) } ``` 2. **代码生成器** - Thrift编译器将IDL文件**自动生成目标语言的客户端/服务端代码**(支持Java, Go, Python等20+语言)[^1][^3]。 - 生成代码封装了网络通信、序列化等底层细节,开发者只需实现业务逻辑。 3. **分层协议栈** Thrift协议栈分为四层: ```mermaid graph LR A[业务实现] --> B[服务层] B --> C[传输层] C --> D[网络层] ``` - **传输层(Transport)** 管理网络连接(TCP/HTTP等),提供可靠的数据传输通道。 - **协议层(Protocol)** **核心协议实现**,定义数据序列化格式: - **二进制协议(TBinaryProtocol)**:高性能,节省带宽(默认推荐)[^2] - **紧凑协议(TCompactProtocol)**:更高的压缩率 - **JSON协议(TJSONProtocol)**:可性强,便于调试[^2] - **服务层(Server)** 封装多线程/异步处理模型(如线程池、非阻塞IO)。 --- ### **关键特性** 1. **跨语言能力** 通过IDL统一接口定义,实现Java服务端与Go/Python客户端的无缝通信[^3]。 2. **高性能序列化** 二进制协议减少序列化开销,速度比JSON/XML快5-10倍。 3. **协议可插拔** 可根据场景切换协议(如测试用JSON,生产用二进制)[^2]。 4. **多传输支持** 除TCP外,支持HTTP、内存管道等传输方式。 --- ### **典型应用场景** 1. **微服务通信**:跨语言服务间的RPC调用 2. **数据密集型系统**:如广告实时竞价(低延迟需求) 3. **跨团队协作**:统一IDL规范接口,解耦技术栈差异 4. **物联网设备通信**:轻量级二进制协议节省资源 > ⚠️ **注意事项**: > - 二进制协议需严格版本管理,字段增减可能引发兼容性问题 > - 复杂嵌套结构可能降低序列化效率,需合理设计IDL --- ### **Thrift在Go中的实践** Go语言通过`thrift`官方库提供支持: ```go // 生成代码调用示例 client := calculator.NewCalculatorClientProtocol( transport, thrift.NewTBinaryProtocolFactoryDefault(), // 使用二进制协议 thrift.NewTBinaryProtocolFactoryDefault(), ) result, _ := client.Add(ctx, 3, 5) // 调用远端的Add方法 ``` 优势:利用Go的并发模型实现高吞吐服务;挑战:需手动管理连接池优化性能[^3]。 --- ### **对比传统协议** | 特性 | Thrift | REST/JSON | gRPC | |------------|--------------|---------------|---------------| | 传输效率 | ⭐⭐⭐⭐ (二进制) | ⭐⭐ (文本) | ⭐⭐⭐⭐ (Protobuf)| | 跨语言支持 | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ | | 开发便捷性 | ⭐⭐ (需IDL) | ⭐⭐⭐⭐⭐ | ⭐⭐⭐ (需Proto) | | 调试友好度 | ⭐ (需工具) | ⭐⭐⭐⭐⭐ | ⭐⭐ (需工具) | ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值