转载请注明出处:http://blog.youkuaiyun.com/luonanqin
暂停更新三个多月,转眼间就2014年了。年底相信都是大家最忙碌的时候,我也不例外,以至于真的是没腾出手来继续更新,好在年初这段时间可以休息一阵了,所以赶着这段时间空闲就多写点吧。本来想先写view,pattern这些常用的内容以满足大部分人的需求,但是考虑到这些章节有涉及到前面章节的知识,所以我觉得基础还是要学的,不能还没学会走就想跑,否则可能会摔得很惨哦。
本篇的内容主要包括了Subquery(也就是子查询)和Join,内容不少,但是不难,基本上和sql差不太多。
1.Subquery
EPL里的Subquery和sql的类似,是否比sql的用法更多我不得而知,毕竟本人是sql菜鸟,只在where语句里用过子查询。废话不多说,先上几个Subquer的简单用法:
子查询结果作为外部事件的属性
- select assetId, (select zone from ZoneClosed.std:lastevent()) as lastClosed from RFIDEvent
子查询关联外部事件的属性
- select * from RfidEvent as RFID where 'Dock 1' = (select name from Zones.std:unique(zoneId) where zoneId = RFID.zoneId)
- select zoneId, (select name from Zones.std:unique(zoneId) where zoneId = RFID.zoneId) as name from RFIDEvent
子查询内部事件作为外部事件的属性
- select (select * from MarketData.std:lastevent()) as md from SuperMarket
每进入一个SuperMarket事件就返回最新的MarketData事件作为属性返回,别名为md
子查询中应用聚合函数
- select * from MarketData where price > (select max(price) from MarketData(symbol='GOOG').std:lastevent())
- select * from OrderEvent oe where qty > (select sum(qty) from OrderEvent.win:time(1 hour) pd where pd.client = oe.client)
Filter中使用子查询
- select * from BarData(ticker='MSFT', closePrice < (select movAgv from SMA20Stream(ticker='MSFT').std:lastevent()))
Pattern中使用子查询
- select * from pattern [
- a=A -> b=B(bvalue = (select d_val from DNamedWindow as d where d.d_id = b.b_id and d.d_id = a.a_id))
- ]
pattern的含义可先不深究,这里只要知道子查询可以用在pattern中就行了。
Expression中使用子查询(什么是Expression?请看《Esper学习之五:EPL语法(一)》的第八点)
- expression subq {
- (select max(quantity) as maxq, min(quantity) as minq from OrderEvent.win:time(1 min))
- }
- select (quantity - minq) / (subq().maxq - subq().minq) as prorated from OrderEvent
以上就是子查询的几种简单用法,不过有几点注意事项是要各位悉知的:
1.子查询的返回必须使用data window或者view来进行限制,控制子查询使用的事件数(data window和view相当于具有某种功能性的事件集合)
2.子查询语句只能由select子句,from子句以及where子句组成,其他的均不支持,比如group by,limit等
3.没有关联外部事件的子查询语句也可以使用聚合函数
4.子查询语句中的select子句必须对所有属性使用聚合函数
5.在使用子查询时,如果子查询的事件和外部事件类型一样,则事件到来时,先经过子查询语句的处理,然后再经过外部语句的处理。如果包含了多个子查询语句,则事件的处理顺序规则较为复杂,本人暂时没做研究。
针对第4点可能说得有些不明白,特此举例说明下:
- class Apple {
- private int price;
- private int size;
- public void setPrice(int price) {
- this.price = price;
- }
- public void setSize(int size) {
- this.size = size;
- }
- public int getPrice() {
- return price;
- }
- public int getSize() {
- return size;
- }
- }
- class Fruit {
- }
- public class Test {
- public static void main(String[] args) throws InterruptedException {
- EPServiceProvider epService = EPServiceProviderManager.getDefaultProvider();
- EPAdministrator admin = epService.getEPAdministrator();
- String epl1 = "select (select sum(price), sum(size) from " + Apple.class.getName() + ".std:lastevent()) from " + Fruit.class.getName();
- /*
- * 当然,对不同的属性使用不同的聚合函数也是可以的
- */
- // String epl1 = "select (select sum(price), avg(size) from " + Apple.class.getName() + ".std:lastevent()) from " + Fruit.class.getName();
- /*
- * 注意:size没有使用聚合函数,会导致创建epl失败。文档中注明了“The properties of the subselect stream must all be within aggregation functions”.
- * 即子查询中的select子句使用聚合函数时,所查询的属性都要使用聚合函数
- */
- // String epl1 = "select (select sum(price), size from " + Apple.class.getName() + ".std:lastevent()) from " + Fruit.class.getName();
- admin.createEPL(epl1);
- System.out.println("Create epl successfully!");
- }
- }
除了上面的语法外,有几个关键字也是需要大家注意的。
exists
这个exists和exist可不一样,虽说也是用在where子句中(不仅仅是where子句),但是exists前面是没有什么待比较属性的。语法如下:
- exists (subquery)
- select * from Fruit as F where exists (select * from Apple.std:lastevent() where acount = F.fcount)
- select * from Fruit(exists (select * from Apple.win:keepall()))
1.exists后面的子查询语句一定要用圆括号括起来,遗漏的话会报语法错误。
2.exists后面的子查询语句只能返回单列值。什么叫单列值?比如:Apple有price和size属性,那么select price和select size都是返回的单列(即一列),select price, size就是多列(即两列)。如果subquery中返回的大于一列,则会报multi-column错误。谨记!
in / not in
用法和sql的一样,具体语法就不说了,直接看例子吧:
- // 当前进入的Apple事件的aPrice存在于过去十秒内进入的Fruit的fPrice即可返回
- select * from Apple where aPrice in (select fPrice from Fruit.win:time(10 s))
注意:从语法上说in/not in前面是expression,并没有规定只能是属性。比如:Apple有aPrice和aSize两个int属性,则where子句可以写成"aPrice+aSize in ....."(这里只是举例,不expression不表示任何意思)
any / some / all
除了用in或者not in判断属性值是否存在于子查询结果中,还可以使用any/some/all并配合一些比较符号与子查询结果进行比较。语法如下:
- expression operator any/some/all (subquery)
- // operator包含:>=, !=, <>, <, <=, >, >=
- // 如果当前Apple事件的aPrice小于前十个Fruit中的任何一个fPrice,则返回此事件
- select * from Apple where aPrice < any (select fPrice from Fruit.win:length(10))
- // 如果当前Apple事件的aPrice小于前十个Fruit中的所有fPrice,则返回此事件
- select * from Apple where aPrice < all (select fPrice from Fruit.win:length(10))
some和any同义,所以用法也相同。既然一样为什么又要弄这么个关键字,我也没搞懂。。。
子查询返回多列数据
子查询可以返回单列数据,也可以返回多列数据。用法很简单,只需要“."(点)就能找到每列的数据了。示例如下:
- select *,
- (select bid, offer from MarketData.std:unique(symbol) as md where md.symbol = oe.symbol) as bidoffer
- from OrderEvent oe
2.Join
Join在sql里是很常见的查询方法,EPL也同样支持,并且包含了full outer join / left outer join / right outer join / inner join等。和sql基本无差别。
inner join
在没有任何关键字的修饰下,即为默认join方式,也就是inner join。必须等到所有join的事件都到了才可能输出,因为要是有where关联两个事件,得满足where条件了才能输出。例如:
- select * from Orange.std:lastevent(), Banana.std:lastevent()
full outer join
上面看到的默认join方式是要求所有join的事件都必须到达引擎才会输出,并且join的事件之间通过where子句设置了条件判断,还得到达的两个事件满足条件了才能输出,而full outer join正好解决了这个问题,不管哪个事件到达,不管是否符合条件,都会输出。例如:
- select * from Orange.std:lastevent() as o full outer join Banana.std:lastevent() as b on o.price = b.price
a.当只有Orange事件到达,没有满足join条件,会输出Orange事件,且Banana事件为null。
b.当只有Banana事件到达,没有满足join条件,会输出Banana事件,且Orange事件为null。
c.当两个事件都到达了,且没有满足join条件,即price不相等,则a,b情况各出现一次。
d.当两个事件都到达了,且满足join条件,即price相等,即可输出满足条件的事件。
所以说不管什么情况下,当前进入的事件都会输出,至于join的那个事件,满足即输出事件,不满足即输出null。
left outer join
full outer join输出了所进入的所有事件,不满足join条件的就输出null,而left outer join则规定关键字左边的事件可以即刻输出,而关键字右边的事件必须满足join条件才可输出。示例如下:
- select * from Pink.std:lastevent() as pi left outer join Pear.std:lastevent() as pe on pi.price = pe.price
right outer join
和left outer join相反,在关键字右边的事件不受join条件约束,而左边的事件必须满足join条件才可输出。具体例子我就不举了,大家可以写两个句子试试。
此外,在使用以上4种join的时候,可以多种join混用。比如:
- select * from Apple.std:lastevent() as a
- left outer join Banana.std:lastevent() as b on a.price = b.price
- full outer join Orange.std:lastevent() as o on o.price = a.price
- // a,b分别是两个事件的别名
- // 正确写法
- ……on a.price = b.price and a.size = b.size……
- // 错误写法1:不能用逗号连接
- ……on a.price = b.price, a.size = b.size……
- // 错误写法2:必须针对同样的事件进行限制(c是另一个事件的别名)
- ……on a.price = b.price and a.size = c.size……
Unidirectional Join
之前说到,如果不加特殊修饰,则join的事件都需要data window或者view修饰,目的是为了暂存事件以便等待满足条件的事件并执行join。如果想让某个事件到来时直接触发join,不需要暂存,也就是不需要data window或者view修饰,则需要加上一个特殊关键字——unidirectional。先看一个简单的例子:
- select * from Apple as a unidirectional, Banana.std:lastevent() as b where a.price = b.price
由于有unidirectional的修饰,表明Apple事件是即时出发join操作,也就是说进入此EPL的Apple事件是无状态的。所以当Apple事件到来时,如果没有price相等的Banana,则什么输出也没有,即使下一个Banana事件的price和之前来的Apple的price相等也不会有输出,因为那个Apple事件已经从这个句子的上下文中移除了。为了更好的看到效果,我给大家写了一给完整的例子:
- class Orange {
- private int price;
- public void setPrice(int price) {
- this.price = price;
- }
- public int getPrice() {
- return price;
- }
- @Override
- public String toString() {
- return "Orange price=" + price;
- }
- }
- class Banana {
- private int price;
- public int getPrice() {
- return price;
- }
- public void setPrice(int price) {
- this.price = price;
- }
- @Override
- public String toString() {
- return "Banana price=" + price;
- }
- }
- class JoinUnidirectionalListener implements UpdateListener {
- public void update(EventBean[] newEvents, EventBean[] oldEvents) {
- if (newEvents != null) {
- System.out.println(newEvents[0].get("o") + ", " + newEvents[0].get("b"));
- }
- }
- }
- public class JoinUnidirectionalTest {
- public static void main(String[] args) throws InterruptedException {
- EPServiceProvider epService = EPServiceProviderManager.getDefaultProvider();
- EPAdministrator admin = epService.getEPAdministrator();
- String epl1 = "select * from " + Orange.class.getName() + " as o unidirectional, " + Banana.class.getName()
- + ".std:lastevent() as b where o.price = b.price";
- EPStatement stat = admin.createEPL(epl1);
- stat.addListener(new JoinUnidirectionalListener());
- EPRuntime runtime = epService.getEPRuntime();
- Orange o1 = new Orange();
- o1.setPrice(1);
- System.out.println("Send Orange1");
- runtime.sendEvent(o1);
- Banana b1 = new Banana();
- b1.setPrice(1);
- System.out.println("Send Banana1");
- runtime.sendEvent(b1);
- Banana b2 = new Banana();
- b2.setPrice(2);
- System.out.println("Send Banana2");
- runtime.sendEvent(b2);
- Orange o2 = new Orange();
- o2.setPrice(2);
- System.out.println("Send Orange2");
- runtime.sendEvent(o2);
- }
- }
- Send Orange1
- Send Banana1
- Send Banana2
- Send Orange2
- Orange price=2, Banana price=2
unidirectional使用很简单,但是也有其限制:
1.在一个join句子中,unidirectional关键字只能用于一个事件流。
2.用unidirectional修饰的事件流,不能通过esper的查询api查出来,因为该事件流是无状态的,不会暂存在引擎中,所以就没法查了。(关于查询api,后面的章节会详说)
3.使用了unidirectional修饰的事件流就不能再用data window或者view修饰了,也就是说他们是互斥的。
以上就是Subquery和Join的相关内容。由于和sql比计较接近,所以学起来应该很快吧。如果有什么疑问可以给我评论,我一定会一一解答的。
下一篇会讲解关于关系数据库的内容,敬请期待