SSIS中的字符提取组件

想想看这样一个场景:我们有一个表中,有一个字段包含了大量的文字。我们想要找到在这些文字中那些词出现的频率高,并且到底有多高?

那么该怎么办呢?当然,你有很多其他的方法去做。我们这里介绍的是使用SSIS的字符提取组件来完成这个任务。

 

1. 准备数据源

为了做这个演示,我们使用了范例数据库(Adventureworks)的ProductDescription这个表。这里有一个列是对产品的描述的。

image 

2. 设计SSIS数据流任务.它大概看起来像下面这样

image

关于字符查找这个组件的配置,大致如下

image

【这里可以指定多个列】

image

image

 

 

3. 运行这个数据流任务,查看结果

image

我们看到,HL出现次数最多,为26次。这确实看起来很酷

本文由作者: 陈希章 于 2009/6/22 16:46:28 发布在: http://www.cnblogs.com/chenxizhang/
本文版权归作者所有,可以转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。
更多博客文章,以及作者对于博客引用方面的完整声明以及合作方面的政策,请参考以下站点: 陈希章的博客中心
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值