U-SQL与Azure HDInsight:大数据处理的利器
1. U-SQL的内联表达式与代码后置
U-SQL为大数据处理提供了强大的功能,其中代码后置是一种快速向U-SQL添加自定义代码的方法。不过,使用代码后置存在一些缺点:
- 每次提交和执行脚本时,自定义代码都会被上传。
- 代码后置无法与其他U-SQL脚本和作业共享。
因此,推荐的做法是将代码复制到U-SQL类库中,然后将其编译并注册为U-SQL程序集。若要限制对程序集的访问权限,可以在特定的ADLA数据库中进行注册。
下面通过一个示例来说明代码后置的工作方式:
1. 打开之前创建的U-SQL应用程序项目。
2. 打开 Script.usql 文件,然后打开解决方案资源管理器并固定该窗口。
3. 在解决方案资源管理器中,展开 Script.usql 节点,显示 Script.usql.cs 文件。
4. 打开 Script.usql.cs 文件,并将其停靠在 Script.usql 窗口旁边,使三个窗口( Script.usql 、 Script.usql.cs 和解决方案资源管理器)并排显示。
Script.usql.cs 文件应包含一个没有方法的类的框架。将之前示例中的UDF粘贴到此处, Script.usql.cs 文件应如下所示:
超级会员免费看
订阅专栏 解锁全文
1098

被折叠的 条评论
为什么被折叠?



