技术频道

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

pig中用户自定义函数的示例分析

时间：2022-10-30分类：服务器作者：编程之家

这篇文章将为大家详细讲解有关pig中用户自定义函数的示例分析，小编觉得挺实用的，因此分享给大家做个参考，希望大家阅读完这篇文章后可以有所收获。

用户自定义函数（UDF）
public abstract class EvalFunc<T> {
  public abstract T exec(Tuple input) throws IOException;
  public List<FuncSpec> getAvgToFuncMapping() throws FrontendException;
  public FuncSpec outputSchema() throws FrontendException;  }
输入元组的字段包含传递给函数的表达式，输出是泛型；对于过滤函数输出就是Boolean类型。建议尽量在
getAvgToFuncMapping()/outputSchema()申明输入和输出数据的类型，以便Pig进行类型转换或过滤不匹配类型的错误值。
Grunt>REGISTER pig-examples.jar;
      DEFINE isGood org.hadoopbook.pig.IsGoodQuality();
加载UDF
public LoadFunc {
public void setLocation(String location, Job job);
public InputFormat getInputFormat();
public void preparetoRead(RecordReader reader, PigSplit split);
public Tuple next() throws IOException;  }
类似Hadoop，Pig的数据加载先于mapper的运行，所以保证数据可以被分割成能被各个mapper独立处理的部分非常重要。从Pig 0.7开始，
加载和存储函数接口已经进行了大幅修改，以便与Hadoop的InputFormat和OutputFormat类基本一致。
Grunt>Register loadfunc.jar
      Define customload org.hadoopbook.pig.loadfunc()
      records = load ‘input/sample.txt’ using customload(‘16-19, 88-92, 93-93’)

as (year:int, temperature:int, quality:int);

关于“pig中用户自定义函数的示例分析”这篇文章就分享到这里了，希望以上内容可以对大家有一定的帮助，使各位可以学到更多知识，如果觉得文章不错，请把它分享出去让更多的人看到。

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 dio@foxmail.com 举报，一经查实，本站将立刻删除。

上一篇：linux如何实现指针函数追踪方法下一篇：Kafka消费与心跳机制如何理解

相关推荐

excel图案样式如何设置

今天小编给大家分享一下excel图案样式如何设置的相关知识点，内容详细，逻辑清晰，相信大部分人都还太了解这方面的知识，所以分享这篇文章给大家参考一下，希

作者：编程之家时间：2023-09-03

win10设置过的壁纸如何删除

这篇文章主要讲解了“win10设置过的壁纸如何删除”，文中的讲解内容简单清晰，易于学习与理解，下面请大家跟着小编的思路慢慢深入，一起来研究和学习“win10设置...

作者：编程之家时间：2023-09-03

Xmanager怎么显示远程linux程序的图像

这篇“Xmanager怎么显示远程linux程序的图像”文章的知识点大部分人都不太理解，所以小编给大家总结了以下内容，内容详细，步骤清晰，具有一定的借鉴价值，希

作者：编程之家时间：2023-09-03

xmanager怎么连接linux

今天小编给大家分享一下xmanager怎么连接linux的相关知识点，内容详细，逻辑清晰，相信大部分人都还太了解这方面的知识，所以分享这篇文章给大家参考一下，希

作者：编程之家时间：2023-09-03

如何重置Linux云服务器的远程密码

这篇“如何重置Linux云服务器的远程密码”文章的知识点大部分人都不太理解，所以小编给大家总结了以下内容，内容详细，步骤清晰，具有一定的借鉴...

作者：编程之家时间：2023-05-29

Linux云服务器手动配置DNS的方法是什么

本篇内容介绍了“Linux云服务器手动配置DNS的方法是什么”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何...

作者：编程之家时间：2023-05-29

Linux中如何部署Golang应用程序

这篇文章主要介绍“Linux中如何部署Golang应用程序”，在日常操作中，相信很多人在Linux中如何部署Golang应用程序问题上存在疑惑，小编查阅了各式资料，整理出

作者：编程之家时间：2023-05-29

Linux云服务器中如何使用sudo

这篇文章主要介绍“Linux云服务器中如何使用sudo”的相关知识，小编通过实际案例向大家展示操作过程，操作方法简单快捷，实用性强，希望这篇“Linux云服务器中

作者：编程之家时间：2023-05-29

linux怎么查看服务器开放和启用的端口

这篇文章主要讲解了“linux怎么查看服务器开放和启用的端口”，文中的讲解内容简单清晰，易于学习与理解，下面请大家跟着小编的思路慢慢深入，一起来研究和学习...

作者：编程之家时间：2023-05-29

Linux下怎么安装PHP的memcache扩展

这篇文章主要介绍“Linux下怎么安装PHP的memcache扩展”的相关知识，小编通过实际案例向大家展示操作过程，操作方法简单快捷，实用性强，希望这篇“Linux下怎

作者：编程之家时间：2023-05-29

小编推荐

苹果市值2025年有望达4万亿美元