微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

spark中迭代器的使用求最大或最小

groupbykey

import java.util.Arrays;
import java.util.List;

import org.apache.spark.SparkConf;
import org.apache.spark.api.java.JavaPairRDD;
import org.apache.spark.api.java.JavaSparkContext;

import jersey.repackaged.com.google.common.collect.Lists;
import scala.Tuple2;

public class groupbykey {

	public static void main(String[] args) {
		// Todo Auto-generated method stub
		SparkConf conf=new SparkConf().setAppName("").setMaster("local");
		JavaSparkContext sc=new JavaSparkContext(conf);
		List<Tuple2<String,Integer>> scores=Arrays.asList(
				new Tuple2<String,Integer>("jac",80),
				new Tuple2<String,Integer>("jac",100),
				new Tuple2<String,Integer>("jac",70),
				new Tuple2<String,Integer>("gs",80),
				new Tuple2<String,Integer>("gs",90)
				);
		JavaPairRDD<String,Integer> pardd=sc.parallelizePairs(scores);
		JavaPairRDD<String,Iterable<Integer>> pardd1=pardd.groupByKey();
		JavaPairRDD<String,Integer> pardd2=
				pardd1.mapValues(f->{
			List<Integer> li=Lists.newArrayList(f);//迭代器转list
			
			Integer j=0;
			for(int i=0;i<li.size();i++) {
				if(li.get(i)>j) {
					j=li.get(i);
				}
				
			}
			return j;
		});
		pardd2.foreach(f->System.out.println(f));

	}

}

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐