微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Spark Streaming输出模式“内存”不显示任何记录

如何解决Spark Streaming输出模式“内存”不显示任何记录

我正在VS Code编辑器中运行Spark Streaming代码,并且正在使用内存作为数据接收器,并且输出模式已完成。

当我尝试从内存表中查看结果时,显示输出

任何帮助将不胜感激

import sys
import findspark
findspark.init()
from pyspark.sql import SparkSession
from pyspark.sql.functions import explode
from pyspark.sql.functions import split
from pyspark.sql.types import *

sparkSession = SparkSession.builder.master('local').appName('Max_Stock in complete mode').getorCreate()

sparkSession.sparkContext.setLogLevel('ERROR')

schema = StructType([StructField('Date',StringType(),True),StructField('Open',StructField('High',DoubleType(),StructField('Low',StructField('Close',StructField('Adjusted Close',StructField('Volume',StructField('Name',True)
                    ])

input_stream = """path"""
stockPricesDf = sparkSession.readStream.option('header','true').schema(schema).csv(input_stream)
print(' ')
print('Is the stream ready?')
print(stockPricesDf.isstreaming)


print(' ')
print('Schema of the input stream')
print(stockPricesDf.printSchema())

upDaysDf = stockPricesDf.select("Name","Date","High","Open","Close").where("Open > Close") 
upDays_max = upDaysDf.groupBy('Name').max('High')               

query = upDays_max.writeStream.outputMode('complete').format('memory').queryName('datatable')\
            .option('truncate','false') \
            .option('numRows',5) \
            .start() \
            .awaitTermination()
SparkSession.sql("select * from datatable ").show(5)

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。