如何解决Py4JJavaError:使用 PySpark 从 SQL Server 加载数据库
我正在尝试使用 PySpark 连接和读取两个 sql Server 数据库,每个数据库具有不同的服务器名称和端口号。我尝试了很多解决方案,但两个数据库都出现相同的错误。
我使用不同主机名、数据库名、端口号、用户名和密码的两台服务器的代码:
jdbcHostname = "XXXXXXXXX"
jdbcDatabase = "XXXX"
jdbcPort = "XXXX"
username = "XXXXXX"
password = "XXXXXXXXXX"
jdbcUrl = "jdbc:sqlserver://{0}:{1};database={2}".format(jdbcHostname,jdbcPort,jdbcDatabase)
connection_details = {
"user" : username,"password" : password,"driver" : "com.microsoft.sqlserver.jdbc.sqlServerDriver"
}
query = """(Select * from [jdbcDatabase].[schema].[tablename])"""
df = spark.read.jdbc(url=jdbcUrl,table=query,properties=connection_details)
我得到的错误如下:
它要求我验证连接属性。
请注意,我能够使用脚本所在的同一设备通过 Microsoft sql Server Management Studio 成功运行 sql 查询。
有什么帮助吗?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。