我想运行这个简单的脚本:
from pyhive import hive
import sqlalchemy
from impala.dbapi import connect
import pandas as pd
def conn():
return connect(host='mid.impala.mycompany.com', port=21050, auth_mechanism='GSSAPI', use_ssl=True, kerberos_service_name='impala',ca_cert='/opt/cloudera/security/pki/SSrootCA.pem')
engine = sqlalchemy.create_engine('impala://', creator=conn)
pd.read_sql("SELECT * FROM giadb.a002_fnp_100 LIMIT 100", engine)
但我犯了一个错误:
TTransportException:TTtransportException(类型=1,消息=“无法连接到('mid.impala.mycompany.com',21050)”)
Impala服务是负载平衡的。所以我认为我必须以正确的方式设置连接字符串,但我需要一些帮助。
非常感谢。
詹卢卡