社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  Python

当Impala处于负载平衡状态时,无法通过Python脚本运行Impala查询

Gianluca • 2 年前 • 258 次点击  

我想运行这个简单的脚本:


from pyhive import hive
import sqlalchemy
from impala.dbapi import connect
import pandas as pd


def conn():
    return connect(host='mid.impala.mycompany.com', port=21050, auth_mechanism='GSSAPI',  use_ssl=True,  kerberos_service_name='impala',ca_cert='/opt/cloudera/security/pki/SSrootCA.pem')

engine = sqlalchemy.create_engine('impala://', creator=conn)
pd.read_sql("SELECT * FROM giadb.a002_fnp_100 LIMIT 100", engine)

但我犯了一个错误:

TTransportException:TTtransportException(类型=1,消息=“无法连接到('mid.impala.mycompany.com',21050)”)

Impala服务是负载平衡的。所以我认为我必须以正确的方式设置连接字符串,但我需要一些帮助。 非常感谢。

詹卢卡

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/159632