亚洲精品久久久中文字幕-亚洲精品久久片久久-亚洲精品久久青草-亚洲精品久久婷婷爱久久婷婷-亚洲精品久久午夜香蕉

您的位置:首頁(yè)技術(shù)文章
文章詳情頁(yè)

使用python客戶端訪問(wèn)impala的操作方式

瀏覽:65日期:2022-07-31 18:16:25

因需要將impala僅僅作為數(shù)據(jù)源使用,而python有較好的數(shù)據(jù)分析函數(shù),所以需要使用python客戶端來(lái)獲取impala中的表數(shù)據(jù),這里的測(cè)試環(huán)境是:

操作系統(tǒng):win7 (linux下也可行)

python 2.7

大數(shù)據(jù)環(huán)境:centos6.6

CDH版本:CDH5.4.1

impala 2.1.2 port:21050

1、安裝Python package

pip install impyla

2、python客戶端與impala交互

2.1 連接impala

>>> from impala.dbapi import connect>>> conn = connect(host=’my.impala.host’, port=21050)>>> cur = conn.cursor()

注意:這里要確保端口設(shè)置為HS2服務(wù),而不是Beeswax服務(wù)。在Cloudera的管理集群中,HS2的默認(rèn)端口是21050。 (Beeswax默認(rèn)端口21000)

2.2 對(duì)impala執(zhí)行SQL查詢

>>> cur.execute(’SHOW TABLES’)>>> cur.fetchall()[(’defect_code_dim’,), (’gxzl_ca_materialinfo’,), (’gxzl_cg_materialinfo’,), (’gxzl_defect2’,), (’gxzl_defects’,), (’gxzl_defects_hd’,), (’gxzl_fx_class’,), (’gxzl_fx_leftmidright’,), (’gxzl_fx_topandbot’,), (’gxzl_jiejing_2cc_slab’,), (’gxzl_kgx_drw’,), (’gxzl_kgx_drw_tmp’,), (’gxzl_rz_materialinfo’,), (’gxzl_sdbase_defects’,), (’gxzl_test’,), (’new_table’,), (’ouye_transactionlog’,), (’ouye_userinfo’,), (’simple_test’,), (’t0’,), (’t_100m_hdfs’,), (’t_100m_test’,), (’t_10m_hdfs’,), (’target1’,), (’target2’,), (’target3’,), (’test’,), (’tianchi_mobile_recommend_train_full’,), (’tianchi_mobile_recommend_train_item’,), (’tianchi_mobile_recommend_train_user’,), (’tianchi_mobile_recommend_train_useritem’,)]>>> cur.execute(’SELECT * FROM test’)>>> cur.description[(’id’, ’DOUBLE’, None, None, None, None, None), (’name’, ’STRING’, None, None, None, None, None), (’value’, ’STRING’, None, None, None, None, None)]>>> cur.fetchall()[(1.0, ’tom’, ’f’), (2.0, ’jerry’, ’t’)]>>>

注意:從服務(wù)器上獲取數(shù)據(jù)會(huì)刪除緩存,所以第二個(gè).fetchall()返回一個(gè)空列表。

>>> cur.fetchall()[(1.0, ’tom’, ’f’), (2.0, ’jerry’, ’t’)]>>> cur.fetchall()[]>>>

2.3 遍歷查詢結(jié)果

>>> cur.execute(’SELECT * FROM test’)>>> for row in cur: print row[1] == 1.0FalseFalse

注:python的角標(biāo)是以0開(kāi)始。以上仍是以緩存方式來(lái)獲取數(shù)據(jù)。

如果你的數(shù)據(jù)集較小可以使用這種方式;如果你需要存儲(chǔ)大量的數(shù)據(jù)集,你可以用CREATE TABLE AS SELECT語(yǔ)句把它寫(xiě)入HDFS。

2.4 將查詢結(jié)果轉(zhuǎn)化為python中的pandas DataFrames

除了遍歷結(jié)果以外,還可以把結(jié)果轉(zhuǎn)化成pandas的數(shù)據(jù)框?qū)ο螅员氵M(jìn)行數(shù)據(jù)分析:

>>> from impala.dbapi import connect>>> conn = connect(host=’my.impala.host’, port=21050)>>> cur = conn.cursor()>>> from impala.util import as_pandas>>> cur.execute(’SELECT * FROM test’)>>> df = as_pandas(cur)>>> type(df)<class ’pandas.core.frame.DataFrame’>>>> df id name value0 1 tom f1 2 jerry t>>>

注:前提是python中安裝了pandas,使用pip install pandas在線安裝,安裝過(guò)程中可能會(huì)提示:Microsoft Visual C++ 9.0 is required (Unable to find vcvarsall.bat). Get it from http://aka.ms/vcpython27

只要按照提示說(shuō)的的去下載一個(gè)VC就可以了。這樣就安裝好了pandas。

以上這篇使用python客戶端訪問(wèn)impala的操作方式就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持好吧啦網(wǎng)。

標(biāo)簽: Python 編程
相關(guān)文章:
主站蜘蛛池模板: 在线播放一区二区三区 | 五月综合激情久久婷婷 | 性色生活片 | 欧美在线性 | 日本一级毛片片在线播放 | 日日夜夜噜 | 国产精品久久久亚洲第一牛牛 | 亚洲一区二区三区高清视频 | 亚洲欧美视频网站 | 一起色色| 国产精品国产精品 | 特级毛片s级全部免费 | mm在线 | 国产精品久久久一区二区三区 | 大桥未久日韩欧美亚洲国产 | 成人在线免费视频播放 | 国内自拍视频在线播放 | 国产精品情人露脸在线观看 | 欧美日韩亚洲一区二区精品 | 伊人影院视频 | 日韩精品无码一区二区三区 | 98国产精品永久在线观看 | 91精品国产福利尤物 | 韩国xxxxxxxx69| 欧洲免费极品videos | 国产成人午夜福在线观看 | 国产福利一区二区三区四区 | 亚洲高清在线观看看片 | 日本一级毛片视频 | 中文字幕亚洲精品日韩精品 | 真实一级一级一片免费视频 | 亚洲视频重口味 | 亚洲九九精品 | 欧美高清不卡视频 | 久久久免费的精品 | 污黄视频在线观看 | 毛片精品| 久久精品亚洲 | 成人深夜视频 | 极品销魂一区二区三区 | 亚洲欧洲日韩国产aa色大片 |