天天躁日日躁狠狠躁AV麻豆-天天躁人人躁人人躁狂躁-天天澡夜夜澡人人澡-天天影视香色欲综合网-国产成人女人在线视频观看-国产成人女人视频在线观看

基于HBase Thrift接口的一些使用問題及相關注意事項的詳解

HBase對于非Java語言提供了Thrift接口支持,這里結合對HBase Thrift接口(HBase版本為0.92.1)的使用經驗,總結其中遇到的一些問題及其相關注意事項。
1. 字節的存放順序
HBase中,由于row(row key和column family、column qualifier、time stamp)是按照字典序進行排序的,因此,對于short、int、long等類型的數據,通過Bytes.toBytes(…)轉換成byte數組后,必須按照大端模式(高字節在低地址,低字節在高地址)存放。對于value,也是同樣的道理。因此,在使用Thrift API(C++、phpPython等)方式時,最好對于row和value都統一按照大端進行pack和unpack處理。
舉個例子,C++中,對于int型變量,經過以下方式轉換為字典序:
復制代碼 代碼如下:
string key;
  int32_t timestamp = 1352563200;
  const char* pTs =(const char*) ×tamp;
  size_t n = sizeof(int32_t);
  key.append(pTs, n);

通過以下方式將字典序轉換為int:
復制代碼 代碼如下:
const char * ts = key.c_str();
int32_t timestamp = *((int32_t*)(ts));

php中則提供了pack和unpack方法進行轉換:
復制代碼 代碼如下:
  $key = pack("N", $num);
  $num = unpack("N", $key);

2. TScan的使用陷阱
HBase的php Thrift接口中,TScan可以直接通過設置startRow、stopRow、columns、filter等屬性,默認這些屬性均為null,設置后變為非null(通過TScan的構造函數或直接對TScan的成員變量進行賦值)。通過write()方法和Thrift Server進行RPC操作時,直接判斷的依據是這些屬性不為null,則通過Thrift協議傳輸到Thrift Server端。
但是在C++的Thrift接口中,TScan中有一個_TScan__isset __isset類型的變量,其內部結構如下:
復制代碼 代碼如下:
typedef struct _TScan__isset {
  _TScan__isset() : startRow(false), stopRow(false), timestamp(false), columns(false), caching(false), filterString(false) {}
  bool startRow;
  bool stopRow;
  bool timestamp;
  bool columns;
  bool caching;
  bool filterString;
} _TScan__isset;

TScan的write()方法則是通過判斷_TScan__isset下的各個bool變量標記是否設置了startRow、stopRow、columns、filter等屬性,決定是否將這些屬性通過Thrift協議傳輸到Thrift Server端,而這些屬性必須通過__set_xxx()方法進行設置才能生效!在TScan的默認構造函數中,并不會對這些屬性對應的__isset標記設置為true!
因此,如果直接通過TScan的構造函數初始化startRow、stopRow、columns、filter等屬性會導致從頭遍歷該表,只有調用了__set_xxx()方法才會將對應的bool標識設置為true,這樣服務端才會從Thrift Server獲取startRow、stopRow、columns、filter等屬性進行掃描。
3. 并發訪問線程數
首先,為了盡可能減少由于網絡傳輸帶來的時間開銷,HBase的Thrift Server最好和應用客戶端部署在同一臺機器上。Thrift Server啟動時可以通過參數配置并發線程數,否則很容易導致Thrift Server線程滿了不響應客戶端的讀寫請求,具體命令:bin/hbase-daemon.sh start thrift --threadpool -m 200 -w 500(更多參數參考這里:bin/hbase-daemon.sh start thrift -h)。
4. 最大堆內存配置
如果客戶端與Thrift Server進行scan操作順序讀取數據,而且設置了一定的cache記錄條數(通過TScan的int32_t caching變量設置),那么這些被caching的記錄數可能會占用Thrift Server相當部分的堆內存,尤其在多客戶端并發訪問時更明顯。
因此,在Thrift Server啟動前,可以調大最大堆內存,否則可能由于Java.lang.OutOfMemoryError異常而導致進程被殺掉,尤其是當Scan時設置了較大的caching記錄條數的情況(默認為export HBASE_HEAPSIZE=1000MB,可以在conf/hbase-env.sh中設置)。

php技術基于HBase Thrift接口的一些使用問題及相關注意事項的詳解,轉載需保留來源!

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。

主站蜘蛛池模板: 国产精人妻无码一区麻豆 | 久久免费观看视频 | 国产亚洲色婷婷久久精品99 | 久久er99热精品一区二区 | 色翁荡息又大又硬又粗又爽电影 | 国产精品久久久久久久久无码 | 男人吃奶摸下挵进去啪啪 | 日韩性大片 | 国产99久久久国产精品成人 | 美女脱得只剩皮肤 | 亚洲精品一区二区在线看片 | 神马电影院午夜神福利在线观看 | 国产精品免费视频能看 | 九九精品视频在线播放 | 性色AV一区二区三区咪爱四虎 | 轻点灬大ji巴太粗太双性高h | 小莹的性荡生活 | 天天看片视频免费观看 | 在线 日韩 欧美 国产 社区 | 精品久久久久中文字幕加勒比东京热 | 色综合伊人色综合网站中国 | av在线色| 国产露脸A片国语露对白 | 亚洲91av| 91久久偷偷做嫩草影院免费看 | 高清无码中文字幕在线观看视频 | 一二三四视频免费社区5 | 果冻传媒APP免费网站在线观看 | 动漫成人片 | 精品无码人妻一区二区免费AV | 和美女啪啪啪动态图 | 国产精品久久人妻无码网站一区L | 亚洲精品国产自在现线最新 | 国产成人一区二区三区在线观看 | 国产精品-区区久久久狼 | 国产一区私人高清影院 | 日韩亚洲中文欧美在线 | 榴莲黄版无限刷 | 精品含羞草免费视频观看 | xxxxx69hd杨幂| 挤奶门事件完整照片 |