天天躁日日躁狠狠躁AV麻豆-天天躁人人躁人人躁狂躁-天天澡夜夜澡人人澡-天天影视香色欲综合网-国产成人女人在线视频观看-国产成人女人视频在线观看

SQL到NOSQL的思維轉變

  NOSQL系統一般都會宣傳一個特性,那就是性能好,然后為什么呢?關系型數據庫發展了這么多年,各種優化工作已經做得很深了,NOSQL系統一般都是吸收關系型數據庫的技術,那么,到底是什么因素束縛了關系型數據庫的性能呢?我們從系統設計的角度看這個問題。

  1. 索引支持

  關系型數據庫創立之初沒有想到今天的互聯網應用對可擴展性提出如此高的要求,因此,設計時主要考慮的是簡化用戶的工作,SQL語言的產生促成數據庫接口的標準化,從而形成了Oracle這樣的數據庫公司并帶動了上下游產業鏈的發展。關系型數據庫在單機存儲引擎支持索引,比如Mysql的Innodb存儲引擎需要支持索引,而NOSQL系統的單機存儲引擎是純粹的,只需要支持基于主鍵的隨機讀取和范圍查詢。NOSQL系統在系統層面提供對索引的支持,比如有一個用戶表,主鍵為user_id,每個用戶有很多屬性,包括用戶名,照片ID(photo_id),照片URL,在NOSQL系統中如果需要對photo_id建立索引,可以維護一張分布式表,表的主鍵為<photo_id, user_id>形成的二元組。關系型數據庫由于需要在單機存儲引擎層面支持索引,大大降低了系統的可擴展性,使得單機存儲引擎的設計變得很復雜。

  2. 事務并發處理

  關系型數據庫有一整套的關于事務并發處理的理論,比如鎖的粒度是表級,頁級還是行級,多版本并發控制機制MVCC,事務的隔離級別,死鎖檢測,回滾,等等。然而,互聯網應用大多數的特點都是多讀少些,比如讀和寫的比例是10 : 1,并且很少有復雜事務需求,因此,一般可以采用更為簡單的copy-on-write技術:單線程寫,多線程讀,寫的時候執行copy-on-write,寫不影響讀服務。NOSQL系統這樣的假設簡化了系統的設計,減少了很多操作的overhead,提高了性能。

  3. 動態還是靜態的數據結構

  關系型數據庫的存儲引擎總是一顆磁盤B+樹,為了提高性能,可能需要有insert buffer聚合寫,query cache緩存讀,經常需要實現類似Linux page cache的緩存管理機制。數據庫中的讀和寫是互相影響的,寫操作也因為時不時需要將數據flush到磁盤而性能不高。簡而言之,關系型數據庫存儲引擎的數據結構是通用的動態更新的B+樹。然而,在NOSQL系統中,比如Bigtable中采用SSTable + MemTable的數據結構,數據先寫入到內存的MemTable,達到一定大小或者超過一定時間才會dump到磁盤生成SSTable文件,SSTable是只讀的。如果說關系型數據庫存儲引擎的數據結構是一顆動態的B+樹,那么SSTable就是一個排好序的有序數組。很明顯,實現一個有序數據比實現一個動態B+樹且包含復雜的并發控制機制要簡單高效地多。

  4. Join操作

  關系型數據庫需要在存儲引擎層面支持Join,而NOSQL系統一般根據應用來決定Join實現的方式。舉個例子,有兩張表:用戶表和商品表,每個用戶下可能有若干個商品,用戶表的主鍵為<user_id, item_id>,用戶和商品的關聯屬性存放在用戶表中,商品表的主鍵為item_id,商品屬性包括商品名,商品URL,等等。假設應用需要查詢一個用戶的所有商品并顯示商品的詳細信息,普通的做法是先從用戶表查找指定用戶的所有item_id,然后對每個item_id去商品表查詢詳細信息,即執行一次數據庫Join操作,這必然帶來了很多的磁盤隨機讀,并且由于Join帶來的隨機讀的局部性不好,緩存的效果往往也是有限的。在NOSQL系統中,我們往往可以將用戶表和商品表集成到一張寬表中,這樣雖然冗余存儲了商品的詳細信息,卻換來了查詢的高效。

  關系型數據庫的性能瓶頸往往不在SQL語句解析上,而是在于需要支持完備的SQL特性。互聯網公司面臨的問題是應用對性能和可擴展性要求很高,并且DBA和開發工程師水平比較高,可以通過犧牲一些接口友好性來換取更好的性能。NOSQL系統的一些設計,比如通過寬表實現Join操作,互聯網公司的DBA和開發工程師也做過,NOSQL系統只是加強了這種約束。從長遠來看,可以總結一套約束集合,并且定義一個SQL子集,只需要支持這個SQL子集就可以在不犧牲可擴展性的前提下支持比如90%以上的互聯網應用。我想,NOSQL技術發展到這一步的時候就算是比較成熟了,這也是我們最終想做的事情。我們在設計和使用NOSQL系統的時候也可以適當轉化一下思維,如下:

  1) 更大的數據量。很多人在使用Mysql的過程遇到記錄條數超過一定值,比如2000W的時候,數據庫性能開始下降,這個值的得出往往需要經過大量的測試。然而,大多數的NOSQL系統可擴展性都比較好,能夠支持更大的數據量,因此也可以采用一些空間換時間的做法,比如通過寬表的方式實現Join。

  2) 性能預估更加容易。關系型數據庫由于復雜的并發控制,insert buffer及類似page cache的讀寫優化機制,性能估算相對較難,很多時候需要憑借經驗或者經過測試才能得出系統的性能。然后,NOSQL系統由于存儲引擎實現,并發控制機制等相對簡單,可以通過硬件的性能指標在系統設計之處大致預估系統的性能,性能預估可操作性相對更強。

it知識庫SQL到NOSQL的思維轉變,轉載需保留來源!

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。

主站蜘蛛池模板: 蝴蝶中文综合娱乐网2 | 牲高潮99爽久久久久777 | 黄图gif揉胸吸奶 | 中文字幕完整高清版 | 王小军怎么了最新消息 | 四房播播开心色播 | 色精品极品国产在线视频 | 亚洲国产区中文在线观看 | adc年龄确认大驾光临入口 | 日本又黄又爽又色又刺激的视频 | 早乙女由依在线观看 | 国产精人妻无码一区麻豆 | 黄色亚洲片| 蜜芽国产在线精品欧美 | 嫩草伊人久久精品少妇AV网站 | 涩涩游戏盒| 无码人妻视频又大又粗欧美 | 国产在线视频在线观看 | 冈本视频黄页正版 | 国产一卡 二卡三卡四卡无卡乱码视频 | 久久久欧美国产精品人妻噜噜 | 中文字幕国产在线观看 | 91精品国产91 | 男女高潮又爽又黄又无遮挡 | 亚洲黄色在线 | 欧美性受xxxx狂喷水 | 国产欧美精品一区二区三区-老狼 | 亚洲精品不卡视频 | 久久热r在线视频精品 | 欧美黑人巨大videos免费 | 丰满五十六十老熟女HD60 | 九九热久久只有精品2 | 韩国伦理电影在线神马网 | 美女岔开腿露出粉嫩花苞 | 啪啪激情婷婷久久婷婷色五月 | 沟沟人体一区二区 | 校园全肉高h湿一女多男 | 国产1广场舞丰满老女偷 | 五月丁香婷姐色 | 日韩人妻双飞无码精品久久 | 久久99视热频国只有精品 |