伊人99re_av日韩成人_91高潮精品免费porn_色狠狠色婷婷丁香五月_免费看的av_91亚色网站

中培偉業IT資訊頻道
您現在的位置:首頁 > IT資訊 > 大數據 > 使用Spark常見的一些問題

使用Spark常見的一些問題

2016-08-11 10:02:09 | 來源:中培企業IT培訓網

任何新技術的引入都會歷經陌生到熟悉,從最初新技術帶來的驚喜,到后來遇到困難時的一籌莫展和惆悵,再到問題解決后的愉悅,大數據新貴Spark同樣不能免俗。大數據Hadoop與Spark架構應用實戰》專家鐘老師介紹了Spark過程中常見的一些問題

問題一:跑很大的數據集的時候,會遇到org.apache.spark.SparkException: Error communicating with MapOutputTracker

這個錯誤報得很隱晦,從錯誤日志看,是Spark集群partition了,但如果觀察物理機器的運行情況,會發現磁盤I/O非常高。進一步分析會發現原因是Spark在處理大數據集時的shuffle過程中生成了太多的臨時文件,造成了操作系統磁盤I/O負載過大。找到原因后,解決起來就很簡單了,設置spark.shuffle.consolidateFiles為true。這個參數在默認的設置中是false的,對于linux的ext4文件系統,建議大家還是默認設置為true吧。Spark官方文檔的描述也建議ext4文件系統設置為true來提高性能。

問題二:運行時報Fetch failure錯

在大數據集上,運行Spark程序,在很多情況下會遇到Fetch failure的錯。由于Spark本身設計是容錯的,大部分的Fetch failure會經過重試后通過,因此整個Spark任務會正常跑完,不過由于重試的影響,執行時間會顯著增長。造成Fetch failure的根本原因則不盡相同。從錯誤本身看,是由于任務不能從遠程的節點讀取shuffle的數據,具體原因則需要利用:    

查看Spark的運行日志,從而找到造成Fetch failure的根本原因。其中大部分的問題都可以通過合理的參數配置以及對程序進行優化來解決。2014年Spark Summit China上陳超的那個專題,對于如何對Spark性能進行優化,有非常好的建議。

當然,在使用Spark過程中還遇到過其他不同的問題,不過由于Spark本身是開源的,通過源代碼的閱讀,以及借助開源社區的幫助,大部分問題都可以順利解決。

鐘老師最后總結道,Spark目前已經取得了長足的發展,圍繞Spark的大數據生態系統也逐漸的完善。Spark 1.3引入了一個新的DataFrame API,這個新的DataFrame API將會使得Spark對于數據的處理更加友好。同樣出自于AMPLab的分布式緩存系統Tachyon因為其與Spark的良好集成也逐漸引起了人們的注意。鑒于在業務場景中,很多基礎數據是需要被多個不同的Spark任務重復使用,下一步,我們將會在架構中引入Tachyon來作為緩存層。另外,隨著SSD的日益普及,我們后續的計劃是在集群中每臺機器都引入SSD存儲,配置Sparkshuffle的輸出到SSD,利用SSD的高速隨機讀寫能力,進一步提高大數據處理效率。

在機器學習方面,H2O機器學習引擎也和Spark有了良好的集成從而產生了Sparkling-water。相信利用Sparking-water,作為一家創業公司,我們也可以利用深度學習的力量來進一步挖掘數據的價值。

標簽: Spark
主站蜘蛛池模板: 人妖在线视频 | 国产精品自产拍高潮在线观看 | 国产深夜男女无套内射 | 亚洲欧美精品一区二区 | 99视频精品免费观看 | 奇米网8888 | 午夜影院120 | 久久aa | 国产成人av一区二区三区在线 | 亚洲精品国男人在线视频 | 欧美日韩福利视频 | 免费无码又爽又刺激激情视频 | 丝袜人妻无码专区视频 | 国产一级爱c视频 | 久久精品国产亚洲AV未满十八 | 国产精品久久久久网站 | 91校长国产在线观看 | 蜜臀久久蜜臀av国内精品久久久 | 91欧美视频在线观看 | 把少妇弄高潮了www 少妇和子乱视频 | 网友自拍区视频精品 | 欧美日韩国产在线一区 | 国产亚洲精品久久久久久禁果tv | 成人h动漫精品一区二区樱花 | 国产卡一卡二卡三高清 | 日本一区二区三区四区在线观看 | 一区二区三区免费观看 | 天天综合天天色 | 精品中文字幕在线2019 | 精品国免费一区二区三区 | 欧美午夜在线精品品 | 亚洲国产中文无线乱码在线观看 | av女优天堂在线观看 | 性欧美久久 | 欧美大肥婆大肥BBBBB | 男插女高潮一区二区 | 国产高清自拍视频 | 热RE99久久精品国产66热 | 日本在线看片免费人成视1000 | 国产精品香蕉人多人在线观看 | 亚洲三区四区 |