發布成功
贊賞金額:
支付金額:5元
支付方式:
贊賞成功!
你的贊賞是對作者最大的肯定~?
云計算,名字在云端,卻是百度大腦最底層、最實體的部分,是IaaS(Infrastructure as a Service,基礎設施服務)。
百度大腦的超強計算能力就來源于這一層,是高性能計算硬件的集團軍。這個集團軍擁有數十萬臺服務器,并且采用先進的集群操作系統來統一管理,堪稱人工智能超級計算機。
為了深度學習訓練的需要,百度自主研發了GPU和FPGA(現場可編程門陳列)異構計算服務器,單機可擴展至64塊GPU/FPGA卡,對比傳統服務器密度提升16倍,一臺服務器即可完成千億數據模型訓練;百度開創性地研制了基于FPGA的人工智能處理器,提供10Tops的計算性能,相對主流的20核服務器,計算效率提升60倍,在人工智能和大數據應用上,可以達到普通服務器4~8倍的性能。
但百度的優勢不只是單臺機器的優秀,更在于優良的系統,優秀個體的集成形成強大的總體作戰能力。針對GPU集群的智能調度和資源管理系統,可以實現計算、存儲和網絡資源的池化管理和動態調度,計算集群整體效率和平均使用率達到80%。將異構硬件用于線上產品,用戶請求時延降至1/5,計算效率提升數十倍。
這個系統涵蓋了國內最大的GPU/FPGA集群(全新的芯片技術),最大的HADOOP/SPARK集群(全新的并發數據處理技術)和運營效率最高的數據中心[全新的異構計算技術、整機柜服務器技術、100G RDMA(遠程直接數據存取)通信技術和運維技術],可謂馬力十足,提供了開發人工智能所需的計算能力。
它同樣燃料充足。基于多年服務于大規模業務,比如通過搜索和視頻技術,百度積累了大量的數據:萬億級網頁數據,數十億次搜索數據,百億級視頻、圖像和語音數據,百億級定位數據等。數據就是人工智能算法的燃料,是發展人工智能的又一基礎條件。
讓硬件與燃料結合的是優秀的算法和模型。百度匯聚了全球頂級科學家和工程師,在理論和實踐方面持續創新,搭建了全球最大的深度神經網絡,支持萬億級參數、千億級樣本、千億級特征訓練,神經網絡層數遠遠突破100層。
硬件動力、數據燃料和算法靈魂的結合,才產生出百度的PaaS(Platform as a Service,平臺服務)。百度PaaS與眾不同之處在于,人工智能作為一種橫向的服務貫穿全平臺。通過深度學習和機器學習技術,結合超強計算、海量數據和優秀算法,在語音、圖像、自然語言處理等方面擁有杰出的能力,打造出獨特的知識圖譜、用戶畫像和商業邏輯,并且向用戶全面開放。用戶可以非常方便地使用各種算法模塊、開發工具、數據引擎為自身的商業目的服務。我們形象地把不同的平臺稱作天算、天像和天工,分別針對智能大數據、智能多媒體和智能物聯網這三個領域提供服務。
在最上層的SaaS(Software as a Service,軟件服務),百度的人工智能很容易凝結成許多垂直行業解決方案,滲透到各行各業。但我們更追求與合作伙伴一起打造智能產業生態,例如教育云、金融云、交通云、物流云等。我們認為,對智能產業生態的構建能力也是判定人工智能價值的重要標準。
在硬件、數據、算法之上還有一個重要的衡量標準,那就是人工智能企業的文化,即人工智能企業的“軟實力”。搜索技術是人工智能的先驅,也是最早的互聯網數字化世界的門戶,其開發流程和技術核心為未來的人工智能奠定了基礎。首先,搜索引擎必須與很大規模的數據打交道;其次,搜索引擎必須同時有大規模的機器學習,人工來做是不可能的事,因為數據規模太大了。
最后,也是最根本的一點,搜索引擎的開發流程和工程開發文化與人工智能系統的開發是非常吻合的,都以數據為主,通過抽取其中的特征、模式,然后用這個模式給用戶帶來價值。人們在搜索業務中結成的協作關系,形成的業務能力和工作習慣,都很適合人工智能業務發展,與海量數據一樣,積淀為人工智能企業的文化。所以陸奇在微軟的做法是,培養人才先從Bing開始。你做過Bing,你到其他什么部門都可以做,那些技術在搜索看來都是很簡單的技術。這個文化當然并不完美,但正如神經網絡一樣,可以在正確的方法指引下不斷發展完善。