當(dāng)全世界都建構(gòu)在數(shù)字化技術(shù)之上,運(yùn)維的重要性攀上了前所未有的高峰。
隨著物聯(lián)網(wǎng)的發(fā)展,預(yù)計(jì)到2030年全球聯(lián)網(wǎng)設(shè)備數(shù)量將從80億增長到2000億,甚至更多,這些設(shè)備都是數(shù)字化設(shè)備,承載著難以計(jì)數(shù)的數(shù)字化服務(wù)。以此為基礎(chǔ),全世界都將事實(shí)性的構(gòu)建在數(shù)字化設(shè)備,或者說數(shù)字化技術(shù)之上。
但這些設(shè)備并非完美,鑒于這些數(shù)字化設(shè)備,都是由人遵循一定的模式創(chuàng)造出來的,缺陷與不足都會天然存在于這些數(shù)字化設(shè)備之中,這其中最著名的代表就是“千年蟲”——一個因?yàn)槿嗽赑C設(shè)備的時(shí)鐘設(shè)計(jì)時(shí)發(fā)生疏漏,產(chǎn)生波及面極廣的數(shù)字化海嘯的典型案例。
于是,對于數(shù)字化時(shí)代來說,針對數(shù)字化設(shè)備進(jìn)行運(yùn)維,確保其能夠安全可靠高速的運(yùn)轉(zhuǎn),在盡可能長的時(shí)間內(nèi)平穩(wěn)運(yùn)行,充分發(fā)揮其基本能力效用,成為一個關(guān)鍵議題,并直接影響到企業(yè)業(yè)務(wù)的收益和成本。
從某種意義上來說,運(yùn)維的重要性攀上前所未有的高峰是數(shù)字化時(shí)代的必然,但在運(yùn)維的重要性攀上前所未有高峰的同時(shí),傳統(tǒng)運(yùn)維方式和運(yùn)維技術(shù)迅速失效:
一方面,數(shù)字化時(shí)代運(yùn)維所要面對的數(shù)字化設(shè)備數(shù)量和復(fù)雜度都呈現(xiàn)出快速增長的趨勢,運(yùn)維所要面對的問題更多、更復(fù)雜,運(yùn)維壓力也更大,傳統(tǒng)運(yùn)維無法消解壓力,只能將壓力直接傳遞給運(yùn)維團(tuán)隊(duì);
另一方面,企業(yè)在數(shù)字化時(shí)代的業(yè)務(wù)轉(zhuǎn)型和發(fā)展速度顯著加快,對數(shù)字化設(shè)備及時(shí)響應(yīng)能力的要求也更高,不僅如此,傳統(tǒng)運(yùn)維是以設(shè)備為導(dǎo)向而不是以數(shù)據(jù)為基礎(chǔ)、以業(yè)務(wù)需求為導(dǎo)向的,這意味著運(yùn)維與企業(yè)業(yè)務(wù)需求處在完全脫節(jié)的情形之下。
數(shù)字時(shí)代下,任何使用傳統(tǒng)運(yùn)維方式和運(yùn)維技術(shù)來管理機(jī)器數(shù)據(jù)的組織要么忽略了信息的價(jià)值,要么已經(jīng)讓他們的運(yùn)維團(tuán)隊(duì)不堪重負(fù)。
近年來,解決數(shù)字化時(shí)代運(yùn)維難題的思路逐漸聚焦:將開發(fā)和運(yùn)維這兩個領(lǐng)域相結(jié)合,通過自動化“軟件交付”和“架構(gòu)變更”的流程,來使構(gòu)建、測試、發(fā)布軟件能夠更加地快捷、頻繁和可靠,直至逐漸形成開發(fā)與運(yùn)維緊密結(jié)合的自動化運(yùn)維體系,這一體系更加強(qiáng)調(diào)從運(yùn)維流程、運(yùn)維手段等層面實(shí)現(xiàn)完全的自動化,在特定情況下,甚至實(shí)現(xiàn)無人干預(yù)。
這就是當(dāng)前主流的DevOps,但對于正在選擇DevOps的傳統(tǒng)企業(yè)來說,卻并不是所有的DevOps都能夠適應(yīng)以及支持傳統(tǒng)企業(yè)向互聯(lián)網(wǎng)+轉(zhuǎn)型的進(jìn)程,與此同時(shí),DevOps的邊界也在隨著數(shù)字化時(shí)代的深入而不多擴(kuò)展。
傳統(tǒng)DevOps與互聯(lián)網(wǎng)DevOps有什么區(qū)別?從某種程度上來說,DevOps的概念誕生于互聯(lián)網(wǎng)行業(yè)。
在互聯(lián)網(wǎng)企業(yè)中,將開發(fā)與運(yùn)維結(jié)合的最大好處,是可以將開發(fā)和運(yùn)維部門整合為一體,實(shí)現(xiàn)產(chǎn)品開發(fā)、測試、上線的快速迭代,以應(yīng)對互聯(lián)網(wǎng)行業(yè)快速變化的趨勢,不斷的快速滿足新興的客戶需求。
特別是在產(chǎn)品交付給運(yùn)維團(tuán)隊(duì)時(shí),由于在DevOps的過程中運(yùn)維團(tuán)隊(duì)有著深入?yún)⑴c,對產(chǎn)品的運(yùn)維建更有把握,可以在短期內(nèi)接手新產(chǎn)品的運(yùn)維工作。
但傳統(tǒng)企業(yè)在軟件發(fā)布模式和企業(yè)組織結(jié)構(gòu)上,與互聯(lián)網(wǎng)企業(yè)存在著較大的差別,即使近年來企業(yè)數(shù)字化轉(zhuǎn)型和“以互聯(lián)網(wǎng)思維優(yōu)化傳統(tǒng)企業(yè)”正在許多傳統(tǒng)企業(yè)中得到實(shí)踐,照搬互聯(lián)網(wǎng)企業(yè)的DevOps不是可取的解決方案,與此同時(shí),傳統(tǒng)企業(yè)軟件發(fā)布的模式面臨的挑戰(zhàn)也與互聯(lián)網(wǎng)企業(yè)不同,主要包括:
為保證產(chǎn)品質(zhì)量而設(shè)定的過長的開發(fā)測試流程與快速迭代交付的迫切業(yè)務(wù)需求之間的矛盾;
大量手工操作與企業(yè)對于產(chǎn)品質(zhì)量一致性、穩(wěn)定性嚴(yán)苛要求之間的矛盾;
開發(fā)團(tuán)隊(duì)對于流程簡單性、快速性的現(xiàn)實(shí)要求與風(fēng)險(xiǎn)管控之間的矛盾。
不僅如此,傳統(tǒng)企業(yè)對DevOps的核心訴求也并非是“開發(fā)與運(yùn)維的融合”:在傳統(tǒng)企業(yè)中,團(tuán)隊(duì)權(quán)責(zé)劃分有清晰地邊界,而并非融合型的跨職能型組織,因此DevOps所帶來的融合并非第一要務(wù),“創(chuàng)新”或者說是“借助DevOps實(shí)現(xiàn)業(yè)務(wù)上線流程的不斷演進(jìn)”,才是傳統(tǒng)企業(yè)的主要關(guān)注點(diǎn)。
因此,在技術(shù)上,傳統(tǒng)企業(yè)更希望借助DevOps整合現(xiàn)有工具平臺,打通業(yè)務(wù)交付的端到端流水線;在架構(gòu)上,通過DevOps建構(gòu)融合效率與穩(wěn)定需求的精益管理;在流程上,實(shí)現(xiàn)人員架構(gòu)與業(yè)務(wù)發(fā)布標(biāo)準(zhǔn)流程的不斷優(yōu)化。
基于以上對傳統(tǒng)企業(yè)DevOps的深入認(rèn)知,睿至大數(shù)據(jù)建立了一整套面向傳統(tǒng)企業(yè)的DevOps落地規(guī)劃,其中明確指出:應(yīng)當(dāng)在傳統(tǒng)企業(yè)中構(gòu)建端到端的DevOps能力,通過DevOps中各類角色的能力融合、能力傳遞,減少流程環(huán)節(jié)的浪費(fèi),幫助傳統(tǒng)企業(yè)提高效率。具體來說,睿至大數(shù)據(jù)在傳統(tǒng)企業(yè)中構(gòu)建DevOps遵循三條需求定律:
該平臺一定要與企業(yè)目前所具備的基礎(chǔ)設(shè)施相結(jié)合,而不能像一些初創(chuàng)企業(yè),馬上就對整個基礎(chǔ)環(huán)境及設(shè)施進(jìn)行更新;
該平臺一定要考慮到企業(yè) IT 組織目前的組織結(jié)構(gòu)現(xiàn)狀、人才技能現(xiàn)狀以及存量產(chǎn)品特點(diǎn);
該平臺一定要與企業(yè)目前已有的流程控制系統(tǒng)相結(jié)合,而不能獨(dú)立于現(xiàn)有的流程控制系統(tǒng)。
在這樣的DevOps平臺構(gòu)建思路下,睿至大數(shù)據(jù)將幫助傳統(tǒng)企業(yè)構(gòu)建DevOps流水線工具平臺層:該工具平臺對上通過流水線引擎與現(xiàn)有的流程管理系統(tǒng)對接,對中整合現(xiàn)有的各種開發(fā)測試部署工具,對下則采集并分析存量硬件和云平臺的基礎(chǔ)設(shè)施監(jiān)控?cái)?shù)據(jù)并分析反饋。同時(shí),睿至大數(shù)據(jù)還為傳統(tǒng)企業(yè)提供統(tǒng)一資源管理平臺基礎(chǔ)。
睿至大數(shù)據(jù)為傳統(tǒng)企業(yè)建立的DevOps流水線工具平臺,既可以幫助傳統(tǒng)企業(yè)建立持續(xù)的集成體系,實(shí)現(xiàn)交付過程的標(biāo)準(zhǔn)化與透明化,也可以透明化應(yīng)用交易過程,實(shí)現(xiàn)端到端的應(yīng)用性能管理,同時(shí),以此為基礎(chǔ)企業(yè)能夠構(gòu)建起立體化監(jiān)控體系,實(shí)現(xiàn)運(yùn)行狀態(tài)的可視化及深度性能分析,或幫助傳統(tǒng)企業(yè)整合利用現(xiàn)有運(yùn)維數(shù)據(jù),進(jìn)行運(yùn)維大數(shù)據(jù)分析。
睿至大數(shù)據(jù)認(rèn)為:目前傳統(tǒng)企業(yè)所面臨的挑戰(zhàn)既有技術(shù)層面上的,也有開發(fā)模式以及流程管理上的,試圖采用單一的方法進(jìn)行應(yīng)對無法奏效,也無法一蹴而就進(jìn)行解決。
因此,在幫助企業(yè)客戶構(gòu)建DevOps時(shí),睿至大數(shù)據(jù)制定了詳細(xì)的適合企業(yè)自身的落地路線圖,分為“技術(shù)改造-架構(gòu)優(yōu)化-流程優(yōu)化”三大階段,不僅幫助企業(yè)客戶消除大量的手工操作,構(gòu)建持續(xù)交付的流水線平臺,而且能夠?qū)鹘y(tǒng)企業(yè)的開發(fā)模式、產(chǎn)品架構(gòu)乃至整體開發(fā)測試發(fā)布流程實(shí)現(xiàn)優(yōu)化。
但DevOps還不是“終局”,自動化運(yùn)維確實(shí)帶來了很大的進(jìn)步,但是它只能100%的按照人類制定的指令和流程運(yùn)行,無法自主適應(yīng),甚至不能處理與舊問題非常相似的“新問題”,這就需要將以人工智能為代表的新一代信息技術(shù)運(yùn)用到運(yùn)維這一領(lǐng)域,在以數(shù)據(jù)化為導(dǎo)向、自動化為基礎(chǔ),結(jié)合AI實(shí)現(xiàn)運(yùn)維的智能化,這就是最近一段時(shí)間火熱的AIOps。
現(xiàn)階段AIOps的發(fā)展:重在落地
據(jù)Gartner預(yù)測,至2020年,將近50%的企業(yè)會在業(yè)務(wù)和IT運(yùn)維方面采用AIOps,這一比例遠(yuǎn)遠(yuǎn)高于今天的10%,AIOps將會在未來2、3年中進(jìn)入高速發(fā)展階段。
就概念來說,AIOps并不是一個全新的概念,而是IT運(yùn)營分析和管理(ITOA/ITOM)體系與大數(shù)據(jù)和人工智能技術(shù)結(jié)合的產(chǎn)物。
AIOps智能運(yùn)維以ITOA/ITOM系統(tǒng)所采集的運(yùn)維大數(shù)據(jù)為基礎(chǔ),利用人工智能和機(jī)器學(xué)習(xí)算法對運(yùn)維數(shù)據(jù)進(jìn)行深入分析,涵蓋IT監(jiān)控,應(yīng)用性能管理、外網(wǎng)監(jiān)控、日志分析,系統(tǒng)安全等方面。
就能力而言,AIOps智能運(yùn)維平臺能夠接入不同業(yè)務(wù)系統(tǒng)、監(jiān)控系統(tǒng)、管理系統(tǒng)的海量IT數(shù)據(jù),并運(yùn)用各種算法進(jìn)行高速分析、學(xué)習(xí)甚至預(yù)測。
立足于AIOps,IT部門可以獲得強(qiáng)大的自動化IT決策和運(yùn)營管理能力,并能對業(yè)務(wù)質(zhì)量和用戶體驗(yàn)進(jìn)行準(zhǔn)確檢測和持續(xù)優(yōu)化。
但理想與現(xiàn)實(shí)之間往往存在著一定的差距,目前階段的AIOps可以理解為:通過深度整合IT數(shù)據(jù)資源與運(yùn)維的實(shí)際場景進(jìn)行深度集成的,同時(shí)結(jié)合了大數(shù)據(jù)以及機(jī)器學(xué)習(xí)技術(shù),以多種維度和分析場景為展現(xiàn)的智能輔助分析平臺。
當(dāng)前階段的AIOps平臺主要適用于中大型客戶,并需要構(gòu)建者在行業(yè)領(lǐng)域相關(guān)知識、對應(yīng)行業(yè)運(yùn)維場景知識和機(jī)器學(xué)習(xí)相關(guān)知識上具有一定的儲備。
睿至大數(shù)據(jù)基于上述對AIOps現(xiàn)階段情況的理解,設(shè)計(jì)并構(gòu)建了睿至大數(shù)據(jù)AIOps平臺整體方案。
睿至大數(shù)據(jù)AIOps平臺整體方案以對國內(nèi)外各種數(shù)據(jù)源標(biāo)準(zhǔn)化支持為基礎(chǔ),構(gòu)建包括運(yùn)維知識圖譜、實(shí)時(shí)分析庫、短期匯總庫和長期匯總庫在內(nèi)的數(shù)據(jù)匯聚層,同時(shí)借助機(jī)器學(xué)習(xí)算法為智能運(yùn)維門戶提供在不同場景下的落地功能,在故障準(zhǔn)確定位、系統(tǒng)隱患發(fā)現(xiàn)、趨勢預(yù)測分析以及業(yè)務(wù)創(chuàng)新分析方面具有較強(qiáng)的競爭實(shí)力,睿至大數(shù)據(jù)將企業(yè)AIOps的建設(shè)階段分為四個:
第一階段是數(shù)據(jù)治理、標(biāo)準(zhǔn)化以及統(tǒng)一存儲;
第二階段是可視化界面和多維度統(tǒng)計(jì)分析;
第三階段是對接算法和模型,進(jìn)行簡單的異常診斷;
第四階段則進(jìn)如深度集成多種算法和機(jī)器學(xué)習(xí)結(jié)果,以統(tǒng)一場景進(jìn)行分析和展現(xiàn)的階段。
在每個階段中,睿至大數(shù)據(jù)AIOps的建設(shè)核心都是“落地”。比如說在數(shù)據(jù)治理、標(biāo)準(zhǔn)化以及統(tǒng)一存儲的第一階段,睿至大數(shù)據(jù)AIOps在建設(shè)過程中明確提出兩個盡早明確:
數(shù)據(jù)抽取范圍和對應(yīng)數(shù)據(jù)的抽取方案盡早明確;
各類數(shù)據(jù)抽取到平臺的數(shù)據(jù)標(biāo)準(zhǔn)格式要盡早明確。
結(jié)合考慮后續(xù)應(yīng)用場景的數(shù)據(jù)存儲服務(wù),在第一階段完成后,企業(yè)客戶切切實(shí)實(shí)的能夠?qū)崿F(xiàn)基礎(chǔ)的數(shù)據(jù)治理、標(biāo)準(zhǔn)化和統(tǒng)一存儲架構(gòu)。
完成睿至大數(shù)據(jù)AIOps的構(gòu)建,企業(yè)客戶可以實(shí)現(xiàn)基于機(jī)器學(xué)習(xí)的多指標(biāo)關(guān)聯(lián)分析,并構(gòu)建基于業(yè)務(wù)拓?fù)涞母櫼晥D以及業(yè)務(wù)畫像和故障診斷視圖,相比傳統(tǒng)運(yùn)維,分析和展現(xiàn)的結(jié)果對現(xiàn)實(shí)運(yùn)維更有輔助指導(dǎo)意義,并且為實(shí)現(xiàn)理想中的AIOps智能化運(yùn)維打下良好的基礎(chǔ)。
- 英偉達(dá)驅(qū)動黑屏門:Win10/11用戶警惕!572.83驅(qū)動帶來新風(fēng)險(xiǎn)
- Meta Llama 4 AI大語言模型本月面世,改進(jìn)推理能力仍需加強(qiáng)
- 滴滴外賣在巴西重啟業(yè)務(wù):70萬騎手助力,外賣市場能否再掀波瀾?
- AI代碼生成:2030年,95%的代碼將由AI生成,程序員何去何從?
- SpaceX載人繞飛任務(wù)圓滿結(jié)束,機(jī)組安全返回地球,揭開宇宙新篇章
- TikTok風(fēng)波再起!特朗普發(fā)聲,字節(jié)跳動回應(yīng),利益之爭引發(fā)全球關(guān)注
- 比亞迪整合五大子品牌為APP,打造一站式車主服務(wù)平臺,體驗(yàn)升級中!
- 谷歌預(yù)警:警惕AI安全風(fēng)險(xiǎn),公開防御藍(lán)圖
- 比亞迪起訴自媒體“智能EVO”:維權(quán)行動揭開名譽(yù)侵權(quán)黑幕
- 小米紙?jiān)鍿U7專利爆光,網(wǎng)友笑稱清明節(jié)新爆款
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。