IT運(yùn)維監(jiān)控具有性能穩(wěn)定、用戶界面友好、跨平臺(tái)、易實(shí)施、易集成等特點(diǎn),可極大地簡(jiǎn)化IT設(shè)施和業(yè)務(wù)系統(tǒng)的監(jiān)控管理。越來(lái)越多的客戶都在考慮或采納業(yè)務(wù)集中的方案。然而業(yè)務(wù)系統(tǒng)集中后,不僅增加運(yùn)行維護(hù)的工作強(qiáng)度,而且會(huì)使集中的系統(tǒng)變得更加繁雜。有效的系統(tǒng)和應(yīng)用監(jiān)控體系成為了解業(yè)務(wù)資源的使用狀況,及時(shí)發(fā)現(xiàn)可能導(dǎo)致系統(tǒng)故障的隱患,實(shí)現(xiàn)系統(tǒng)運(yùn)營(yíng)保障的關(guān)鍵。另一方面,借助于集中監(jiān)控解決方案,用戶能夠正確和及時(shí)地了解系統(tǒng)的運(yùn)行狀態(tài),發(fā)現(xiàn)影響整體系統(tǒng)運(yùn)行的瓶頸,幫助系統(tǒng)人員進(jìn)行必要的系統(tǒng)優(yōu)化和配置變更,甚至為系統(tǒng)的升級(jí)和擴(kuò)容提供依據(jù)。強(qiáng)有力的監(jiān)控和診斷工具還可以幫助運(yùn)行維護(hù)人員快速地分析出應(yīng)用故障原因,把他們從繁雜重復(fù)的勞動(dòng)中解放出來(lái)。維護(hù)人員快速地分析出應(yīng)用故障原因,把他們從繁雜重復(fù)的勞動(dòng)中解放出來(lái)。因此,很多客戶的 IT 部門(mén)提出建立集中 IT 管理系統(tǒng)的需求,監(jiān)控的內(nèi)容包括網(wǎng)絡(luò)、服務(wù)器、數(shù)據(jù)庫(kù)、中間件和應(yīng)用。通過(guò)集中監(jiān)控系統(tǒng)及時(shí)發(fā)現(xiàn)系統(tǒng)中的故障,減少故障處理時(shí)間。不可錯(cuò)過(guò)的運(yùn)維監(jiān)控干貨!業(yè)務(wù)智能運(yùn)維監(jiān)控管理產(chǎn)品
Zabbix 是 B/S 架構(gòu),抓取數(shù)據(jù)是通過(guò)客戶端抓取的,在客戶端必須有服務(wù)啟動(dòng),該服務(wù)負(fù)責(zé)采集數(shù)據(jù),數(shù)據(jù)會(huì)主動(dòng)上報(bào)給服務(wù)端,也可讓服務(wù)端連接客戶端去抓取數(shù)據(jù)??蛻舳朔譃閮煞N模式,即主動(dòng)模式和被動(dòng)模式。Argus運(yùn)維監(jiān)平臺(tái)以 Zabbix 為基礎(chǔ),可同時(shí)兼容 不同版本的Zabbix,以 zabbix 為采集關(guān)鍵配合自研的 ArgusNMS 增強(qiáng)模塊為一組采集單元, ArgusEdge 的統(tǒng)一調(diào)度實(shí)現(xiàn)監(jiān)管控的需求。單一業(yè)務(wù)環(huán)境下可以支持多 組采集單元(多zabbix-server),實(shí)現(xiàn)真正意義上的分布式采集。應(yīng)用智能化運(yùn)維監(jiān)控管理系統(tǒng)簡(jiǎn)單聊聊運(yùn)維監(jiān)控的其他用途。
國(guó)產(chǎn)信創(chuàng)設(shè)備、軟件監(jiān)測(cè)管理之路面臨這兩大問(wèn)題與挑戰(zhàn)。挑戰(zhàn)一:信創(chuàng)產(chǎn)業(yè)帶來(lái)IT標(biāo)準(zhǔn)的重構(gòu),很多公司的系統(tǒng)軟硬件需要符合信創(chuàng)標(biāo)準(zhǔn),而這時(shí)的產(chǎn)品還處于可用階段,在這期間會(huì)產(chǎn)生許多問(wèn)題,為保障業(yè)務(wù)運(yùn)維的安全,亟需一個(gè)可以兼容信創(chuàng)體系和支持國(guó)產(chǎn)化環(huán)境部署的監(jiān)測(cè)軟件對(duì)其進(jìn)行監(jiān)測(cè)管理。挑戰(zhàn)二:大部分企業(yè)信創(chuàng)設(shè)備特用機(jī)房有多個(gè)品牌的國(guó)產(chǎn)化設(shè)備,需要一個(gè)系統(tǒng)既能監(jiān)測(cè)國(guó)外設(shè)備,又能監(jiān)測(cè)國(guó)外設(shè)備,而很多企業(yè),特別是國(guó)外的監(jiān)測(cè)軟件,不支持監(jiān)測(cè)信創(chuàng)的設(shè)備與信創(chuàng)的軟件。
運(yùn)維監(jiān)控的流程包括:
發(fā)現(xiàn)問(wèn)題:當(dāng)系統(tǒng)發(fā)生故障報(bào)警,我們會(huì)收到故障報(bào)警的信息定位問(wèn)題:故障郵件一般都會(huì)寫(xiě)某某主機(jī)故障、具體故障的內(nèi)容,我們需要對(duì)報(bào)警內(nèi)容進(jìn)行分析,比如一臺(tái)服務(wù)器連不上:我們就需要考慮是網(wǎng)絡(luò)問(wèn)題、還是負(fù)載太高導(dǎo)致長(zhǎng)時(shí)間無(wú)法連接,又或者某開(kāi)發(fā)觸發(fā)了防火墻禁止的相關(guān)策略等等,我們就需要去分析故障具體原因。解決問(wèn)題:當(dāng)然我們了解到故障的原因后,就需要通過(guò)故障解決的優(yōu)先級(jí)去解決該故障??偨Y(jié)問(wèn)題:當(dāng)我們解決完重大故障后,需要對(duì)故障原因以及防范進(jìn)行總結(jié)歸納,避免以后重復(fù)出現(xiàn)。Argus運(yùn)維監(jiān)控系統(tǒng)配有Syslog 日志接收和分析。
基于信創(chuàng)環(huán)境建立信創(chuàng)運(yùn)維服務(wù)體系,滿足跨平臺(tái)對(duì)信創(chuàng)軟硬件設(shè)備提供運(yùn)維監(jiān)控管理功能,包括不限于服務(wù)器(ARM架構(gòu)、MIPS架構(gòu)、X86架構(gòu)等)、網(wǎng)絡(luò)設(shè)備、數(shù)據(jù)庫(kù)(國(guó)產(chǎn)數(shù)據(jù)庫(kù)及非國(guó)產(chǎn)數(shù)據(jù)庫(kù))、應(yīng)用服務(wù)器、存儲(chǔ)、業(yè)務(wù)系統(tǒng)等全域多視角地監(jiān)控和管理,幫助用戶在極短時(shí)間發(fā)現(xiàn)問(wèn)題、分析出原因、得出解決方案,使故障問(wèn)題能夠在極短時(shí)間內(nèi)解決,保證業(yè)務(wù)系統(tǒng)的連續(xù)性。Argus 運(yùn)維監(jiān)控平臺(tái)是跨區(qū)域、跨部門(mén)的運(yùn)維系統(tǒng)監(jiān)控平臺(tái),實(shí)現(xiàn)包括不限于服務(wù)器(ARM架構(gòu)、MIPS架構(gòu)、X86架構(gòu)等)、網(wǎng)絡(luò)設(shè)備、數(shù)據(jù)庫(kù)(國(guó)產(chǎn)數(shù)據(jù)庫(kù)及非國(guó)產(chǎn)數(shù)據(jù)庫(kù))、中間件、存儲(chǔ)、業(yè)務(wù)系統(tǒng)等運(yùn)維監(jiān)控。通過(guò)對(duì)基礎(chǔ)實(shí)施、信息系統(tǒng)、項(xiàng)目進(jìn)度的總體監(jiān)控實(shí)現(xiàn)運(yùn)維體系的有效運(yùn)行,保障信創(chuàng)項(xiàng)目順利開(kāi)展。提供自動(dòng)化運(yùn)維、智能化運(yùn)維功能,打破了人工現(xiàn)場(chǎng)運(yùn)維效率低下的現(xiàn)狀;從信息采集、健康巡檢、補(bǔ)丁分發(fā)等場(chǎng)景實(shí)現(xiàn)功能自動(dòng)化;利用智能學(xué)習(xí)、大數(shù)據(jù)分析、機(jī)器學(xué)習(xí)等技術(shù)手段,實(shí)現(xiàn)故障從人工處理到無(wú)人值守的變革,降低故障處理時(shí)間的同時(shí),實(shí)現(xiàn)被動(dòng)運(yùn)維到主動(dòng)干預(yù)的轉(zhuǎn)變。Argus運(yùn)維監(jiān)控系統(tǒng)可手動(dòng)設(shè)置貼合業(yè)務(wù)的事件聚合規(guī)則、消息分派規(guī)則,并可查看與管理事件集、事件。業(yè)務(wù)智能運(yùn)維監(jiān)控管理產(chǎn)品
在運(yùn)維監(jiān)控中怎么樣才算是故障,要報(bào)警呢?比如CPU的負(fù)載到底多少算高,用戶態(tài)、內(nèi)核態(tài)分別跑多少算高?業(yè)務(wù)智能運(yùn)維監(jiān)控管理產(chǎn)品
Argus運(yùn)維監(jiān)控中硬件監(jiān)控包括:可以通過(guò)IPMI對(duì)硬件詳細(xì)情況進(jìn)行監(jiān)控,并對(duì)CPU、內(nèi)存、磁盤(pán)、溫度、風(fēng)扇、電壓等設(shè)置報(bào)警設(shè)置報(bào)警閾值(自行對(duì)監(jiān)控報(bào)警內(nèi)容編寫(xiě)合理的報(bào)警范圍)IPMI工具無(wú)法獲取到硬件的狀態(tài),可以借助MegaCli工具探測(cè)Raid磁盤(pán)隊(duì)列狀態(tài)zabbix提供IPMI監(jiān)控模板:ZabbixIPMIInterface。同時(shí)也能夠?qū)崟r(shí)采集到服務(wù)器的硬件報(bào)錯(cuò)日志,代替管理員的日常機(jī)房巡檢工作,使管理員實(shí)時(shí)了解到服務(wù)器底層硬件的運(yùn)行情況。帶外方式不通過(guò)操作系統(tǒng),即使系統(tǒng)關(guān)機(jī)的狀態(tài)下仍可監(jiān)控服務(wù)器的基本硬件健康狀況業(yè)務(wù)智能運(yùn)維監(jiān)控管理產(chǎn)品
上海觀縱科技有限公司致力于傳媒、廣電,以科技創(chuàng)新實(shí)現(xiàn)高質(zhì)量管理的追求。觀縱科技擁有一支經(jīng)驗(yàn)豐富、技術(shù)創(chuàng)新的專業(yè)研發(fā)團(tuán)隊(duì),以高度的專注和執(zhí)著為客戶提供webfunny前端監(jiān)控,webfunny前端埋點(diǎn),全鏈路應(yīng)用性能監(jiān)控,Argus-IT運(yùn)維監(jiān)控。觀縱科技繼續(xù)堅(jiān)定不移地走高質(zhì)量發(fā)展道路,既要實(shí)現(xiàn)基本面穩(wěn)定增長(zhǎng),又要聚焦關(guān)鍵領(lǐng)域,實(shí)現(xiàn)轉(zhuǎn)型再突破。觀縱科技始終關(guān)注傳媒、廣電行業(yè)。滿足市場(chǎng)需求,提高產(chǎn)品價(jià)值,是我們前行的力量。