1.計算機系統運維工作
近幾年,筆者從事計算機系統運維工作。鋼鐵企業的產銷管理系統已經運行了10年,筆者負責其中一個模塊,接手該模塊時,對于這個大型系統的整體架構不甚了解,甚至不知如何登陸系統,于是盡快學習該系統,學習如何找到程序、如何編譯、如何進入數據庫。隨后面臨的是業務人員日常工作中提出的新需求或者是需要修改的數據。對于用戶提出的新需求,首先要理解業務,將理解的業務定位到系統中,是需要修改系統中已存在的程序還是新寫程序,需要維護人員判斷。對這些基本的內容有了了解以后,基本能處理日常運維中的簡單問題。
1.1 計算機系統維護工作的主要內容
業務方隨著業務的拓展,需要新增功能,那么需要和用戶進行新業務的溝通,了解用戶的需求,將用戶的需求應用到系統中。系統中新增功能對系統中現行的業務影響應降到最低,不能讓新增功能影響了原有正常運行的業務。
計算機系統維護工作的主要內容有:
①系統定期停機進行數據備份、垃圾清理等工作;
②每日定時查看系統的運行效率和系統負荷;
③關于UPS設備的定時檢查;
④關于服務器和個人終端計算機硬件的監控及維護;
⑤業務方經常在對數據進行分析時會對系統提出問題,在業務方對數據質疑時,解釋數據的前后邏輯;
⑥業務方偶爾會出現錄入數據出錯的現象,需要維護人員修改數據,修改數據時必須將所有涉及的表都做相應的修改;
⑦業務方咨詢計算機系統的處理邏輯時,需要耐心解釋邏輯;
⑧對于一些后臺批處理的程序,每日定時監控其運行的結果是否正確,在不正確時處理故障;
⑨做到被呼叫時第一時間響應。
1.2 運維工作特點
運維工作是瑣碎而繁雜的,一旦出現問題要及時解決,否則會對其它模塊有影響,導致處理起來時間延長,影響面變大。及時處理故障是對運維工作的一個基本要求,要做到能夠及時處理故障則靠平時積累經驗和準確定位問題。
運維人員是在一線和用戶打交道的人,在處理日常運維工作時,應該多了解用戶需求,一些潛在的項目就是這時候被挖掘的,這樣在為用戶解決問題的同時也為公司增加了項目機會。運維人員代表的是公司的形象,計算機系統運維是一項服務,運維人員應有服務意識,做到讓用戶信任,同時運維人員應將用戶提出的一些建議帶回,在以后的項目中考慮進去,使公司的軟件不斷完善,提高市場競爭力。
對于運維工作,每一個崗位都設有A、B角,所謂的A、B角是對同一崗位不同角色的稱呼,A角是指擔任這個崗位的主要運維人員,是該維護崗位的負責人,在A角休假或者生病期間,運維工作由B角來完成,這樣不至于耽誤用戶的工作。當然,作為A角的人同時要作為其它模塊的B角,也即運維人員不但要對自已負責的模塊熟悉,同時對其它模塊也要熟悉。
1.3 運維和項目的關系
運維和項目的關系是指項目實施團隊和運維團隊在一般情況下其人員會有變化,項目實施的時候,不但要從項目的角度出發考慮問題,同時還要為將來運維考慮。比如要處理一批數據,需要將A表中的數據取出按照一定的邏輯寫入B表,如果系統服務器效率高,那么就用循環的方式將A表的數據全部取出,一條一條地循環,每條數據處理好邏輯后,新增到B表中直至A表的所有數據處理完畢;如果系統服務器的效率不是很高,那么就用INSERT…SELECT…查找同時新增的方式,這樣效率較高,但SELECT語句中的邏輯比較復雜。在做項目時兩種寫法都可行,如果能考慮到后期的運維工作,則第一種方式相對要好,對運維接手的人來說讀程序比修改程序容易上手,且程序上線運行后不容易有錯誤。第二種寫法,在運維階段如果用戶提出增加邏輯或者修改邏輯,那么要讀懂原來寫的SELECT的邏輯就不是很容易,即使讀懂了在其基礎上增加邏輯或者修改邏輯也容易出錯,程序上線后容易出現數據出錯等問題。
運維時還應注意:對于批量數據一起處理的程序,數據量很大,在做新增數據時,做了commit的處理,那么當這樣的程序出現異常報錯時,一定要查看是不是已經有數據新增進去了,要在數據中用時間或者其它字段做標記,以便迅速查找出已經commit的數據,將查找出的數據刪除,重新執行程序。
1.4 運維過程管理
運維過程中每次處理的事件、問題及用戶提出的新需求,都要進行記錄,提出問題的人需要記錄問題,運維人員處理完問題后,針對問題描述其原因及處理的過程然后關閉問題。用戶新提出的需求,同樣需要用戶先記錄需求,將需求描述清楚,運維人員拿到需求后和用戶溝通好,進行系統設計、程序編寫、測試,最后上線應用。運維人員按照記錄的需求單記錄處理過程,再關閉需求單。該過程是運維管理的一個流程,將運維過程全部記錄下來,一方面是系統的審計要求,另一方面是和用戶的交互過程有記錄可查。
運維工作也需要大量的溝通,由于系統之間都有接口關聯,當系統出現故障時,需要進行系統搶修,相關聯的系統都要做相應的調整,需要和其它系統的運維人員進行溝通。溝通時應注意說話語氣,多從他人角度出發描述問題,運維人員需要和用戶有效溝通,需要和周邊系統的運維人員有效溝通,做好溝通對運維工作起到事半功倍的效果。
1.5 實際案例
業務人員需要運維人員處理事件的過程如下:運維人員的手機上收到系統運維平臺要求處理事件的短信后,登陸運維平臺,對事件進行判斷,電話聯系提出事件的業務人員,通過溝通,了解具體事件,尋找解決辦法,有時候溝通發現是業務人員的理解偏差,對業務人員進行解釋,然后在運維平臺上對事件描述解決辦法,再關閉事件。
有時要處理的事件需要對數據進行分析,比如一個程序要處理大量數據,在系統正在執行程序和系統對數據庫正常備份時發生了沖突,數據庫備份時先把表鎖定,正好這個處理批量數據的程序要對此表進行新增就容易出錯。接到這樣的事件,先對出錯的程序進行查看,看程序中是否對數據進行了分布提交,一般在處理大量數據時,都需要分布提交,對數據庫來說,一次性提交上百萬條數據,會出現爆滿的情況發生,所以要求程序開發人員在編碼時,1 000條數據commit一次,這樣對數據庫的負荷明顯下降。但是對于剛才描述的出錯,首先要看程序中是否寫了commit,如果存在,那么要在被寫的表中查看是否已經有了新增成功的數據,至于數據怎么查找出來,則涉及到做項目時編碼中要考慮到用時間或者其它字段做標記,以便在數據出錯時進行查詢。寫程序時用時間字段進行標記,這樣在處理故障時,對時間字段進行DISTINCT操作,看是否在出故障時的時間點有數據,如果有數據存在,對這些數據進行刪除操作,待數據庫備份完畢后,重新提交程序對數據進行處理,這樣就不會出現數據重復的現象。事件處理完畢后,在運維平臺將該事件的處理過程進行描述后關閉事件,標志著事件處理結束。
2.結語
計算機系統的維護工作和實施工作同樣重要,無論是實施項目還是維護系統,筆者認為,用心學習最重要,無論事情有多繁瑣,若能靜心理清思路,都會迎刃而解。筆者結合自身工作經驗,通過實例對計算機系統維護工作進行了研究,以期為同行工作人員從事相關工作提供一些參考。
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://m.vmgcyvh.cn/
本文標題:企業計算機管理系統維護的策略研究