沐鳴總代理_學會這5招,讓Linux排障更簡單

Linux排障技巧在數據中心十分受人重視。數據中心專家對此提供了一些Linux服務器排障相關的性能問題、優化和便利工具參考。

1.Linux性能工具好用嗎?

也許你從沒使用過pchar、pidstat或perf_events,但你不是一個人。這些僅僅是大量Linux性能工具中的其中幾個,可以利用這些工具來觀察帶寬、性能狀態並進行動態追蹤。這些工具聽起來可能不起眼,但實施得當的話,可以顯著提升Linux性能。

2.如何處理針對Linux服務器的惡意軟件攻擊?

Linux服務器同樣存在惡意軟件問題;只是它們的表現與其他平台不同。rootkit是這些問題最常見的原因。它們修改服務器原本的二進制文件,並將其替換為留有後門的版本,以此破壞系統安全性與私密性。

rootkit可以攻陷服務器並讓它們極度脆弱。使用文件檢查器或高級入侵檢測系統可以快速定位並判斷rootkit可能造成的損害。同樣還可以使用一些Linux命令,如有rpm -Va,可幫助系統管理員校驗認證安裝包的認證情況。

3.是什麼導致服務器連接失敗,我該如何解決這個問題?

很難確認是否為傳輸層安全性(TLS)證書問題,這使得Linux無法連接服務器的排障存在困難。

首先,確定是否證書存在問題。需要熟悉.crt服務器證書文件,因為證書經常由未知的頒發機構頒發,這也是影響安全憑證和信息加密公共密鑰的主體。

認證失敗十分常見,但理解出錯原因、可能造成的影響以及如何修復十分重要。

檢查日誌文件與網絡流量,並使用正確的Linux命令來排查連接故障。如tcpdump命令可以檢查網絡流量,定位哪個端口正在使用連接。這個命令可以定位協議,便於發現是否存在安全或不安全的端口,而這些端口可能是連接問題的根源。

4.我的SSH服務器經常斷開連接,要怎麼辦?

安全外殼(SSH)連接可以讓管理員遠程連接Linux與Unix系統,但同樣也會出現與服務器斷開連接的情況,這在物理上同樣無法避免。這可不是一件好事,問題會隨着同時登錄服務器的數量增長而擴大。

SSH會關閉空閑連接來回收資源。這無意中會導致系統管理員斷開連接。

當面對服務器經常斷開連接的情況,可以在排錯時調整兩個資源配置:ClientAliveInterval參數和TCPKeepAlive參數。ClientAliveInterval參數用於設定SSH守護進程周期性檢查連接是否還在使用。

例如將其設置為400,SSH服務器會每400秒檢查一次連接是否還在使用。TCPKeepAlive用於確定SSH會話是否依然活躍。如果你希望離開服務器遠程連接后,會話仍處於空閑狀態並持續一段時間,延長這兩個參數即可。Linux服務器無法正常啟動,而之前的採用的老方法現在不適用了。

5.服務器無法正常啟動,採用的老方法不適用了

如果習慣了上一代Linux發行版,如Red Hat Enterprise Linux 5,你會發現在最新版本中,GRUB2和systemd改變了系統管理員排查無法正常啟動系統的方式,而且需要恢復關鍵任務。

RedHatEnterpriseLinux7,SUSE Linux Enterprise Server 12中,多個啟動選項都已經變了。例如,runlevel選項被從兩個發行版中移除。取而代之的是systemd服務集,被稱作Systemd.units,其替代了rescue和emergency模式。

一旦你熟悉如何修改GRUB2默認設置,排查新版本Linux服務器故障會更容易。如果GRUB2引導程序中有東西阻止服務器正常啟動,系統管理員需要修改GRUB2設置來修復配置。但GRUB2配置文件本身無法被修改,它們必須依賴於輸入文件。

來自:https://os.51cto.com/art/202009/625242.htm

站長推薦

1.雲服務推薦: 國內主流雲服務商,各類雲產品的最新活動,優惠券領取。地址:阿里雲騰訊雲華為雲

2.廣告聯盟: 整理了目前主流的廣告聯盟平台,如果你有流量,可以作為參考選擇適合你的平台點擊進入

鏈接: http://www.fly63.com/article/detial/9625