-
無法初始化 vGPU“nvidia_a16-1b”的插件“l(fā)ibnvidia-vgx.so”
我們一位用戶在對自家VDI桌面的GPU卡進(jìn)行升級后,發(fā)現(xiàn)無法啟動帶有vGPU的虛擬機,報錯如下: 于是用戶與我們的工程師聯(lián)系排查問題,我們的虛擬化工程師第一反應(yīng)會不會是GPU卡驅(qū)動沒有安裝好,經(jīng)過排查確認(rèn)驅(qū)動正常,可以使用nvidia-smi命令: 接著我們的虛擬化工程師懷疑是不是GPU卡的ECC沒關(guān)閉導(dǎo)致的異常,經(jīng)查用戶使用的是nVidia A16 GPU卡,在對A16的參數(shù)進(jìn)行查詢確認(rèn)后,發(fā)現(xiàn)是支持vGPU模式下開啟ECC功能。 具體關(guān)于ECC的描述可以參考官方文檔: https://doc…
-
ESXi7.0利用iDRACTools不重啟服務(wù)器重置iDRAC密碼
對于很多托管在機房或者依賴遠(yuǎn)程運維的工程師來說,iDRAC是必不可少的管理工具,我們的工程師今天幫助客戶運維的時候遇到一個很尷尬的問題,用戶密碼本中記錄的一臺服務(wù)器iDRAC密碼登錄不上,現(xiàn)場也沒有值班的工程師可以現(xiàn)場協(xié)助重置密碼,問題又很急著解決,經(jīng)過我們工程師的努力成果在遠(yuǎn)程的環(huán)境下重置掉了iDRAC密碼成功進(jìn)入iDRAC進(jìn)行運維工作。 用戶服務(wù)器是一臺DELL PowerEdge R740服務(wù)器,操作系統(tǒng)為VMware vSphere ESXi 7.0U3C,在以往的運維經(jīng)驗中,我們曾經(jīng)在…
-
ESXI移除已卸載或不可訪問的數(shù)據(jù)存儲
正常卸載一塊ESXi數(shù)據(jù)存儲后,當(dāng)刪除的時候報錯Not a known device:naa…,重新掃描存儲后仍無法刪除。 此時需要開啟ESXI主機的SSH功能,使用命令列出永久分離的設(shè)備: 此時只需要在WEB上重新掃描存儲,或SSH執(zhí)行命令重新掃描存儲即可: 參考鏈接1:https://kb.vmware.com/s/article/56994 參考2鏈接2:https://tomaskalabis.com/wordpress/how-remove-unmountedinacces…
-
VMware vSphere ESXI 5.5升級6.0U3
我們?yōu)榭蛻羯暇€一套DELL R740服務(wù)器+DELL ME4024存儲作為新的生產(chǎn)群集,軟件使用ESXI 6.7U3和VCSA 6.7U3,由于客戶原有服務(wù)器為ESXI 5.5版本,新群集的VCSA 6.7U3最低兼容ESXI 6.0版本,所以需要升級原有ESXI版本才能在新的VC進(jìn)行納管。 為確保升級的可靠性,在升級前建議在https://interopmatrix.vmware.com/#/Upgrade?productId=1查詢Upgrade Path,以我們現(xiàn)有ESXI 5.5為例,可…