服務(wù)器時(shí)間同步我一直使用的cn.ntp.org.cn,使用了差不多五六年的時(shí)間一直沒有出現(xiàn)過問題。
ntp.org.cn也不是什么盈利組織創(chuàng)辦,能提供這樣的免費(fèi)服務(wù),實(shí)屬不易。
但是今天早上出現(xiàn)的災(zāi)難性故障,不得不使我更換ntp服務(wù)器地址。
早上起床查看釘釘報(bào)警就是各種服務(wù)狀態(tài)不穩(wěn)定的告警,由于是非生產(chǎn)環(huán)境,本身會(huì)自動(dòng)重啟,所以就沒有在意,打算去公司以后再具體查看原因。
可是還未到公司就接到電話說生產(chǎn)環(huán)境創(chuàng)建的訂單時(shí)間全部為2000年,一開始還不相信(因?yàn)樗蟹?wù)器都有時(shí)間同步),到公司以后登陸服務(wù)器查看,好幾臺(tái)服務(wù)器時(shí)間的確變?yōu)榱?000年。
導(dǎo)致的結(jié)果就是:
1、線上業(yè)務(wù)出現(xiàn)操作報(bào)錯(cuò)。
2、日志系統(tǒng)無(wú)法正常查詢今天的部分日志。
3、新增的訂單時(shí)間全部為2000年。
4、監(jiān)控?cái)?shù)據(jù)缺失。
5、大部分業(yè)務(wù)功能基本處于不可用狀態(tài)。
然后馬上找了一個(gè)可用節(jié)點(diǎn)手動(dòng)進(jìn)行同步,時(shí)間正常以后,再修復(fù)數(shù)據(jù)庫(kù)時(shí)間錯(cuò)誤的記錄。
最后找到了阿里云提供的NTP服務(wù)器,進(jìn)行所有服務(wù)器的地址替換。
到此此次故障才得以完全解決。
故障解決以后,去查看監(jiān)控?cái)?shù)據(jù),發(fā)現(xiàn)今天凌晨4點(diǎn)10分左右開始就出現(xiàn)監(jiān)控?cái)?shù)據(jù)斷斷續(xù)續(xù)丟失的情況。
經(jīng)排查發(fā)現(xiàn)是由*方糖科技*提供的節(jié)點(diǎn)223.113.103.191故障導(dǎo)致的時(shí)間同步出現(xiàn)錯(cuò)誤。
由于DNS解析原因,有些服務(wù)器會(huì)間斷的解析到223.113.103.191導(dǎo)致故障,這個(gè)從監(jiān)控?cái)?shù)據(jù)的丟失就看得出來。
最后推薦幾個(gè)NTP服務(wù)器地址:
阿里云內(nèi)網(wǎng)(專有網(wǎng)絡(luò)VPC內(nèi)網(wǎng)):ntp.cloud.aliyuncs.com,這個(gè)服務(wù)器地址阿里云是這樣介紹的:
ntp.cloud.aliyuncs.com服務(wù)器提供分布式的一級(jí)時(shí)鐘源,適用于金融、通訊、科研和天文等以時(shí)間精度核心的生產(chǎn)行業(yè)。
騰訊云內(nèi)網(wǎng):
time1.tencentyun.com
time2.tencentyun.com
time3.tencentyun.com
time4.tencentyun.com
time5.tencentyun.com
公網(wǎng):
阿里云:
ntp.aliyun.com
ntp1.aliyun.com
ntp2.aliyun.com
ntp3.aliyun.com
ntp4.aliyun.com
ntp5.aliyun.com
ntp6.aliyun.com
ntp7.aliyun.com
騰訊云:
time1.cloud.tencent.com
time2.cloud.tencent.com
time3.cloud.tencent.com
time4.cloud.tencent.com
time5.cloud.tencent.com
其他還有很多教育機(jī)構(gòu)的NTP服務(wù)器,這里就不列出來了,畢竟阿里和騰訊云屬于商業(yè)機(jī)構(gòu),為自己產(chǎn)品提供的時(shí)間同步服務(wù)穩(wěn)定性和精度是有保障的。