運(yùn)維問題 記錄一次docker多平臺(tái)build問題 最近接手一個(gè)國(guó)外項(xiàng)目,用的rust語(yǔ)言,部署在AWS的ECS上面。我們開發(fā)在開發(fā)環(huán)境build發(fā)布到集群以后,報(bào)錯(cuò)docker: not found。一開始以為是容器里面沒有安裝成功docker,檢查... 01月13日 1,055 ℃ 發(fā)表評(píng)論 閱讀全文
運(yùn)維問題 騰訊云TKE kubernetes1.20升級(jí)1.26踩坑記 目前有幾個(gè)幾年前創(chuàng)建的騰訊云TKE集群,都是1.20.6的版本。最近看到官方給的維護(hù)周期公告。馬上到截止日期了,就著手準(zhǔn)備升級(jí)到1.26。剛接手不久的時(shí)候就打算升級(jí)到最新,但是發(fā)現(xiàn)集群里面的服務(wù)太混亂... 11月13日 1,169 ℃ 發(fā)表評(píng)論 閱讀全文
運(yùn)維問題 Skywalking apm-trace-ignore-plugin插件環(huán)境變量不生效解決辦法 Skywalking的這個(gè)插件apm-trace-ignore-plugin不知道為什么要設(shè)置為可選插件,我感覺基本上都會(huì)屏蔽一些沒用的接口,避讓監(jiān)控檢查之類的。以前在8.x版本的時(shí)候直接配置環(huán)境變量... 12月13日 3,718 ℃ 發(fā)表評(píng)論 閱讀全文
運(yùn)維問題 TKE容器內(nèi)部無法通過內(nèi)網(wǎng)訪問CVM里面的服務(wù) 最近發(fā)現(xiàn)k8s容器內(nèi)無法訪問內(nèi)網(wǎng)的負(fù)載均衡,直接訪問后端CVM也不行。使用的是騰訊云的TKE和clb,clb后端負(fù)載了三個(gè)CVM服務(wù)器。其他集群容器內(nèi)部都可以通過內(nèi)網(wǎng)訪問這個(gè)clb和cvm。在排查了所... 11月14日 2,414 ℃ 發(fā)表評(píng)論 閱讀全文
運(yùn)維問題 Fluentd報(bào)錯(cuò)failed to flush the buffer解決辦法 最近EFK遇到一個(gè)問題,就是當(dāng)集群的歷史日志過多的時(shí)候,新安裝的EFK會(huì)因?yàn)閿?shù)據(jù)太多導(dǎo)致無法把數(shù)據(jù)轉(zhuǎn)發(fā)到Elasticsearch,如果Elasticsearch內(nèi)小會(huì)出現(xiàn)內(nèi)存溢出的情況。Fluent... 06月06日 3,724 ℃ 發(fā)表評(píng)論 閱讀全文
運(yùn)維問題 Kong-ingress-controller Read-timeout超時(shí)時(shí)間設(shè)置 今天開發(fā)反饋有個(gè)項(xiàng)目導(dǎo)入接口60s就超時(shí)了,按照之前其他項(xiàng)目的經(jīng)驗(yàn),在騰訊云LB設(shè)置proxy_read_timeout和proxy_send_timeout就正常了,因?yàn)檫@兩個(gè)參數(shù)剛好默認(rèn)是60s,... 04月12日 4,212 ℃ 發(fā)表評(píng)論 閱讀全文
運(yùn)維文檔 在阿里云ACK使用Traefik Ingress并通過已有的SLB負(fù)載均衡公開應(yīng)用 阿里云的ACK默認(rèn)只提供了3個(gè)Ingress Controller組件的自動(dòng)安裝,分別是ALB Ingress Controller、MSE Ingress Controller和Nginx Ingr... 01月01日 3,020 ℃ 發(fā)表評(píng)論 閱讀全文
運(yùn)維視界 4個(gè)Kubernetes 默認(rèn)Namespace(命名空間)介紹 Kubernetes 隨帶許多( Namespace )命名空間。一些命名空間很重要,事關(guān)你的Kubernetes使用是否正常!搞壞其中一個(gè)命名空間即會(huì)損壞Kubernetes系統(tǒng)。這些命名空間包括如... 01月12日 2,989 ℃ 發(fā)表評(píng)論 閱讀全文
生活隨筆 被阿里”領(lǐng)導(dǎo)”上了一課,感受了一次阿里文化 事情的起因是因?yàn)樵谑褂冒⒗镌频腁CK的Terway網(wǎng)絡(luò)插件時(shí),遇到了一些問題,具體問題可以查看《阿里云ACK網(wǎng)絡(luò)插件Terway踩坑記》,然后提交工單半天沒回復(fù),就讓售前運(yùn)營(yíng)幫我催一下。售前運(yùn)營(yíng)也是出... 11月12日 3,059 ℃ 1 閱讀全文
運(yùn)維問題 阿里云ACK網(wǎng)絡(luò)插件Terway踩坑記 先來看看阿里云官方對(duì)Terway的介紹:什么是Terway網(wǎng)絡(luò)插件Terway是阿里云開源的基于專有網(wǎng)絡(luò)VPC的容器網(wǎng)絡(luò)接口CNI(Container Network Interface)插件,支持基... 11月12日 5,422 ℃ 發(fā)表評(píng)論 閱讀全文
生活隨筆 一次馬虎大意造成的事故 最近生產(chǎn)環(huán)境服務(wù)器快到期了,就想著把一直使用docker-compose部署的canal和elasticsearch遷移到kubernetes集群。由于在這之前開發(fā)、測(cè)試、預(yù)生產(chǎn)的canal我都已經(jīng)遷... 11月12日 3,734 ℃ 2 閱讀全文
科技視界 十款開源的服務(wù)網(wǎng)格(Service Mesh)介紹 什么是服務(wù)網(wǎng)格服務(wù)網(wǎng)格近年來有很高的話題度,背后的原因是什么?2017年底,非侵入式的 Service Mesh 技術(shù)從萌芽到走向了成熟。Service Mesh 又譯作“服務(wù)網(wǎng)格”,作為服務(wù)間通信的... 10月29日 4,487 ℃ 發(fā)表評(píng)論 閱讀全文
運(yùn)維問題 Kubernetes的生態(tài)系統(tǒng)和特性 Kubernetes 的主要優(yōu)勢(shì)在于,它提供了一個(gè)便捷有效的平臺(tái),讓用戶可以在物理機(jī)和虛擬機(jī)集群上調(diào)度與運(yùn)行容器。進(jìn)一步來說,Kubernctes 是一個(gè)支持彈性運(yùn)行的分布式系統(tǒng)框架,是一種支撐其他平... 08月26日 2,248 ℃ 發(fā)表評(píng)論 閱讀全文
運(yùn)維視界 為什么需要kubernetes這樣的容器編排系統(tǒng) Docker 本身非常適合管理單個(gè)容器,若運(yùn)行的是構(gòu)建于有限幾個(gè)或十幾個(gè)容器上的應(yīng)用程序,則可以僅在 Docker 引擎上自主運(yùn)行,部署和管理這些容器并不會(huì)遇到太大的困難。然而,對(duì)于包含成百上千個(gè)容器... 08月25日 2,220 ℃ 發(fā)表評(píng)論 閱讀全文
運(yùn)維視界 數(shù)據(jù)庫(kù)適不適合Docker容器化部署 網(wǎng)上有一篇文章提到數(shù)據(jù)庫(kù)不適合容器化的七大原因:1、數(shù)據(jù)不安全2、運(yùn)行數(shù)據(jù)庫(kù)的環(huán)境需求3、網(wǎng)絡(luò)問題4、狀態(tài)5、數(shù)據(jù)庫(kù)不適合使用主要的Docker功能6、額外的隔離對(duì)數(shù)據(jù)庫(kù)是不利的7、云平臺(tái)的不適用性當(dāng)... 08月24日 3,680 ℃ 發(fā)表評(píng)論 閱讀全文
科技視界 2021年11款最佳的開源Kubernetes工具 到 2021 年,幾乎所有接觸過云基礎(chǔ)設(shè)施的人都熟悉 Kubernetes 項(xiàng)目。簡(jiǎn)單地說,Kubernetes 是一個(gè)非常強(qiáng)大的容器編排平臺(tái),并且 Kubernetes 社區(qū)一直在共享工具,這有助于... 08月24日 2,168 ℃ 發(fā)表評(píng)論 閱讀全文
運(yùn)維問題 阿里云日志服務(wù)SLS采集kubernetes集群日志踩坑記 最近在使用阿里云日志進(jìn)行“上下文瀏覽”和“LiveTail”的時(shí)候突然發(fā)現(xiàn)無法正常過濾。比如:我要實(shí)時(shí)查看eureka服務(wù)的日志,通過“Pod名稱”或者“容器名稱”過濾以后,LiveTail還是會(huì)顯示... 08月17日 3,338 ℃ 發(fā)表評(píng)論 閱讀全文
運(yùn)維問題 Kubernetes集群中SpringBoot服務(wù)的健康探測(cè)優(yōu)化 今天在維護(hù)預(yù)生產(chǎn)環(huán)境的數(shù)據(jù)庫(kù)的時(shí)候,發(fā)生了一個(gè)災(zāi)難性的故障(還好不是生產(chǎn)環(huán)境),集群中除了eureka和zuul的其他服務(wù)全部springboot服務(wù)都變成了不可用狀態(tài),容器在不停的重啟中,出現(xiàn)這種情... 08月09日 3,513 ℃ 發(fā)表評(píng)論 閱讀全文
運(yùn)維問題 Kubernetes1.20 創(chuàng)建pvc報(bào)錯(cuò)selfLink was empty, can’t make reference 最近把kubernetes集群從1.18升級(jí)到1.20以后,新建pvc一直處于pending狀態(tài),查看nfs-client-provisioner日志,提示:unexpected error... 07月05日 7,280 ℃ 1 閱讀全文
運(yùn)維問題 同一個(gè)docker鏡像在不同的服務(wù)器運(yùn)行/tmp目錄權(quán)限不一致解決辦法 今天遇到一個(gè)比較有意思的問題,在kubernetes集群創(chuàng)建了一個(gè)springcloud服務(wù),在其中一臺(tái)node上面很快就啟動(dòng)成功,顯示running了,但是在另外一臺(tái)node上面,等了很久都沒啟動(dòng)成... 07月05日 4,788 ℃ 發(fā)表評(píng)論 閱讀全文