发布网友 发布时间:2022-04-21 21:37
共5个回答
懂视网 时间:2022-05-05 18:04
生产环境上线发布程序导致服务故障案例解析(老男孩郑重声明:本文不针对任何公司和个人,仅供大家学习交流之用)1由生产操作失误引起的故障...................
生产环境上线发布程序导致服务故障案例解析
(老男孩郑重声明:本文不针对任何公司和个人,仅供大家学习交流之用)
2
2
2
3
4
4
6
6
6
6
7
7
7
7
1 由生产操作失误引起的故障
以下来自【操作人】的总结:
对于我司项目一次上线数据库误操作故障的总结:
我司相关人员在前天开过上线会议后,定于过后一天进行生产系统发布:
事情是这样的
首先呢,我先说下我司项目的上线流程:
老男孩老师评价:该公司的上线流程还是不错的,赞下,还有很多公司FTP直接上线的,不可取,堵住后门,监控好前门,是我一直给大家讲的。
话说那天测试通过后,项目上演练环境和生产都是由我【操作人】来负责:
然后我给我主管打电话了,说明了问题,他说让我别急,先保证生产服务正常运行。。。
由于我的这个误操作,开发的项目经理都疯了。。。然后立马惊动了公司技术部老总,然后老板
然后老板立马又召开紧急会议,说数据现在找不回来,后台查不到,一旦有用户投诉,免备案空间,说多少钱立马退多少钱
唉呀,我的这个脑子啊……
当天的上线取消了。。。
其实后来想我当时急着回滚是错误的,应该先问下开发的那边是否执行成功了,或者我查下进程。开发的后来也是这么给我说。
还有一点当时公司网络中断也是个事。。。网络不稳定不应该上线(那天供应商那边网络有问题,没有给及时通知)
有的会问只有一台数据库吗,问的好,我们是有主备两台数据库的,问题是在国庆假期期间机房切电源的时候,宕机了,然后启动后进主数据库找不到库了,当时那个急啊,然后就立马切换到备份的服务器上了,主的没有起,后来找到了主的为什么找不到库的原因(是因为机器启动后分区没有自动挂载上,手动挂载上后进数据库立马找到了),但由于这个时候从数据库和主的已经不同步了,就暂时用的从的,想等下次上线的时候在处理下,所以这次上线的时候就一个数据库。这是我们系统部没有做到位。
还有要说的一点就是我前面提到了演练环境,我为什么会动到了生产,事情是这样的,没有演练环境我部门也多次给领导提了,但领导不批买设备,然后就是每次演练的时候其实我动的也是生产(只是针对的这个项目没演练环境,其他的有),演练,什么是演练,表演练习嘛,肯定不能动到生产,但演练环境必须和生产一样。
最终我写了检讨书。唉,苦逼啊!
14)项目负责制,上线,日常网站出问题,开发有责任,不能只责问运维,运维是开发商,开发是住户,基础系统和网络没故障,一般来说运维就为力了。
1.4从操作者那得到的其他信息
SQL语句都是新表,有建表,插入,更新等语句。这样的话出问题整个数据库回滚就没必要了。
1.5给操作者的建议
老男孩 17:58:28
在不
操作者网友 17:58:37
在,还没下班呢
老男孩 17:58:48
事情过去了,好好汲取教训就好了,别难过了。
操作者网友 17:58:55
嗯,
老男孩 17:58:58
谁都会犯错,老师曾经也犯过错误。
以后亡羊补牢改正就好。
操作者网友 17:59:19
嗯,明白了,记住了
老男孩 17:59:24
操作者网友 17:59:31
在不犯这样的错了
老男孩 17:59:38
框架留给我。
操作者网友 18:00:01
热心网友 时间:2022-05-05 15:12
服务器不稳定的主要原因:
一:本地网络问题
如果我们在访问网站的时候突然发现很慢,很卡。我们首先要做的就是检查一下自身本地的网络环境是不是有问题。可以利用ping一下已知的知名域名,ping值出来之后,如果ping值很大,则可能是自己本地的网络环境有问题。反之ping值小,则是美国服务器出现问题了。
二:所在机房问题
网站加载速度过慢时,如果确认本地网络没有问题,还有可能是问题出现在美国服务器所在机房,机房的设备是完善的,但是也不能避免机房出现异常。当机房受到恶意攻击的时候,也会导致美国服务器变慢。另外也要检查一下机房的主干网络是否有异常。如果美国服务器托管了,那么我们可以联系机房的运维人员排查一下什么问题,推荐相关阅读:选择美国服务器应该注意哪些事项
三:运营商国际路由问题
当我们所使用的网络,运行商的路由或者提供的服务出现问题也会导致美国服务器变慢。特别是我们使用国外美国服务器的用户会经常遇到这类问题。当数据在传输的过程中,出现丢包或者无法连接路由时,用到这类网线的美国服务器速度就会很慢。这种情况并不是美国服务器本身出现问题,也不是本地网络出现问题,只需要等运营商修复网络即可。
四:资源不足和美国服务器中毒
我们要知道当美国服务器剩余空间不足时,会导致程序在运行的时候cpu或者内存过载,导致美国服务器速度变慢。遇到这类问题,我们可以尝试优化系统,关闭美国服务器上没必要运行的软件和程序。如果此类事件经常发生,那么我们就应该要升级美国服务器的整体配置了。另外,美国服务器如果遭受到恶意攻击也会导致美国服务器变慢。所以我们选择美国服务器的防火墙和所在机房的安全防护级别也是至关重要的。
热心网友 时间:2022-05-05 16:30
随着现代科技的进步,服务器已经成为我们生活中必不可少的东西。那么,不管是多好的服务器提供商,再好的服务器也避免不了在使用过程中出现这样或那样的问题,其中服务器死机就是最为常见的故障之一。那么,服务器死机的原因有哪些呢?我们又该如何解决呢?
引发服务器宕机原因大概有:运行环境问题、服务器性能问题、服务器硬件问题、数据丢失或损坏问题。下面壹基比小喻对以上几个问题详情描述并查询了几个解决办法,希望可以帮到你们。
一、运行环境问题导致服务器宕机
服务器运行环境包括操作系统,数据库,应用程序,应用程序bug,网络数据等,以上软件系统故障会引起服务器宕机现象。解决办法:需要我们查找分析系统、应用程序相关日志来找出真正的原因。一般都能发现问题,根据日志提供的错误信息修改相关设置来解决此类宕机故障,由于系统原因可以重装系统,或重启一下服务器就可以了。
二、服务器性能问题导致服务器宕机
服务器性能好坏也是引发宕机的一个因素,因为IDC提供商的服务器有些不是品牌服务器,是组装型的服务器,采购的硬件也不是品牌的,多用于杂牌硬件,难免会因硬件兼容性,CPU,内存等性能不好,导致宕机。解决办法:查看服务器硬件信息,在租用或选购时尽量用品牌服务器,品牌服务器在稳定性方面是没得说的。
三、服务器硬件问题导致服务器宕机
如服务器主板,电源,CPU,内存,磁盘有问题也会导致服务器宕机故障,解决办法:使用工具测试相关硬件配件,或更换配件测试服务器硬件问题。
四、数据丢失或损坏问题导致服务器宕机
数据丢失包括人为错删除数据,磁盘坏道导致数据丢失,磁盘写满等原因可导致服务器系统崩溃宕机,解决办法:做好数据备份,监控磁盘空间大小。
热心网友 时间:2022-05-05 18:05
线路因素,本地电信,网通出现不稳定,无论访问哪里的服务器都会受到影响。
服务器性能不足,运行不稳定。机房温度湿度以及稳定电力能够让服务器运行稳定。服务器配置不足,无法满足软件应用需求,会出现不稳定。
操作系统安全防护不达标。入侵,攻击,会导致服务器不稳定。
带宽等问题也会影响服务器稳定,带宽不足会让很多用户无法访问。
人为因素几乎可忽略不计。但是天灾无法避免。
耀磊数据-小凡,为您解答
热心网友 时间:2022-05-05 19:56
1、机房网络不稳定,导致服务器远程不上、丢包卡顿等。
2、资源占用过高,比如带宽、CPU、内存经常跑满,会造成服务器卡、远程不上、死机等情况。
还有其他许多因素都会让我们认为服务器不稳定,比如本地网络不好,本地线路或出口带宽问题也会对远程服务器有影响,有时我们会认为是服务器不行。做MTR可以看出来具体是机房线路问题还是本地线路问题。还有自己并不太会使用服务器,误操作都会造成远程不上,甚至系统崩溃。
耀磊数据为您解答。