前不久,阿里云,钉钉,语雀,淘宝,闲鱼都崩了的
最近滴滴崩了也上了热搜
滴滴系统崩溃属于全面瘫痪。不仅用户端无法正常使用,司机端以及滴滴内网同样出现了问题。
故障都是底层的基础设施上。因为打车、共享单车等服务全面崩溃
在互联网中,不同的业务板块之间应该是有隔离的,说明问题出在更加底层的基础设施
前几年,很多互联网公司都喜欢搞什么中台化
也就是在公司的技术,架构,组件寻求统一,保持一致性,师出同门,要讲究效率和复用,达到降本增效
但是这几年你会发现,很多公司的中台都在裁撤,令人唏嘘不已
像这种线上事故属于p0级的,肯定要有人背锅
滴滴本次事故事件超过12个小时,损失金额超4亿元
可以推测出,技术人员年终奖基本无望,甚至有的负责人要卷铺盖走人
互联网中网站,App应用,背后都有着若干个服务器支撑运行着
- 一般大规模的系统崩溃,无外乎以下几个原因
- 一是系统升级失败,在测试没有覆盖到的情况下上线,某个底层的API服务挂掉影响系统运行
- 二是服务器故障,遇到天灾人祸等;
- 是第三方服务故障,用了三方组件,组件挂了导致服务失效;
- 是遇到黑客攻击,脱库等
绝大多数情况应该是在前两种
即使是大厂,工作流程或者技术规范,依旧存在缺陷,稳定性是基本盘
网上有人调侃到,把有经验的老司机向社会输出了,剩下来的指望一群干ppt的救火,不频繁出事才怪
其实,公司里真正干活的实现者,依旧是那些底层一线开发者
至于职级M层一般都是指手画脚,吩咐做事的
虽然绝大多数一线开发可替代性比较强,但是一些核心的骨架员工往往是不能随意降本增效的,不然一旦出事,就是损失,程序软件这种东西,虽也没办法保证100%不出问题
毕竟有些问题,可人为控制,有些人为不可控制
希望一些事故能给企业敲响警钟
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END
暂无评论内容