系统崩溃怎么办?了解崩溃背后的原因,三种方法教你避免崩溃
系统崩溃怎么办?了解崩溃背后的原因,三种方法教你避免崩溃
去年一次重要项目投标,因为将投标保证金80万元回款打成8万元,导致评标的时候被废标。
回想投标过程,我们认真检查了技术、商务和报价文件的每一个细节,唯独没有注意到投标保证金的金额,投了无数次的标书,谁也没有想到竟然有一天被废标是因为投标保证金的金额错误。
在大家的惯性思维中,投标保证金是最基本的要求,也是最不可能会犯错的点,可这次偏偏就犯了错,偏偏投标保证金是废标条款,金额打错直接废标。
所有的偶然事件背后有一系列必然联系,这些联系之间有些关系不紧密,有些却关系异常紧密,而偶然事件的发生必然是关系紧密的部分出现了问题。
2018年4月6日,三星证券因操作员的操作失误,误向员工发放了6700亿股三星证券股票,这些股票价值约1000亿美元,超过三星证券市值的30倍。
实际上,三星证券原计划向员工派发28亿韩元的股息,结果由于一名工作人员的“手滑”,误将“韩元”输入成“股票”,造成这次价值1000亿美元的“乌龙指案”。
事件发生后,虽然三星证券发布了声明道歉,并快速暂停了公司员工的股票交易,但这期间仍然有16名员工将股票套现,公司损失重大。
4月8日,据媒体报道,韩国金融当局召开紧急会议,对三星证券分红错误因为的市场混乱进行讨论,并要求对三星证券在内的所有证券公司的股票管理系统进行检验。
4月10日,《华尔街日报》报道称,韩国最大投资公司国民年金公团宣布与三星证券切断联系。其发言人表示,做此决定是出于“金融事故后对该公司安全措施不佳的担忧”。
一连串的连锁效应让三星证券陷入巨大的崩溃中。
那么崩溃事件到底是怎么发生的?当我们信赖的科技系统不再像看起来那么靠谱的时候,我们该如何避免和预防崩溃事件呢?
克里斯·克利尔菲尔德(Chris Clearfield)和安德拉什·蒂尔克斯(András Tilcsik),在《崩溃:关于即将来临的失控时代的生存法则》这本书中,通过研究核电站、航空、金融、地铁等方面的灾难事件,为我们揭示引发崩溃事件的两大原因:复杂性和紧密耦合,除此之外,作者们从降低系统的复杂性和紧密耦合,使用工具帮助人们判断规避风险以及与人在系统中起到的不可忽视的作用三方面帮助我们规避崩溃事件的发生。
崩溃
一、崩溃事件是怎么发生的?
1979年3月28日,美国宾夕法尼亚州的三里岛核电站的工作人员考夫曼发现核电站有些不太对劲,冷却塔中飘出的蒸汽烟羽比平时的小很多,安全检查时,他能听见紧急报警的铃声,保安人员告诉他:“二单元出了点麻烦。”
但控制室里,红灯闪亮,汽笛报警,涡轮机停转,堆芯压力和温度骤然升高,很快放射性物质溢出,进入控制室。这是美国历史上最严重的的一次核事故,核电站周围的居民区形同鬼蜮,14万居民逃离这个区域。
三里岛核电站的崩溃始于一个简单的管道问题,一套通常向蒸汽发生器供水的水泵停止了运转,但是在核电站运行的过程中,控制室并不知道这套供水系统已经出现了问题,即便控制室的指示灯亮着,但那也表示指令的发出,不能代表指令已经完成。
当警报响起时,操作员只知道出了问题,却不知道哪里出现了问题,他们花费了很长时间才弄清楚问题所在,而在这个过程中,各种干扰信息骚扰着寻找问题的操作员们,危险在持续,崩溃事件最终酿成。
社会学教授查尔斯.培洛和他们的研究团队研究了数以百计的事故细节,提出了两大影响因素促使系统容易发生这种崩溃。
1、 复杂性:与系统中不同部分相互作用的方式有关
在上述三里岛核电站的事故中,当警报响起时,人们基于对技术和控制系统的信赖,做出了错误的判断,当然这不算是完全的人为错误。可面对如此复杂的核电系统,当出现问题的时候,我们无法直截了当的安排一个人去看反应堆芯到底发生了,通常的做法是看控制室的那些警示灯,还有各种指标数据(有可能是错误的数据)。
我们能看到一些事物,但不是全部。因此我们的判断很容易出错。
在三里岛核电站中,一杯不含放射性的水让1000升放射性冷却剂失效。因为我们无法完全了解复杂系统,因此就无法准确的预测任何一个小小的错误可能引发的所有后果。
很多灾难性事故的背后,都是从一个小失误开始。
2、 紧密耦合:与系统中有多大的松动空间有关。
什么叫紧密耦合呢?如果一个系统的各个部分之间很少有松动或者缓冲,,也就是说一个部分出现的失误很容易影响其他部分。
2012年星巴克策划了一场营销活动,本活动想要吸引更多的咖啡爱好者参与节目狂欢,它邀请顾客在推特上使用“让欢欣的感觉四处扩散”这一话题标签。
万万没有想到的是,星巴克使用的信息过滤器失灵,只要带有这一话题标签的所有言论都会在推特上发表,所以很多人开始在推特上发表关于星巴克采取的合理避税的不良言论,让星巴克陷入语言攻击的困境。
因为信息过滤器的故障增加了耦合的紧密程度,用户只要带着这个话题标签,就可以肆无忌惮的攻击星巴克,让对星巴克的不利的言论迅速传播开来,即便后来这些信息都删除了,可人们已经看见了,并且进行了讨论,不好的印象已经形成。
崩溃事件的发生很多时候是这两者相互作用发生的,并且当看似简单的线性系统组合起来的时候,就行形成复杂系统,即便我们对每个简单的线性系统都很了解,也无法完全了解这些线性系统组合后的复杂系统,这才是崩溃发生的重要原因。
复杂
既然复杂性和紧密耦合是引发崩溃的重要原因,那么降低崩溃发生也需要从这两方面入手。
一、 降低系统复杂性和紧密耦合
1、 透明的设计
《星际迷航》的演员安东.叶尔钦因为车祸身亡,究其原因竟然是他开的大切诺基普车的换挡杆设计引起的,这种吉普车的换挡设计需要驾驶员向前或者向后推动进行换挡,而换挡后换挡杆就会重新回归中心位置,所以当安东.叶尔钦下车后并不知道车子没有换到停车挡,最后他被顺坡而下的车子杀死。
对于飞机、高铁、汽车等这些复杂的设备,可以将控制系统和操作系统透明化设计,比如在汽车设计时,将每一挡都单独设计摆放位置,让人们在操作的时候看的更加直观,这样就不会因为看不到挡位的位置而引起不必要的危险。
2、 改善后勤问题
无论人们在做什么事,衣食住行这些人们基本需要可以有效缓解人们焦虑的情绪,比如在进行登山探险的时候,人们会面临航班延误、边境入关、物品供应、住宿、身体健康等问题,通常一点小问题的出现就会让人们的情绪产生波动,甚至是压抑,因此解决这些后勤问题就成为关键的安全焦点。
优秀的登山公司会这样做:雇佣优秀的后勤人员,建立设备精良的大本营,甚至连烹饪都被当做重大问题处理。
风险来自小问题的复杂相互作用,当一个个小问题都得到妥善的解决时,整个事件的复杂性和紧密耦合将会相应降低。
降低复杂和紧密耦合
二、 善用工具,做出正确决策
面对问题,人们脑海里的主观意思就是利用过去的经验进行判断,其实很多时候这种经验是对过去发生事件的一种总结,并不能代表当下或者未来发生事件的处理方案。
1、 主观概率区间估计
这种区间估计是需要估计几种结果的可能性,首先找出能够覆盖一切可能结果的区间,然后一个个的考虑每个区间发生的可能性,并且进行预测估计,比如《崩溃》中提到的案例,一个项目的耗时长短的预测:
主观概率区间估计
根据这些估计,可以估计一个置信区间,这个置信区间就可以为我们提供比较好的预测,如果想要90%的置信度,就应该忽略顶端的两个区间和低端的三个区间,这样获取的区间就是你需要的。
2、 维基序列测量的工具
这种工具非常简单,就是将影响判断的一些因素进行排列,赋予权重并且进行打分,根据现实情况进行打分,然后汇总得到最终的结果。
比如租房子:
维基序列测量的工具
你可以根据自己的需求重新罗列需要考虑的因素,并且赋予权重,这样更能贴近自己的需求,更有利于解决自身问题。
3、 事前检验
事前检验指的是在发生之前进行分析预测,通过收集信息,找到原因并提出解决方法的模式进行预测和风险规避。
使用工具
三、 不可忽视的人的作用
要知道在绝大部分灾难性事故中,人们的失误在其中扮演了非常重要的角色。2012年8月1日,骑士资本的交易系统狂飙了将近30分钟,损失超过1500万美元。原因竟然是骑士资本的一位IT工程师给服务器装新版交易软件的时候,漏装了一台,就是这一台服务器使用旧版本交易软件造成了巨大的损失。
1、 正视异常化现象,将五部循环作为常态
许多事故的发生早有预兆,只是我们并没有发现,所以我们需要知道如何从小的过失和未遂事件中总结经验,可以采取如下措施:
第一:收集数据,搜集未遂事件的报告和检查错误的报告。
第二:修补,对这些报告提出解决方案。
第三:找出根本原因,深入挖掘,并找出应对的根本原因的方法。
第四:分享,分享才能让更多的人了解并预防问题。
第五:审计,确定方法有效。
2、 尊重异见者,发现不一样的真相
很多时候,人们都喜欢随大流,总是倾向于选择大部分人的意见,其实有些时候“真理是掌握在少数人的手里”。
全球知名商业咨询专家赫克托•麦克唐纳在《后真相时代》中,提出:任何一件事件的发生,都不能简单的看待,因为事情本身就很复杂!
当别人提出异议时,不要着急否定,每个人看待问题的角度不同,分析的数据不同,得到的真相也就不同。
当有人看到与大众看到不一样的“真相”时,我们应该予以尊重及验证,不要急于否定。
3、 多元型团队,打造抗风险能力更强的团队
这个世界上大部分的事情都是由人来完成,无论在运行中的系统多么庞大,复杂,最初他们也都是由人设计、制造并且完成的。
《怎么玩转信息:研究方法指南》指出,在信息的洪流中,我们需要做的是分辨信息。如果大家的背景知识、成长环境很相似,那么在分辨信息的时候很有可能犯同样的错误。
一项研究追踪了美国进20年来额1300多家社区银行,发现了一个秘密,这些银行如果董事会的成员都是银行家,那么他们倒闭的概率远远大于那些董事会成员不全是银行家的银行,因为这些不全是银行家的董事会成员中除了有银行家,还有律师、医生、政府公务员等等,这些人的专业背景的多元化在一定程度上拯救了银行。
多元型团队中因为每个人的背景不同,知识领域不同,经验不同,就会在他人提出建议的时候进行不同方位的评估,提出自己的意见,这样会延缓决策、并且为决策提供更多的信息,便于大家更加深入的进行问题探讨。
多元型团队
当今世界,当我们享受技术进步带来的便利时,我们也需要承受复杂系统崩溃带来的灾难,因为不管我们想不想,只要复杂系统存在,崩溃的隐患就存在,而我们能做的就是尽量减少崩溃可能发生的概率。
在阅读了《崩溃》之后,我们能对产生崩溃事件的原因有深入的了解,并能时刻保持警惕。无论是生活中还是工作中,崩溃是不可预见不可避免的,但我们知道崩溃往往是由小的失误引起,因此我们会更加关注细小的问题,提前进行检查和预防。
-
- 上海市10所最好的大学,学科、专业及地铁出行分析
-
2025-10-12 17:19:43
-
- 尼格买提被曝离婚,前妻曾发文透露情绪压抑,孩子是分开导火索?
-
2025-10-12 17:17:27
-
- 深度|罗马中场扎尼奥洛:豪门猎物,意大利又一位天才新星
-
2025-10-12 02:49:45
-
- 沙拉:留在上海的犹太后裔,加入中国籍,声称很自豪是中国人
-
2025-10-12 02:47:30
-
- 李嘉诚与庄月明:她离世32年,因庄月明楼被人议,他携新欢度晚年
-
2025-10-12 02:45:15
-
- 追爱21年娶到汪明荃,罗家英的抱怨里,藏着不被爱的无奈和悲伤
-
2025-10-12 02:43:00
-
- 三国志霸王的大陆:魏蜀吴没有登场的名将都有谁,属性该给多少?
-
2025-10-12 02:40:45
-
- 汉末大军阀袁术为什么不是东汉朝廷官方任命的“州牧”?
-
2025-10-12 02:38:30
-
- 北京德云社演员名单及照片整理(最全,值得收藏)
-
2025-10-12 02:36:15
-
- 1999年“首富”牟其中入狱,妻子坚决离婚,小姨子却自愿陪伴至今
-
2025-10-12 02:34:00
-
- “真正的T-90坦克”,性能更加先进,为何却惨遭淘汰?
-
2025-10-12 02:31:45
-
- 她19岁嫁人,活到了106岁,将13个儿女供成博士,一儿子闻名世界
-
2025-10-12 02:29:30
-
- 《金婚》播出14年,7位主演“戏如人生”,家家有本难念的经
-
2025-10-12 02:27:15
-
- 中国市值最高的10家上市公司,工商第四,第一市值高达2.8万亿元
-
2025-10-12 02:25:00
-
- 淘宝运营——无工作经验新手电商运营面试技巧(通用篇)
-
2025-10-12 02:22:45
-
- 自贡市第四人民医院:护航盐都百姓,救治急危重症显“硬核实力”
-
2025-10-12 02:20:29
-
- 实尾岛事件:韩国特种兵奉命前往朝鲜行刺,却杀向青瓦台
-
2025-10-12 02:18:15
-
- 马云想干啥?
-
2025-10-12 02:16:00
-
- 理论周刊|周文:加快建构中国自主的经济学知识体系,要把握好两个关键
-
2025-10-12 02:13:45
-
- “戏精导演”王永泉:与初恋妻子双向奔赴39年,带着儿子一起拍戏
-
2025-10-12 02:11:30