Py学习  »  机器学习算法

传字节实习生删除公司 GB 以下机器学习模型?网友:谁来背锅?

Java编程精选 • 2 年前 • 256 次点击  
👇👇关注后回复 “进群” ,拉你进程序员交流群👇👇




  新智元报道  

来源:知乎、脉脉
编辑:小匀

在脉脉“我来爆个料”话题下,有人爆出「字节跳动一实习生删除公司 GB 以下所有机器学习模型」。


一时间话题引起无数程序员围观。


lite模型指的是轻量级的模型,全称TensorFlow Lite,是一种用于移动端设备深度学习的模型。例如分类,分割的相关模型都很小,很多非常有用的模型都属于轻量模型。

舆论中,有人为实习生的「去留」担忧:



也有人为该同学抱不平:


还有吃瓜群众言,「在字节删字节,在头条上头条。」


那么言归正传,这个应该有谁来负责?事情的严重性又是几何呢?

 影响到底大不大?

该楼主评论表示,管理的给子目录加了保护,但是实习生直接删除的是hdfs,还加了 skip trash(删除默认到trash,相当于windows的彻底删除)。


不过有人表示,模型都是离线数据,对线上影响不大。

还有人认为,「说明轻量模型确实没前途了,大规模预训练模型卷起来。」

据传闻,还有传言删了以后,连事故处理群都加了三百多个人。更有员工为了修复加班到3点!


不过,吃瓜群众最关心的莫过于「责任问题」。毕竟,一个实习生能够删除模型,ta的权限何来的呢?

有人爆料称:该实习生实际上不是「手滑」,更不是「手抖」,而是多方问过才下次操作的……


更多的人认为:这锅80%应该判给管理者!


还有人结合近期「字节大小周加班问题」调侃了一下:


权责问题引来讨伐声

问题引发了网友对权责问题的讨论。

据知乎,事故的原因是实习生清理HDFS上的目录,发现一个目录最近更新时间是3月份,就以为这个不用了,多方求证之后得到了这个目录已经没用的结果(绝了),然后删掉了……

直到一个小时后有人发现模型上线不了……

在很多大公司,模型跑完后会放到Hadoop。


但实际上,权限管理目录是个大学问,需要一套大流程。

有人提议,这种情况后续权限控制,或者把skip trash弄掉,或者尽可能把权限拆分到各自的模型上。

总之大部分网友认为,一个实习生不应该承担太多的责任!

其实类似事情还有较为狗血的——2019年AI删库,程序员背锅!


2019年,美国版大众点评Yelp训练了一个用来消除 bug 的神经网络,万万没想到,该网络删除一切,从根本上彻底了实现“bug-free”.



最后,可怜的工程师背了锅。


不小心删库是一种怎样的体验?

据说,程序员一生会删三次库。


在话题「不小心删库是一种怎样的体验?」下,很多人都发表了当年的经历。

比如这位答者:实习的时候删过测试库……


再比如:那感觉天塌下来一样!


还有网友表示:「一辈子难忘!」

多年前(2001年),那还是unix字符界面,半夜我例行维护,我删过一个包含二十万本图书的库…………十分钟后我确认我出错后,我开始冒汗,胃部像是被猛打了一拳开始痉挛,疼的我都坐不住。

好一会我去过道抽了两根烟,才回忆起前天做了全系统备份,丢的数据不多!

当然,恶意删库的现象也不在少数。

2020 年 2 月微盟员工恶意破坏公司数据,让微盟的市值一天之内蒸发了超 10 亿元。不久前,链家网一名员工恶意删除了公司 9TB 数据,造成公司财务系统服务器应用程序出现故障无法登录。不过,这种严重的恶性事件,都让他们受到了法律的审判。

不过,如果此次字节lite模型删除真的没影响线上,某种程度上,这还及时暴露了问题,甚至可能避免了以后更大的错误。

参考资料:
http://www.zhihu.com/question/466656197
https://www.zhihu.com/question/58802374

-End-

最近有一些小伙伴,让我帮忙找一些 面试题 资料,于是我翻遍了收藏的 5T 资料后,汇总整理出来,可以说是程序员面试必备!所有资料都整理到网盘了,欢迎下载!

点击👆卡片,关注后回复【面试题】即可获取

在看点这里 好文分享给更多人↓↓

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/117500
 
256 次点击