社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

哥大首位华裔女副校长周以真:因果关系是AI和机器学习的下一个前沿领域

DeepTech深科技 • 2 年前 • 436 次点击  



周以真(Jeannette M. Wing)是一位美籍华人计算机科学,也是哥大首位华裔女副校长。她的主要研究领域是形式化方法、可信计算、分布式系统、编程语言等。1993 年她与图灵奖得主芭芭拉·利斯科夫Barbara Liskov)合作,提出了著名的 Liskov 代换原则,是面向对象基本原则之一。

周以真从微软公司离职后来到哥伦比亚大学,她曾担任微软研究院的全球业务副总裁,管理着全球的微软研究实验室。而在加入微软之前,她曾在卡内基梅隆大学任教,并担任计算机科学系主任和计算机科学学院学术事务副院长。

 

(来源:《麻省理工科技评论》)


2006 年,时任卡内基梅隆大学计算机科学系主任的周以真发表了一篇名为《计算思维》的文章,她在文章中指出,使用计算机科学的概念工具来解决人类致力于的所有领域的问题,每个人都将从中受益。


早年,周以真并没有打算学习计算机科学。20 世纪 70 年代中期,她受父亲的启发,进入麻省理工学院学习电气工程专业。


当她发现自己对计算机科学感兴趣时,她打电话给父亲,问计算机会不会是昙花一现。毕竟在当时,这个领域甚至都没有像样的教科书。父亲向她保证不是这样的,于是她义无反顾地换了专业。


就其目前正在推进的“可信人工智能”计划,《麻省理工科技评论》的记者安尼尔·安纳塔斯瓦米(Anil Ananthaswamy)和她进行了对话,以下为交流内容:


问:你是否认为现有的计算方式将会出现转变?


答:肯定的。摩尔定律使我们走了很长一段路。我们将达到摩尔定律的上限,所以并行计算变得非常重要,但阶段性突破在于云计算。


原始的分布式文件系统是一种云计算雏形,在这种系统中,你的文件并不仅仅存在于机器本地;它们还存在于在服务器上的其他地方。云计算采纳了这一思想并且发扬光大,在这一计算架构下,你的数据和计算设备都不在你身边。


下一个变革是关于数据的。在很长一段时间里,我们专注于计算速度,致力于使计算机运转得更快——处理器、CPU、GPU 和更多的并行服务器。我们忽略了数据部分。而现在我们必须密切关注数据方面。


问:这是数据科学领域,你会如何定义这个领域?使用数据存在哪些挑战?


答:我有一个非常简洁的定义。数据科学是一种从数据中提取价值的研究。你不能给我一堆原始数据而指望我按一个按钮就能计算数据的价值。这一过程从收集数据、处理、存储、管理、分析和可视化数据就开始了,最后才是解释结果。我称之为数据生命周期。在这个周期中的每一步都需要做大量的工作。


问:当使用大数据时,经常会出现对隐私、安全、公平和偏见的担忧。如何解决这些问题,尤其是在人工智能中?


答:我正在推动这个新的研究议题。我称之为可信赖的人工智能,这是受到我们近几十年在可信计算方面取得进步的启发。我们所说的可信赖,通常是指安全、可靠性、可用性、隐私性和易用性。


在过去的二十年里,我们取得了很大的进步。我们有一些规范的方法,可以确保一段代码的正确性;也有安全协议来提高特定系统的安全性;还有一些关于隐私的规范化概念。


可信人工智能在两方面提高了要求。如今,我们都在探讨鲁棒性和公平性——鲁棒性意味着如果你扰动输入,输出就不会受到很大的干扰。


我们也探讨可解释性。这些都是我们过去在谈论计算机时从未谈论过的事情。


此外,人工智能系统在本质上是概率性的。过去的计算系统基本上都是确定性的机器:它们是开或关,真或假,是或否,0 或 1。而我们的人工智能系统的输出基本上是概率。


如果我告诉你,你的 X 光片显示你得了癌症,我会说我看到的那个小白点有 75% 的可能性是恶性的。


所以现在我们必须生活在这个充满概率的世界里。从数学的角度来看,它使用了概率思维,并引入了大量的统计学概念和随机推理等。


作为一名计算机科学家,你接受过的训练不是这样思考问题的。所以人工智能系统真的让我们对这些系统的形式推理变得复杂。


问:可信人工智能是你为数据科学家提出的 10 个研究挑战之一,因果关系似乎是另一个大问题?


答:我认为,因果关系是人工智能和机器学习的下一个前沿领域。目前,机器学习算法和模型很擅长于寻找模式、相关性和关联。但它们不能告诉我们:是这个因素导致了那个结果吗?或者如果我做这些事,那么将会发生什么?


所以在计算机科学中还有一整个关于因果推理和推断的领域。几十年来,统计学界一直在研究因果关系。


他们有时会对计算机科学界感到有点恼火,因为我们会认为“哇,因果推理一个全新的想法”,而实际并不是。


所以我确实想赞扬统计界对因果关系的基本贡献,(因为)大数据和因果推理的结合可以真正推动这个领域向前发展。


问:你对数据科学能取得什么成就感到兴奋吗?


答:很多人都狂热于数据科学,因为他们看到,通过在生成、产出、收集数据等环节使用数据科学中的方法,他们的研究领域正在发生重大变化。这是一个非常激动人心的时刻。


支持:王贝贝

参考资料:
https://www.technologyreview.com/2021/10/27/1037134/data-science-challenges-trustworthy-ai/



Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/147603
 
436 次点击