免费送4本书,参与方式:关注下方公众号并“大模型科技说”公众号 后台回复关注截图,并本文末留言,我们随机抽取4位幸运读者送书,截止时间5月25号晚24点。
一本好的教材兼备两大特质——体量恢弘、思想深邃。由世界公认的机器学习专家Christopher M.Bishop耗时16年精心打磨而成的《深度学习:基础与概念》,就是这样一本经典的深度学习入门书,随着大模型的发展,这本书与时俱进涵盖 Transformer、LLM、GAN、扩散模型等新技术新进展,更适合当下。
本书一经问世,就得到2024年诺贝尔物理学奖和2018年图灵奖得主Geoffrey Hinton、2018图灵奖得主Yann LeCun和2018图灵奖得主Yoshua Bengio这三位人工智能领域巨头联袂推荐,迅速攀升至亚马逊最畅销书籍排行榜的首位,Springer Nature 2024 年度最畅销著作的荣誉更是让它在学术出版界风头无两,被业界公认为 “深度学习领域迫切需要的现代教材”。
十几年前,Bishop大神的Pattern Recognition and Machine Learning(PRML)以贝叶斯视角揭示了机器学习算法的本质,被称为该领域的“圣经”。经典前作封神,新作再续传奇,如今,他推出姊妹篇《深度学习:基础与概念》,系统梳理了深度学习近20年来的理论基础与关键进展,重构深度学习理论根基。
大神出品必不凡!接下来让我们一起翻开这本领域巨著,看看他这次又带来了哪些超硬核的干货!
能打造出一本又一本领域巨著,作者必定要功力深厚。
本书两位作者Christopher M.Bishop和Hugh Bishop,就是深耕人工智能领域数十年的资深专家。
Christopher M.Bishop是爱丁堡大学计算机科学名誉教授和剑桥大学达尔文学院院士,现任微软研究院剑桥AI for Science (AI4Science)部门的技术院士兼总监,并且是英国人工智能委员会的创始成员,曾任首相科学技术委员会成员 (2019)。
Hugh Bishop是Christopher M.Bishop的儿子,是伦敦一家基于端到端深度学习的自动驾驶公司Wayve的应用科学家,负责设计和训练深度神经网络。他拥有剑桥大学工程系机器学习和机器智能专业硕士学位,以及杜伦大学计算机科学工程学硕士学位。
Christopher M.Bishop在1996年出版过关于神经网络的Neural Networks for"Pattern Recognition(NNPR)一书,推动了神经网络作为模式识别工具的应用,备受赞誉;2006年又出版了从贝叶斯主义角度诠释机器学习的名著Pattern Recognition and Machine Learning(PRML),是很多机器学习爱好者的启蒙图书。
PRML的出版早于深度学习革命,虽未涵盖深度学习内容,却因其贝叶斯框架的普适性至今仍被奉为经典。不过Bishop 大神早就觉得是时候更新这本书,出第2版,增加一些关于深度学习的内容了。
在 COVID-19 期间,他与儿子开启了这个合作写书项目。但他们很快意识到,所需要的不是在 PRML 上增加几章,而是整个领域已经发生了如此大的变化。
而且,2020年,Bishop大神与儿子启动修订计划,却意识到领域变革远超预期。他们也不想写一本只是不断累积越来越多的材料的书,那会变成一本巨大的、庞杂的书籍。
Bishop大神认为一本书的价值在于提炼,在于它将你的注意力吸引到特定的事物子集上,重点在于“提炼”而非“堆砌”。最终,他们放弃简单增补,转而打造全新著作《深度学习:基础与概念》(DLFC)。
ChatGPT爆火后,他们抢抓时机,于2023年NeurIPS会议前出版新书,回应全球对AI底层原理的迫切需求。该书发布仅两个月,在Springer平台的访问量就高达63k,在海外AI圈引发学习热潮。
▲英文原书在世界最著名、最有影响力的AI和机器学习会议——神经信息处理系统大会(NeurIPS)上备受关注
考虑到国内的读者同样迫不及待地想要读到这本巨著,为保证翻译质量,我们特邀Momenta 研发负责人、CSDN &《新程序员》首席内容顾问邹欣,北京理工大学计算机学院特别副研究员阮思捷,中国人工智能领军科学家、上海市人工智能社会治理协同创新中心研究员刘志毅,北京理工大学电子政务研究院执行院长、计算机学院特聘教授王树良等一批AI领域大咖翻译本书。
终于,这本全面系统的“深度学习领域迫切需要的现代教材”能与我们见面了。
作者在前言中提到:“大语言模型正在迅速演进,然而其底层的Transformer架构和注意力机制在过去5年基本保持不变,并且机器学习的许多核心原则已被人们熟知数十年。”
我们只有吃透这些“不变”的原理,才能不被眼花缭乱的“震惊”迷惑。
正是基于这个原则,本书的编排兼具“新”(涵盖LLM、扩散模型等)与“深”(理论扎实),帮助深度学习的新手及有经验的从业者全面理解支撑深度学习的基础理论,以及现代深度学习架构和技术的关键概念,为读者未来在专业领域的深造打下坚实的基础。
如果你读过PRML,读本书时肯定会觉得似曾相识,它们的结构其实非常接近,你可以理解为作者用这十多年来领域的新进展重塑了PRML,就得到了本书。
本书可以看作PRML的“伴随读物”,采用了PRML中的一部分相关内容并进行了改写,以更专注于深入学习所需的基础概念,确保内容能自成一体。例如,PRML只用了一章讲神经网络,本书用了几章的篇幅深入讲解,体现了时代范式的变迁。
比如,由固定非线性基函数的线性组合构成的线性回归模型可以表达为单层权重和偏置参数的神经网络(第4章)、基于基函数线性组合的分类模型也可以视作单层(神经)网络(第5章)、具有多层可学习参数的神经网络:前馈网络(feed-forward network)或多层感知机(multi-layer perceptron)(第6章)等。
本书从概率、统计和计算等多个角度交叉讲解算法和模型,强调了通过可解释性和可计算性来模拟智能的本质。读者在阅读过程中可能会体验到类似于大语言模型带来的“顿悟时刻”(Aha Moment),这是一种在人类认知中突然出现的、非线性的解决问题的美妙体验。
近年来,人工智能发展迅速,大语言模型的出现更是推动了人工智能向更高层次发展,而这一切的基础都源于神经网络和深度学习。
本书全面系统地介绍了神经网络和深度学习的相关知识,不盲目追逐可能很快会过时的热门架构,而是注重基础性和持久价值,重点关注那些经得起时间考验的方法。书中涵盖了 Transformer、LLM、GAN、扩散模型等热门架构,直击 ChatGPT 技术内核,为读者进一步学习、应用和研究人工智能提供了坚实的技术基础。
本书的亮点在于,它不仅包含新的内容,还巧妙地将这些内容融入清晰的知识体系中,实现了在变化中体现不变的本质,让读者能够清晰地看到技术的发展脉络,这正是 Bishop大神的高明之处。
本书全面且深入地呈现了深度学习领域的知识体系,系统梳理了该领域的核心知识,阐述了深度学习的关键概念、基础理论及核心思想,剖析了当代深度学习架构与技术。
本书首先介绍深度学习的发展历程、基本概念及其在诸多领域(如医疗诊断、图像合成等)产生的深远影响,继而深入探讨支撑深度学习的数学原理,包括概率、标准分布等。
在网络模型方面,从单层网络逐步深入多层网络、深度神经网络,详细讲解其结构、功能、优化方法及其在分类、回归等任务中的应用,同时涵盖卷积网络、Transformer等前沿架构及其在计算机视觉、自然语言处理等领域的独特作用。
本书还对正则化、采样、潜变量、生成对抗网络、自编码器、扩散模型等关键技术展开深入分析,阐释其原理、算法流程及实际应用场景。基本上我们能用到的深度学习知识都包含在本书的讨论范畴中。
尽管本书篇幅宏大,但其深入浅出的表述和大量案例的使用,使得复杂概念易于理解,比如,第1章用一个案例引出机器学习的历史和基础概念。
本书分20章,每章聚焦一个主题,内容相互独立又线性衔接,前文为后文奠基。这种结构便于知识消化与吸收,无论是用于本科生或研究生的机器学习课程教学,还是为深度学习研究者、自学者提供参考,都非常合适。
本书内容绝非浅尝辄止。面对深度学习知识的广泛性与快速迭代,作者力求深入,提炼关键思想与基础概念,这些内容在领域内经久不衰。只有掌握核心原理,才能从模仿应用跃升至自主创新。
同时作者认为,扎实的数学和算法功底能让读者将深度学习技术灵活应用于新场景,例如,图神经网络在社交与生物信息学中的应用,以及利用对流标准化和结构化分布处理非规范数据,助力前沿突破。
正因如此,本书获得读者及业内人士的广泛认可和高度评价,在美亚上获得4.5分的评分。
国内外人工智能领域各专家、教授都对本书给予高度赞赏。
本书旨在讲清概念,强调现实中用得上的技术,而非抽象的理论。对于复杂概念,会结合文字、图表、公式等多种形式呈现,帮助不同背景的读者理解。
书中专门开辟板块总结关键算法,这些总结虽未提升算法的计算效率,但通过补充数学说明,可以助力不同背景的读者理解书中的内容。
从第2章开始,每章最后都会给出一套设计好的习题,每道习题按难度分级,从几分钟就能完成的简单的一星级(*)到明显更复杂的三星级(***),旨在帮助读者巩固书中解释的关键思想或以重要方式扩展和泛化它们。
本书配有一个网站(https://www.bishopbook.com),用于提供习题解答、可下载图表等配套素材。
就像一位读者分享的那样:Bishop大神的书适合你在不同的学习阶段反复地读,直到你发现他讲的确实都是基础,这才能读出精妙之处来。
如果你对深度学习感兴趣,那不妨拿起本书,探索其深邃思想,开启AI世界的全新认知。