#机器学习# 【未来的历史学家将是一个程序员?已有专家使用机器学习研究历史文献】
1531 年,夜幕笼罩下的威尼斯,在一个印刷车间里,一名学徒正努力设计#天文学# 教科书中的一页,包括加粗的线条和一幅木刻插图,内容是一个小天使探头观察正在宇宙中移动的形状,这代表了一次月食。16 世纪的图书制作工艺是一个非常耗时的过程,但它可以让知识以前所未有的速度传播。
500 年后,信息正以前所未有的速度不断产生:以 tb 为单位的图像、视频和文本,大量的数字数据几乎实现了立即传播,还会以几乎同样快的速度进行分析,从而使机器学习模型的训练成为可能,并将信息分类。这种信息生产的转变对从艺术创作到药物开发的一切事物的未来都有影响。
但这些进展也使人们有可能以不同的视角看待过去的数据。历史学家已经开始使用机器学习—,特别是深度神经网络,来检查历史文献,包括威尼斯和其他早期现代城市的天文表,它们有的在发霉的档案中历经了几个世纪,还有的因为印刷问题而扭曲难辨。
历史学家说,将现代计算机科学应用于遥远的过去,有助于将更广泛的历史记录建立联系,还可以纠正每次分析一份文件所产生的误解。但它也引入了自带的一些误解,包括机器学习可能会将偏见或伪造内容纳入历史记录的风险。所有这些都给历史学家和其他人提出了一个问题,他们通常认为要通过审视历史来理解现在,但随着机器在未来发挥更大的作用,我们应该把过去交给它们多少?
通过将越来越多的历史文件数字化,#大数据# 正在融入人文学科,比如美国国会图书馆收集的数百万份报纸页面,以及 19 世纪芬兰档案馆的法庭记录。对研究人员来说,这既是一个问题,也是一个机会:有太多的信息,我们没有好的方法来筛选它们。
随着帮助学者们分析复杂性的计算工具的发展,人们已经遇到了这一挑战。2009 年,奥地利科学院教授约翰内斯·普雷塞-卡佩勒(Johannes Preiser-Kapeller)审查了 14 世纪拜占庭教会的决定记录。普雷塞-卡佩勒意识到,理解数百份文件需要对主教的关系进行系统的数字调查,他建立了一个个人数据库,并使用网络分析软件重建他们的联系。
戳链接查看详情:未来的历史学家将是一个程序员?已有专家使用机器学习研究历史文献
1531 年,夜幕笼罩下的威尼斯,在一个印刷车间里,一名学徒正努力设计#天文学# 教科书中的一页,包括加粗的线条和一幅木刻插图,内容是一个小天使探头观察正在宇宙中移动的形状,这代表了一次月食。16 世纪的图书制作工艺是一个非常耗时的过程,但它可以让知识以前所未有的速度传播。
500 年后,信息正以前所未有的速度不断产生:以 tb 为单位的图像、视频和文本,大量的数字数据几乎实现了立即传播,还会以几乎同样快的速度进行分析,从而使机器学习模型的训练成为可能,并将信息分类。这种信息生产的转变对从艺术创作到药物开发的一切事物的未来都有影响。
但这些进展也使人们有可能以不同的视角看待过去的数据。历史学家已经开始使用机器学习—,特别是深度神经网络,来检查历史文献,包括威尼斯和其他早期现代城市的天文表,它们有的在发霉的档案中历经了几个世纪,还有的因为印刷问题而扭曲难辨。
历史学家说,将现代计算机科学应用于遥远的过去,有助于将更广泛的历史记录建立联系,还可以纠正每次分析一份文件所产生的误解。但它也引入了自带的一些误解,包括机器学习可能会将偏见或伪造内容纳入历史记录的风险。所有这些都给历史学家和其他人提出了一个问题,他们通常认为要通过审视历史来理解现在,但随着机器在未来发挥更大的作用,我们应该把过去交给它们多少?
通过将越来越多的历史文件数字化,#大数据# 正在融入人文学科,比如美国国会图书馆收集的数百万份报纸页面,以及 19 世纪芬兰档案馆的法庭记录。对研究人员来说,这既是一个问题,也是一个机会:有太多的信息,我们没有好的方法来筛选它们。
随着帮助学者们分析复杂性的计算工具的发展,人们已经遇到了这一挑战。2009 年,奥地利科学院教授约翰内斯·普雷塞-卡佩勒(Johannes Preiser-Kapeller)审查了 14 世纪拜占庭教会的决定记录。普雷塞-卡佩勒意识到,理解数百份文件需要对主教的关系进行系统的数字调查,他建立了一个个人数据库,并使用网络分析软件重建他们的联系。
戳链接查看详情:未来的历史学家将是一个程序员?已有专家使用机器学习研究历史文献