社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

基于少量训练数据的量子机器学习泛化 | 复杂性科学顶刊精选9篇

集智俱乐部 • 1 年前 • 170 次点击  

集智斑图顶刊论文速递栏目上线以来,持续收录来自Nature、Science等顶刊的最新论文,追踪复杂系统、网络科学、计算社会科学等领域的前沿进展。现在正式推出订阅功能,每周通过微信服务号「集智斑图」推送论文信息。


扫描下方二维码,关注“集智斑图”服务号,即可订阅Complexity Express:           

 



Complexity Express 一周论文精选




以下是2022年8月22日-8月28日来自Complexity Express的复杂性科学论文精选。如果Complexity Express列表中有你感兴趣的论文,欢迎点赞推荐,我们会优先组织解读~

目录:

1. 基于少量训练数据的量子机器学习泛化

2. Sycamore 量子优势电路采样问题的求解

3. 基于人群的人脑束-区域连接体及其层级拓扑结构

4. 猛禽通过在密集的空中猎物集群中瞄准固定点来避免混淆效应

5. 细胞极化的强迫和自发对称性破缺

6. 复杂食物网中捕食者-被捕食者生物量的一致标度

7. 联邦非纠缠表征学习在无监督脑异常检测中的应用

8. 同一地点对人类通信网络的影响

9. 哈维飓风造成的气候变化影响中的社会不平等现象



1.基于少量训练数据的

量子机器学习泛化


论文题目:Generalization in quantum machine learning from few training data
论文来源:Nature Communications
论文链接:https://www.nature.com/articles/s41467-022-32550-3


现代量子机器学习(quantum machine learning, QML)方法涉及在训练数据集上对参数化量子电路进行变分优化,然后对测试数据集进行预测(即泛化)。在这项工作中,我们对量子机器学习在有限的 N 个训练数据点上训练后的泛化性能进行了全面研究。我们表明,具有 T 个可训练门的量子机器学习模型的泛化误差在最坏的情况下重新标度为  √T/N 。当只有 K≪T 门在优化过程中发生了重大变化时,我们证明泛化误差提高到 √K/N 。我们的结果意味着,将单元格编译为多项式的本机门(这是量子计算行业的一个重要应用,通常使用指数级大小的训练数据)可以大大加快速度。我们还表明,使用量子卷积神经网络对相变中的量子态进行分类只需要非常小的训练数据集。其他潜在应用包括学习量子纠错码或量子动力学模拟。我们的工作为量子机器学习领域注入了新的希望,因为可以从很少的训练数据中保证良好的泛化性能。

图:量子相位识别的泛化性能。我们采用 QCNN 架构对方程的广义簇哈密顿量 H 的基态进行量子相位识别。通过对 8192 个计算基础测量结果进行采样并将最不频繁的结果作为预测相位来评估 QCNN 分配给 J1-J2 平面中的一个点的相位。(a)可视化了 16 个量子位的 QCNN 性能,用 30 个数据点训练,这些数据点根据分析确定的相图进行标记。蓝色十字表示训练数据点(未显示全部 30 个)。蓝色(红色)圆圈代表正确(错误)分类点。(b)显示,随着训练数据量的增加,训练准确度迅速成为 10,000 个随机采样点上测试准确度的良好预测指标,即测试准确度对训练准确度的依赖性随着斜率随着 N 的增加而近似线性在整个优化过程中,图中不同的点对应了QCNN中不同的参数设置。灰色虚线显示通过随机猜测实现的 25% 的基线准确度。(c)显示,对于不同数量的量子比特,随着训练数据大小的增加,斜率的改善是相似的,这反映了我们的界限预测的 N 对 n 的最坏多对数依赖性。



2.Sycamore量子优势电路

采样问题的求解


论文题目:Solving the Sampling Problem of the Sycamore Quantum Circuits
论文来源:Physical Review Letters
论文链接:https://journals.aps.org/prl/abstract/10.1103/PhysRevLett.129.090502


我们研究了从谷歌的 Sycamore 量子电路(具有目标保真度)的输出分布中产生独立样本的问题,该目标保真度被认为是经典超级计算机无法达到的,并已被用于证明量子霸权优势。我们提出了一种通过仅收缩一次对应张量网络的方法(经典方法)来解决这个问题,并且在生成大量目标保真度不相关的样本方面比现有方法高效得多。对于有 53 个量子比特和 20 个循环的 Sycamore 量子霸权电路,我们从分布中生成了 1*106 个不相关的比特串 s,分布中的近似状态的保真度F≈0.0037。整个即计算大约花费 15 个小时,在 512 个 GPU 的计算集群上。得到的 1 × 106 份样本的缩进代码和缩进顺序已经公开。如果我们的算法能够在具有 ExaFLOPS 性能的现代超级计算机上高效地实现,作者估计理想情况下,仿真将花费几十秒,这比谷歌的量子硬件要快。

图:三维张量网络对应的 Sycamore 量子电路,53 个量子比特,20 个循环。在张量网络中设计了 4个孔来降低收缩复杂度。每个孔洞是通过破坏选定的两量子比特门的两条边和伴随边而形成的,也即,移除整个两量子比特门。



3.基于人群的人脑束-区域连接体

及其层级拓扑结构


论文题目:Population-based tract-to-region connectome of the human brain and its hierarchical topology

论文来源:Nature Communications

论文链接:https://www.nature.com/articles/s41467-022-32595-4


连接组映射了区域到区域的连接,但不提示形成连接的是白质的哪个途径。在这里,我们构建了一个基于群体的束-区域连接体来填补这一信息空白。构建的连接体量化了白质束支配皮质区域的群体概率。结果表明,约 85% 的束到区域之间的连接组条目在个体间是一致的,而其余的(约15%)存在显著的个体差异,需要个体化映射。进一步的皮层区域的层次聚类揭示了基于束-区域连接模式的背侧、腹侧和边缘网络。白质束的聚类结果揭示了关联通路中纤维束系统的分类。这种束到区域的连接体提供了深入了解皮层区域和白质束之间的连接拓扑。这种衍生的层次关系进一步提供了灰质和白质结构的分类。


图:构建基于群体的神经束连接组并推导其层次关系的处理流程。(a)弥散 MRI 数据,使用1065名受试者;(b)对数据进行重构,计算纤维示踪的扩散分布;(c)对于每个受试者,52 个白质束使用自动束束描记;(d)利用皮层包块的皮层区域和每个受试者的白质轨迹来推导连接体基质;(e)每个受试者的结果,根据群体概率构建牵引区连接体;(f)对连接体的行向量进行层次聚类,得到皮层区域的层次关系;(g)对列向量进行层次聚类,推导出白质束的层次关系。



4.猛禽通过在密集的空中猎物集群中

瞄准固定点来避免混淆效应


论文题目:Raptors avoid the confusion effect by targeting fixed points in dense aerial prey aggregations
论文来源:Nature Communications
论文链接:https://www.nature.com/articles/s41467-022-32354-5


人们普遍认为集体行为可以迷惑捕食者,但是对于混淆效应的实证研究往往是缺乏的,集体行为对迷惑捕食者的重要性,也必须取决于捕食者的瞄准机制。在这里我们证明了斯温森鹰Buteo swainsoni和其他猛禽攻击成群的墨哥自由尾蝙蝠鹰Tadarida brasiliensis时,是通过转向成群的空间中的一个固定点,而不是使用针对任何一个个体的闭环追逐。处在捕食者捕食线路上的任何猎物似乎都会保持恒定的方位出发,因此目标选择自然而然地从碰撞的几何形状中产生。我们的研究结果表明,当捕食者从密集的群体中捕获猎物时,捕食者如何通过将转向与目标获取相分离来简化对其感官系统的要求。我们预计,同样的策略将被广泛应用于各种鱼群或其它群体中,在这种情况下,混淆效应更有可能发生在对稀疏群体的攻击中,对于稀疏群体,瞄准和目标获取不能解耦。

图:墨西哥无尾蝙蝠在斯温森鹰袭击期间的群体行为。(A)一个固定的摄像机拍摄的一个来袭的鹰(白色圆圈) ,追踪期间蝙蝠的即时飞行方向(黄色箭头)(黑点)。(B)图中20只蝙蝠的飞行轨迹(黄点)导致了捕捉尝试;飞行轨迹采样间隔为 0.02 秒,最后 5 点用青色突出显示。被老鹰(白色圆圈)攻击的蝙蝠(红色圆圈)的运动轨迹以品红色显示。



5.细胞极化的强迫和自发对称性破缺


论文题目:Forced and spontaneous symmetry breaking in cell polarization
论文来源:Nature Computational Science
论文链接:https://www.nature.com/articles/s43588-022-00295-0
评论:https://www.nature.com/articles/s43588-022-00304-2

打破一个方程的对称性是如何改变其解的对称性的? 在这里,我们系统地研究了减少潜在的对称性(从球形到轴对称)是如何影响细胞极化的原型模型的动力学的,而这是生物空间自组织的一个关键过程。细胞极化的特点是非线性和非局部动力学,但我们克服了这些特点带来的理论挑战,通过引入广泛适用的数值格式,使我们能够有效地研究广泛几何范围内的连续介质模型。在数值结果的指导下,我们发现了一个时间尺度的动态层次,使我们可以将弛豫减少到一个保持面积的测地线曲率流的纯几何问题。通过应用变分结果,我们解析地在一些生物学相关的形状上构建稳态。在此过程中,我们揭示了对称破缺的非平庸解。

图:细胞极化动力学;(a)胞质蛋白自催化非线性结合细胞膜,缓慢的侧向扩散,导致体内表面对称性自发破坏;(b)当一个函数用表面坐标(ξ, η)表示时,跨越极点的自然周期性就消失了。DFS 方法通过对函数的反射和平移恢复了这种周期性,允许使用二维傅里叶级数进行计算;(c)稳态行为表现出依赖于曲面几何的非平凡。有些曲面甚至可以有多种解。黑色的文字表示表面的对称性,蓝色的文字表示稳态解的对称性。



6.复杂食物网中

捕食者-被捕食者生物量的一致标度


论文题目:Consistent predator-prey biomass scaling in complex food webs
论文来源:Nature Communications
论文链接:https://www.nature.com/articles/s41467-022-32578-5

捕食者与被捕食者的生物量之比是营养结构的一个关键因素,通常从食物链的角度进行研究,忽略了可能支配群落结构的能量转移渠道(如杂食)。在这里,我们通过描述 141 个淡水、海洋和陆地食物网的生物量结构来解决这一缺陷,这些食物网跨越了群落生物量的广泛梯度。我们测试了捕食者和被捕食者的生物量之间是否出现了亚线性标度(密度依赖过程的一个潜在信号),在生态系统类型和不同的生物组织水平上。我们发现一个一致的亚线性标度律,即在食物网内,捕食者的生物量与其猎物的总生物量呈近 3/4 的幂指数标度律,也就是说,更多的猎物生物量支持成比例的捕食者生物量。在整个食物网中,捕食者的总生物量与食物网中所有猎物的综合生物量之间出现了类似的亚线性标度律。这些营养结构的一般模式与密度依赖的系统形式是一致的,这种形式在各组织层次的复杂摄食相互作用中保持不变,与生态系统类型无关。

图:跨组织级别的捕食者 - 猎物生物量标度示意图。(a)捕食者-被捕食者幂律指数 k 描述了沿猎物生物量梯度的金字塔形状的相对变化,k=1 表示没有相对变化。(b)自然界中的营养相互作用产生了一个复杂的相互作用网,消费者的营养高度可以采取非整数值。(c)网内标度关系是这样的:每个数据点代表不同捕食者分类群的生物量与他们的猎物的总生物量,在一个单一的食物网中绘制。在所有情况下,所有物种的丰度和平均体质量被用来计算营养生物量。



7.联邦非纠缠表征学习

在无监督脑异常检测中的应用


论文题目:Federated disentangled representation learning for unsupervised brain anomaly detection
论文来源:Nature Machine Intelligence
论文链接:https://www.nature.com/articles/s42256-022-00515-2

随着深度学习的出现和越来越多的使用大脑磁共振成像,研究者们对自动异常分割产生了极大的兴趣,以改善临床工作流程,然而,医学影像的准备是费时和昂贵的。此外,由于隐私法规的限制,数据往往分散在许多机构中。在这里,作者介绍了 FedDis 对来自 4 个不同机构的 1,532 个健康磁共振扫描进行无监督的深度卷积自动编码器的协作训练,并评估其在识别来自 6 个不同机构的共 538 卷的病理,如多发性硬化、血管病变、低和高级别肿瘤/胶质母细胞瘤方面的性能。为了减轻不同机构之间的统计异质性,作者将参数空间分解为全局(形状)和局部(外观)。四个研究所联合训练形状参数,以模拟健康的大脑解剖结构。每个机构都在本地训练外观参数,以允许客户特定的全局领域不变特征的个性化。作者已经证明他们的协作方法FedDis在不需要注释或共享私人局部数据的情况下,对多发性硬化的异常分割结果提高了 99.74%,对血管病变的提高了 83.33%,对肿瘤的提高了40.45%。作者发现,FedDis 对共享健康和异常数据的研究机构尤其有益,对多发性硬化病变和脑肿瘤的局部模型性能提高了高达 227% 和 77%。

图:架构总述;作者在多客户机上协作训练一个神经网络,每一个都有其对应的本地数据集,对于每一个训练轮次,各个客户机都只将其外观数据发送到服务器而不共享私人的本地数据。服务器收集了全部的参数,然后将更新后的全局模型参数传回。作者以无监督的方式训练神经网络,而不需要额外的专家注释。在此过程中,作者通过学习压缩并重建健康样本来模拟健康的人类大脑解剖结构。



8.同一地点对人类通信网络的影响


论文题目:The effect of co-location on human communication networks
论文来源:Nature Computational Science
论文链接:https://www.nature.com/articles/s43588-022-00296-z
评论:https://www.nature.com/articles/s43588-022-00302-4


在通信网络中重新连接纽带的能力对于大规模的人类合作和新思想的传播至关重要。我们表明,在新冠疫情封锁期间,由于研究人员缺乏同地办公的机会,导致北美一所大型大学的电子邮件网络在 18 个月内失去了 4800 多条弱关系(社会系统中遥远部分之间的联系,这些联系使新信息得以传播)。此外,我们发现,通过混合工作模式重新引入部分同地办公,促进了弱关系的部分再生。我们通过一个基于物理距离的模型来量化同地办公对形成纽带的影响,该模型能够重现所有的经验观察。结果表明,不在同一地点的员工不太可能形成纽带,从而削弱了工作场所的信息传播。这样的发现有助于更好地理解人类交流网络的时空动态,并帮助那些正在走向实施混合工作政策的组织评估一个富有成效的工作环境所需的最低限度的当面互动。

图:模型机制说明。在我们的关系选择模型中,两个人互动的概率取决于四个关键机制:共同定位、两人是否属于同一个研究单位、两人是否有相互联系以及他们过去的交流模式。



9.哈维飓风造成的气候变化影响中的

社会不平等现象


论文题目:Social inequalities in climate change-attributed impacts of Hurricane Harvey
期刊来源:Nature Communications
论文链接:https://www.nature.com/articles/s41467-022-31056-2

气候变化增加了极端天气事件的严重性,例如飓风期间的强降雨。但到目前为止,很少有研究调查气候变化导致的极端天气事件是否会影响社会公平性,以及会带来多大程度的社会不平等。研究者使用气候变化归因科学和水文洪水模型,来估计德克萨斯州哈里斯县在哈维飓风期间因气候变化引发的洪水强度和损失。利用详细的地块与人口普查区域的社会经济数据,揭示与这些气候变化影响相关的社会空间特征。研究表明,如果没有气候变化,目前 30%-50% 被洪水淹没的住房本不会被洪水淹没。Latina/x/o 社区尤其受到气候变化的影响,特别是低收入的 Latina/x/o 社区和以及那些位于联邦应急管理局所管辖的冲积平原之外的社区。因此,该研究的重点是气候公平性挑战,这些挑战不仅关系到未来气候变化引发的各类风险,还包括对弱势群体造成的不公平影响。

图:气候变化导致的洪水地图。每个六边形表示在哈维飓风期间,如果没有气候变化的额外影响,德克萨斯州哈里斯县本不会被淹的住房数量。





关于Complexity Express




Complex World, Simple Rules.
复杂世界,简单规则。
由于学科交叉融合,大量针对复杂系统的研究成果散落在人工智能、统计物理、网络科学、数据科学、计算社会科学、生命科学、认知科学等等不同领域的期刊会议中,缺乏整合。

 

为了让大家能及时把握复杂系统领域重要的研究进展,我们隆重推出「Complexity Express」服务,汇总复杂系统相关的最新顶刊论文。

 

Complexity Express 是什么?

Complexity Express 每天爬取复杂系统领域最新发表的顶刊论文,每周通过“集智斑图”服务号汇总推送。
 
进入 Complexity Express 页面即可随时查看顶刊论文更新,你也可以通过微信接收研究更新推送和一周汇总。

               


Complexity Express 为谁服务?

  • 如果你是复杂系统领域的研究者,可获得重要论文上线通知,每周获取最新顶刊论文汇总。

  • 如果你是复杂系统领域的学习者,可了解学界关注的前沿问题,把握专业发展脉络。

  • 如果你是传统的生命科学、社会科学等学科中的研究者/学习者,可以从复杂科学和跨学科研究中获得灵感启发。

  • 如果你是关注前沿研究发现的知识猎手,可获得复杂系统研究对自然和人类世界的最新洞见。
Complexity Express 栏目也是集智俱乐部公众号的主要选题来源,诚挚邀请你订阅,与我们信息同步。
 

Complexity Express 论文从哪里来?

考虑复杂系统研究往往属于跨学科工作,我们主要抓取综合类和泛物理类/计算机类的顶级期刊,从每周新发表的数百篇论文中精选出与复杂系统相关的论文。
 
Complexity Express 参考影响因子和学者口碑,选择了如下期刊,每日爬取其论文更新:
  • Nature

  • Science

  • PNAS

  • Nature Communications

  • Science Advances

  • Physics Reports

  • Physical Review Letters

  • Physical Review X

  • Nature Physics

  • Nature Human Behaviour

  • Nature Machine Intelligence

  • Review of Modern Physics
  • Nature Review Physics
  • Nature Computational Science
  • National Science Review
  • 更多期刊持续增补中,欢迎推荐你认为重要的期刊!
 
如果你在 Complexity Express 中发现了感兴趣的论文,请立刻“点赞”!每周最高赞的论文,集智编辑部将组织专业解读~
 

Complexity Express 追踪哪些领域?

我们力求兼顾热点追踪与领域覆盖,目前筛选的论文主要集中在如下与复杂性关系密切的领域:
  • 复杂系统基本理论
  • 复杂网络方法及应用
  • 图网络与深度学习
  • 计算机建模与仿真
  • 统计物理与复杂系统
  • 量子计算与量子信息
  • 生态系统、进化、生物物理等
  • 系统生物学与合成生物学
  • 计算神经科学与认知神经科学
  • 计算社会科学与社会经济复杂系统
  • 城市科学与人类行为
  • 科学学
  • 计算流行病学
  • 以及一些领域小众,但有趣的工作
 
由于复杂性研究领域横跨多个学科,研究论文散落在不同的期刊上,很难不重不漏地把握最新工作。针对复杂性领域的论文筛选,我们专门设计了算法。经过数月的训练迭代优化,目前对上述领域爬取准确率达到90%以上。
 
将来我们还会根据你的具体研究领域,推出研究分类与个性化的订阅服务,敬请期待!
 
由于复杂性领域涉及的论文关键词和研究问题纷繁复杂,所以算法难免有不成熟的地方,如果你发现我们有漏掉的重要论文,或者爬到了领域有偏差的论文,欢迎联系我们(小助手微信:swarmaAI),帮助我们持续优化算法。

如果你对科学学、计算术语学等感兴趣并有代码能力,欢迎报名成为集智算法志愿者/实习生(具体请邮件联系算法组负责人huqiao@swarma.org)

如果你对复杂科学及相关跨学科研究有长期兴趣,并乐于解读分享,欢迎加入集智作者团队(具体请邮件联系编辑部负责人liupeiyuan@swarma.org)




更多论文




更多复杂性顶刊论文,请到Complexity Express页面查看。订阅即可每周获取更新提醒。
       


点击“阅读原文”,追踪复杂科学顶刊论文

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/146621
 
170 次点击