提出使用范畴论图式形式主义表达机器学习模型,以此比较不同注意力机制,并通过穷举重组发现注意力内部结构对性能影响不大。 [LG]《On the Anatomy of Attention》N Khatri, T Laakkonen, J Liu, V Wang-Maścianica [Quantinuum] (2024) 网页链接 #机器学习##人工智能##论文#