Automatic extraction and quantitative analysis of characteristics from complex fractures on rock surfaces via deep learning
基于深度学习的岩石表面复杂裂缝特征自动提取与定量分析
岩体节理与裂隙的检测与评估对于工程岩体稳定性评价和地质灾害防治至关重要。为解决裂隙智能提取与定量化难题,开发了一种基于深度学习的复杂岩石裂隙分割网络(CRFSegNet),并结合多种特征计算方法。在自建的自然与爆破诱发裂隙数据集上进行了消融实验和多模型对比。对比实验中,CRFSegNet在可视化效果和评价指标上表现优异,平均交并比达到83.90%。该网络能够有效捕捉裂隙的复杂特征,展现了方法的鲁棒性和竞争力。基于分割结果和提出的特征计算方法,获取了裂隙的长度-倾角、表面裂隙率和分形维数等特征。通过对四幅图像的特征获取分析,发现基于CRFSegNet的结果与实际基本吻合,表明该方法是一种有效的智能识别与特征获取途径。
识别岩石裂隙并获取其特征是众多水电边坡和地下隧道工程前期工作中的关键步骤。裂隙的存在会削弱岩体的质量和稳定性,导致其物理力学性质发生显著变化,并在特殊开挖条件下增加灾害风险。然而,当前研究中,研究者普遍关注岩石裂隙的识别,但缺乏对裂隙特征的量化与获取。正如Yuan等人所述,识别岩石裂隙后,获取并定量评估裂隙特征至关重要。基于裂隙特征的结果可用于推断岩体的发育状况,并为不同情况提供施工应对方案,这对实际工程具有重要意义。
随着计算机科学的快速发展,岩石裂隙的识别与特征获取逐渐从人工方法转向图像处理技术。基于人工方法的岩石裂隙测量通常需要尺子和罗盘,常用技术包括扫描线法和窗口采样法。虽然人工测量方法精度较高,但存在诸多局限性:需要专业知识、个体间差异大、耗时耗力,且调查人员在危险环境中工作面临挑战。图像处理方法包括深度学习(DL)方法和传统数字图像处理(DIP)方法。最初,研究者逐渐采用传统DIP技术将捕获的图像转换为灰度图像,然后应用边缘检测算法(如Canny和Hough)识别岩石裂隙的边界。DIP方法在简单、无噪声的图像上表现良好,但在处理复杂图像、噪声干扰、光照变化或需要高级语义理解时存在局限性。此外,DIP方法中的阈值选择具有经验性和随机性,识别结果精度低,给批量处理带来挑战。
与DIP技术相比,深度学习(DL)方法具有端到端、批量处理和在复杂场景中应用的优势。对于裂隙(或裂缝)任务,语义分割更关注裂隙的像素级分类,而不是区分单个对象,与DL中的分类和目标检测相比,语义分割模型设计更简单。如Yuan等人和Lee等人使用DeepLabV3+进行语义分割,识别不同场景下的岩石裂隙,但缺乏基于分割结果进一步获取裂隙特征的工作。因此,利用语义分割生成的裂隙识别结果进一步获取裂隙特征是一项具有挑战性和重要性的任务。
从裂隙识别与特征获取的角度出发,本研究开发了一种复杂岩石裂隙分割网络(CRFSegNet),能够准确分割复杂裂隙,并基于分割结果量化裂隙特征。本研究的主要贡献如下:
1. CRFSegNet模型的开发
:CRFSegNet模型旨在分割复杂岩石裂隙,具有低计算复杂度的MetaFormer骨干网络、用于特征增强与融合的颈部结构、多尺度金字塔特征融合的解码器以及用于辅助计算的辅助头(AH)。此外,开发了分类-区域损失函数,以提高模型的鲁棒性和分割性能。
2. 复杂岩石裂隙像素级特征的量化:构建了包含自然和爆破诱发裂隙的复杂裂隙数据集。CRFSegNet准确识别这些裂隙,并采用多种DIP技术定量分析裂隙长度、面积、宽度、倾角、密度、裂隙面率和分形维数,进一步评估岩体的发育、完整性和质量。
3. 复杂岩石裂隙的定位:语义分割输出提供了复杂岩石裂隙位置的详细信息。CRFSegNet在定位上具有更高精度,帮助检查人员准确解读裂隙位置。此外,采用弱监督技术进一步优化裂隙定位,增强CRFSegNet预测结果的可靠性。
Fig. 1. The overall structure of CRFSegNet.Fig. 2. The structure of PoolFormer.Fig. 3. The structure of FPN.Fig. 4. The structure of MPFFM.Fig. 5. Comprehensive image pre-processing for dataset preparation: (a) A portion of the original image; (b) cropped images with a resolution of 300 × 300 pixels; (c) image annotation performed using LabelMe; (d) generation of ground truth from the JSON files; (e) examples of four types of data augmentation. (c) represents the results after annotation, which geological experts have checked and verified.Fig. 6. During the training process of CRFSegNet, (a) loss curve, while (b) evaluation metric curve.Fig. 7. The comparison of the Params, FLOPs, FPS, and model size for the seven models.Fig. 8. Evaluator heat maps for (a) background and (b) fracture in eight cases.Fig. 9. Composite metrics for different models and memory occupied for inference.Fig. 10. The original image, the GT and the prediction of the original image with different models.
Fig. 11. CRFSegNet-based identification results of (a) natural fractures and (b) blast-induced fractures and their confusion matrix evaluation results.Fig. 12. Original image, CRFSegNet-based recognition results, overlay results and interpretation of segmented head recognition features in the CRFSegNet decoder using Grad-CAM, and Sobel and Canny-based recognition results.Fig. 1
3. Quantitative measurements of complex fractures: (a) overall length; (b) area; (c) average width; (d) maximum width.Fig. 14. Typical test sample fracture segmentation results and quantitative comparison results: (a) simple image, (b) complex image.Fig. 15. The analysis of the development of fractures in four types of images. Panels I, II, III, and IV represent the following: Rose diagrams of length-dip, fracture density distribution, surface fracture rate distribution, and fractal dimension of fractures.Fig. 16. Results from different training iterations of CRFSegNet.
准确识别岩石裂隙并量化其特征对于边坡开挖、洞室爆破和岩体质量评级等应用至关重要。本研究的主要贡献包括提出了一种用于复杂岩石裂隙分割的语义分割模型CRFSegNet,并量化了裂隙长度、面积、宽度、倾角、密度、表面裂隙率和分形维数等特征。本研究的主要结论如下:
1. 提出CRFSegNet模型:设计了一种语义分割模型,采用低计算复杂度的MetaFormer编码器和MPFFM解码器。所提出的CRFSegNet模型用于分割复杂裂隙。编码器结构中的token mixer采用平均池化,显著降低了计算复杂度,同时确保了准确的特征提取。颈部采用FPN进行特征增强与融合,编码器使用MPFFM。引入了辅助头(AH)用于训练辅助,并采用分类-区域损失函数(LCR)提高模型的鲁棒性和准确性。
2. 构建复杂岩石裂隙数据集并进行实验验证:对收集的自然和爆破诱发裂隙进行预处理和人工标注,构建了复杂岩石裂隙数据集。在该数据集上的消融实验验证了CRFSegNet各组件的优势。与多种模型的对比实验表明,CRFSegNet达到了最先进的性能,MIoU、MF1、MP和MR分别达到83.90%、90.64%、91.05%和90.25%。CRFSegNet在识别复杂裂隙时的可视化结果更详细且更接近实际情况,表明其鲁棒性和适用性优于其他模型。
3. 评估复杂裂隙特征:利用图像处理技术、优化算法和ENA,提出了FSA、变内接圆和热图量化等方法,用于评估复杂裂隙特征。在所有测试集上,特征的R²值分别为0.9972、0.9954、0.9967和0.9506。长度-倾角玫瑰图、裂隙密度热图、表面裂隙率热图和盒计数分形维数方法为单幅图像提供了重要裂隙不连续性的定量描述,反映了裂隙发育程度、岩体完整性和质量。定性和定量分析表明,所提出的方法能够准确有效地评估复杂岩石裂隙特征,与实际条件高度吻合。
尽管所提出的复杂裂隙分割与量化方法已证明其有效性,但仍有一些局限性需要关注或改进:(1)模型的改进与创新是无限的,因此在获得满意模型后,增强模型鲁棒性并将其应用于实际工程场景至关重要。(2)岩石裂隙的特征、变量或方面存在一定的不确定性,这些不确定性在实际工程中无法完全消除。
在满足辅助工程师需求的同时,应尽量减少不确定性的影响,尽可能接近最真实的条件。
Li M ,Chen M ,Lu W , et al.Automatic extraction and quantitative analysis of characteristics from complex fractures on rock surfaces via deep learning[J]. International Journal of Rock Mechanics and Mining Sciences, 2025,187106038-106038.https://doi.org/10.1016/J.IJRMMS.2025.106038本文仅用于学术交流与分享,版权属于出版商,如有任何疑问,请与我们联系。