社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  Git

GitHub的R包毕竟没那么可靠,你要学会自己解决报错

生信技能树 • 4 年前 • 692 次点击  

最近又需要使用一个肿瘤外显子看cnv的R包,根据全局的vcf文件,就是FACETS,发表该包的文章是:FACETS: allele-specific copy number and clonal … - NCBI - NIH

是大名鼎鼎的MSKCC单位的研究人员开发的, 作者:R Shen - ‎2016 - ‎被引用次数:189 - ‎相关文章

2016年6月7日 - (1) Department of Epidemiology and Biostatistics, Memorial Sloan-Kettering Cancer Center, New York, NY 10065

发表已经很久了,以前安装FACETS没啥问题,两年过去了,这个包还在GitHub上面,我电脑系统都升级好几次了,R语言本身也是一个非常大的变革,现在需要重新安装它!然后就遇到报错,如下:

creating vignettes (8s)
   --- re-building ‘FACETS.Rnw’ using Sweave
   Loading required package: pctGCdata
   Error: processing vignette 'FACETS.Rnw' failed with diagnostics:
   Running 'texi2dvi' on 'FACETS.tex' failed.
   --- failed re-building ‘FACETS.Rnw’

   SUMMARY: processing the following file failed:
     ‘FACETS.Rnw’

   Error: Vignette re-building failed.
   Execution halted
Error: Failed to install 'facets' from GitHub:
  System command errorexit status1, stdout + stderr (last 10 lines):
E> Loading required package: pctGCdata
E> Error: processing vignette 'FACETS.Rnw' failed with diagnostics:
E> Running 'texi2dvi' on 'FACETS.tex' failed.
E> --- failed re-building ‘FACETS.Rnw’
E> 
E> SUMMARY: processing the following file failed:
E>   ‘FACETS.Rnw’
E> 
E> Error: Vignette re-building failed.
E> Execution halted

很明显,是作者包里面的一个说明文档有问题, ‘FACETS.Rnw’ 其实自行下载其源代码,然后删除 ‘FACETS.Rnw’即可,说明书本身不影响软件功能,删除它其实无伤大雅!

自行下载R包源代码编译

因为是从GitHub下载,所以网速很重要:git clone https://github.com/mskcc/facets

Cloning into 'facets'...
remote: Enumerating objects: 11, done.
remote: Counting objects: 100% (11/11), done.
remote: Compressing objects: 100% (10/10), done.
remote: Total 748 (delta 1), reused 4 (delta 1), pack-reused 737
Receiving objects: 100% (748/748), 27.04 MiB | 5.44 MiB/s, done.
Resolving deltas: 100% (448/448), done.

下载成功后删除 ‘FACETS.Rnw’即可,然后重新编译

** R
** inst
** byte-compile and prepare package for lazy loading
** help
*** installing help indices
** building package indices
** installing vignettes
** testing if installed package can be loaded from temporary location
** checking absolute paths in shared objects and dynamic libraries
** testing if installed package can be loaded from final location
** testing if installed package keeps a record of temporary installation path
* DONE (facets)

可以看到很轻松就安装成功啦,其实就是需要你仔细,认真读报错信息,思考。

其实它在2018有一个更新

不过我没有时间和精力试用了,如果大家也做肿瘤外显子呢,不妨去学习一下。值得提醒的是,如果你重新设计肿瘤相关外显子项目,最好是保证平均测序深度大于200。

If using facets-suite in a publication, please cite:
Bielski, C.M., et al. "Widespread Selection for Oncogenic Mutant Allele Imbalance in Cancer." Cancer cell (2018). PMID: 30393068

当然了,我在GitHub的包同样的不那么可靠

我在2019年的尾巴推出3个R包,目前都是托管在GitHub,暂时没有时间整合后发布在bioconductor,大家只好将就着使用吧!

  • 第一个是整合全部的bioconductor里面的芯片探针注释包。

  • 第二个是整合全部GPL的soft文件里面的芯片探针注释包。

  • 第三个是下载全部的GPL的soft文件里面的探针碱基序列比对后注释包。

配合着详细的介绍:

因为这些包暂时托管在GitHub平台,但是非常多的朋友访问GitHub困难,尤其是我打包了好几百个GPL平台的注释信息后, 我的GitHub包变得非常臃肿,大家下载安装困难,所以我重新写一个精简包。也在:芯片探针ID的基因注释以前很麻烦 和 :芯片探针序列的基因注释已经无需你自己亲自做了, 里面详细介绍了。最重要的是idmap函数,安装方法说到过:芯片探针序列的基因注释已经无需你自己亲自做了,  使用起来也非常简单:

library(AnnoProbe)
ids=idmap('GPL570',type = 'soft')
head(ids)

仅仅是一句话,就拿到了这个平台的探针的注释信息。需要注意的是,这个函数的type参数,其实是有3个选择,这里我演示的是选择soft这个来源的基因注释信息。

并不是所有的平台都是有soft注释,也不是所有的平台都被我的这个工具囊括哦。

写在最后

我们生信技能树的2019年终总结提到的用心打磨,气质初具,认真耕耘粤港澳大湾区科研市场,并且值得你推荐给有需要朋友的课程2020全年欢迎加入学习:广州专场(全年无休)GEO数据挖掘课,带你飞(2.8-2.9)

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/53661
 
692 次点击