宏基因组测序数据分析(宏基因组测序分析(十三) 宏基因组分箱)

分箱-binning

宏基因组分箱是指从宏基因组数据中将不同物种的序列分离,将来自同一菌种的序列聚类,得到单个菌株的数据。分箱的对象可以是reads、contig以及gene。

我们常说的binning一般指的是contig binning,侧重于单菌基因组的获得,目标是从宏基因组数据中提取出单菌的draft genome。

binning本质是聚类,聚类操作基于下面的数据:

核酸组成(不同物种间核酸组成存在差异)丰度信息(对contig来说就是测序深度,来自同一个物种的片段测序深度应该相近。)

「分箱流程」

「分箱软件」Metabat2,maxbin2 和 concoct 是三款常用的分箱软件;需要准备【我.爱.线.报.网.】的输入数据为宏基因组拼接结果和质控过滤的测序数据。

metabat2 分箱

# 构建index bowtie2-build A1.contigs.fa A1.contigs.db # 比对并排序 bowtie2 –threads 6 -x ./A1.contigs.db \ -1 ./A1_1.fq.gz \ -2 ./A1_2.fq.gz 2>A1.map.log | \ samtools sort -o A1.sort.bam # 运行分箱 runMetaBat.sh A1.contigs.fa \ # 输入, 组装结果 A1.sort.bam \ # 输入,bam文件 –minContig 1000 # contig最小长度

maxbin2 分箱

# 创建【我.爱.线.报.网.】目录 mkdir A1.bindir # 该软件自动调用bowtie2进行比对 run_MaxBin.pl -contig A1.contigs.fa \ # 输入, 组装结果 -reads ./A1_1.fq.gz \ # 输入,测序数据 -reads2 ./A1_2.fq.gz \ # 输入,测序数据 -out A1.bindir/A1.bin \ # 输出目录 -min_contig_length 1000 \ -thread 6

concoct 分箱

# bowtie2 比对 bowtie2-build A1.contigs.fa A1.contigs.db bowtie2 –threads 6 -x ./A1.contigs.db \ -1 ./A1_1.【我.爱.线.报.网.】fq.gz \ -2 ./A1_2.fq.gz 2>A1.map.log | \ samtools sort -o A1.sort.bam samtools index A1.sort.bam # 数据划分 cut_up_fasta.py -c 10000 -o 0 \ –merge_last \ -b contigs_10K.bed \ A1.contigs.fa > contigs_10K.fa # 生成coverage信息 concoct_coverage_table.py \ contigs_10K.bed ./*.sort.bam > coverage_table.tsv # 运行分箱 concoct –composition_file contigs_1【我.爱.线.报.网.】0K.fa \ # 输入,fasta序列 –coverage_file coverage_table.tsv \ # 输入,coverage信息 -b concoct_output/ \ # 输出,结果目录 –threads 6 \ # 线程数 –read_length 150 \ # read长度 –length_threshold 1000 # contig阈值 # subcontig 合并回原始contig merge_cutup_clustering.py concoct_output/clustering_gt1000.csv \ > concoct_output/clustering_merged.csv # 构建bin输出目录【我.爱.线.报.网.】 mkdir concoct_output/fasta_bins # 提取bin序列 extract_fasta_bins.py A1.contigs.fa \ concoct_output/clustering_merged.csv \ –output_path concoct_output/fasta_bins

推荐阅读

给力项目线报网会员可免费下载 加入会员
友情提醒: 请尽量登录购买,防止付款了不发货!
QQ交流群:226333560 站长微信:qgzmt2
温馨提示:本站提供的一切软件、教程和内容信息都来自网络收集整理,仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负,版权争议与本站无关。用户必须在下载后的24个小时之内,从您的电脑或手机中彻底删除上述内容。如果您喜欢该程序和内容,请支持正版,购买注册,得到更好的正版服务。我们非常重视版权问题,如有侵权请邮件与我们联系处理。敬请谅解!

给TA打赏
共{{data.count}}人
人已打赏
行业资讯

HTTP 错误 429:请求过多 [修复指南]

2024-6-29 22:31:19

行业资讯

中国哲学概论 张学智(中国哲学基础概念:忠信、​笃敬、​忠恕、忠)

2024-6-29 22:51:36

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索