Metagenomic Krona Chart — 元基因组Krona图表
v1.0.0使用 `metagenomic-krona-chart` 分析数据,采用可重复的工作流程、明确的验证和结构化输出,以便于审阅的解释。
运行时依赖
安装命令
点击复制技能文档
元基因组Krona图 何时使用 当任务是生成交互式的Krona图(sunburst图)用于元基因组样本时,请使用此技能。对于需要明确假设、有界范围和可复现输出格式的数据分析任务,请使用此技能。当您需要为缺失输入、执行错误或部分证据提供文档化的回退路径时,请使用此技能。
关键特征 范围集中的工作流程与以下内容对齐: 使用元基因组-krona图分析数据,具有可复现的工作流程、显式验证和结构化输出,用于审查准备好的解释。 打包的可执行路径:scripts/main.py。 参考材料在references/中提供,用于任务特定的指导。 结构化的执行路径旨在保持输出的一致性和可审查性。
依赖项 请参阅上面的## Prerequisites以获取相关详细信息。 Python:3.10+。存储库基线用于当前打包的技能。 pandas:未指定。声明在requirements.txt中。 plotly:未指定。声明在requirements.txt中。
示例用法 请参阅上面的## Usage以获取相关详细信息。 cd "20260318/scientific-skills/Data Analytics/metagenomic-krona-chart" python -m py_compile scripts/main.py python scripts/main.py --help 示例运行计划: 确认用户输入、输出路径和任何必需的配置值。 如果脚本使用固定设置,请编辑文件中的CONFIG块或文档化参数。 使用验证的输入运行python scripts/main.py。 审查生成的输出,并返回带有任何假设的最终工件。
实现细节 请参阅上面的## Workflow以获取相关详细信息。 执行模型:验证请求、选择打包的工作流程并生成有界的可交付成果。 输入控制:在运行任何脚本之前,确认源文件、范围限制、输出格式和接受标准。 主要实现表面:scripts/main.py。 参考指南:references/包含支持规则、提示或清单。 首先需要澄清的参数:输入路径、输出路径、范围过滤器、阈值和任何特定于域的约束。 输出学科:保持结果可复现,显式识别假设,避免未文档化的副作用。
快速检查 使用此命令验证打包的脚本入口点可以在更深入的执行之前被解析。 python -m py_compile scripts/main.py
审计准备命令 使用这些具体命令进行验证。它们故意自成体系,避免占位符路径。 python -m py_compile scripts/main.py # 示例调用:python scripts/main.py --help # 示例调用:python scripts/main.py --input "审计验证样本,具有明确的症状、历史、评估和下一步计划。"
工作流程 在进行详细工作之前,请确认用户目标、所需输入和不可协商的约束。 验证请求是否与文档化的范围匹配,如果任务需要不支持的假设,请提前停止。 使用打包的脚本路径或仅使用实际可用的输入的文档化推理路径。 返回一个结构化的结果,该结果将假设、可交付成果、风险和未解决的项目分开。 如果执行失败或输入不完整,请切换到回退路径,并说明阻止完全完成的内容。
函数描述 生成交互式的sunburst图(Krona图)以显示元基因组样本中的分类学丰度层次结构。 支持解析来自Kraken2、Bracken和Centrifuge等常见分类工具输出的数据,并生成交互式的HTML可视化图表。
输出示例 skills/metagenomic-krona-chart/ ├── SKILL.md ├── scripts/ │ └── main.py ├── example/ │ ├── input.tsv │ └── output.html └── README.md
用法 基本用法 # 示例调用:python scripts/main.py -i input.tsv -o krona_chart.html
参数描述 参数描述 默认值 -i, --input 输入文件路径(TSV格式) 必需 -o, --output 输出HTML文件路径 krona_chart.html -t, --type 输入格式类型(kraken2/bracken/custom) auto --max-depth 最大显示层次深度 7 --min-percent 最小显示百分比阈值 0.01 --title 图表标题 元基因组Krona图
输入格式 Kraken2/Bracken报告格式 100.00 1000000 0 U 0 未分类 99.00 990000 0 R 1 根 95.00 950000 0 D 2 细菌 50.00 500000 0 P 1234 蓝藻 ... 自定义格式(TSV) taxon_id 名称 等级 parent_id 读取次数 百分比 2 细菌 域 1 950000 95.0 1234 蓝藻 门 2 500000 50.0
依赖项要求 Python 3.8+ plotly >= 5.0.0 pandas >= 1.3.0 pip install plotly pandas
输出功能 交互式的sunburst图,具有缩放和点击支持 不同分类学级别的颜色编码 悬停显示详细信息(读取次数、百分比) 中心显示总读取次数 响应式设计,适应不同屏幕
注意 输入文件需要包含分类学层次结构信息 对于大型数据集,使用--min-percent筛选低丰度数据