Volcano Plot Labeler — 火山图标签器
v1.0.0使用 `volcano-plot-labeler` 分析数据,采用可重复的工作流程、显式验证和结构化输出,以便于审阅的解释。
运行时依赖
安装命令
点击复制技能文档
火山图标签器(ID:148) 自动识别和标记火山图中最重要的10个基因,使用排斥算法防止标签重叠。 何时使用 当任务需要自动标记火山图中最重要的基因并防止标签重叠时使用此技能。 当数据分析任务需要明确的假设、明确的范围和可复现的输出格式时使用此技能。 当您需要为缺失输入、执行错误或部分证据提供文档化的回退路径时使用此技能。 主要特征 请参阅上面的##特征以获取相关详细信息。 范围聚焦工作流程与以下内容对齐: 使用可复现的工作流程、明确的验证和结构化输出来分析数据,生成可审查的解释。 打包的可执行路径:scripts/main.py。 参考资料可在references/中找到,提供任务特定的指导。 结构化执行路径旨在保持输出的一致性和可审查性。 依赖项 请参阅上面的##先决条件以获取相关详细信息。 Python:3.10+。 存储库基线用于当前打包的技能。 matplotlib:未指定。 在requirements.txt中声明。 numpy:未指定。 在requirements.txt中声明。 pandas:未指定。 在requirements.txt中声明。 示例用法 请参阅上面的##用法以获取相关详细信息。 cd "20260318/scientific-skills/Data Analytics/volcano-plot-labeler" python -m py_compile scripts/main.py python scripts/main.py --help 示例运行计划: 确认用户输入、输出路径和任何必需的配置值。 编辑in-file CONFIG块或文档化的参数,如果脚本使用固定设置。 使用验证的输入运行python scripts/main.py。 审查生成的输出并返回最终的工件,调用任何假设。 实现细节 请参阅上面的##工作流程以获取相关详细信息。 执行模型:验证请求、选择打包的工作流程并生成有界的可交付成果。 输入控制:在运行任何脚本之前,确认源文件、范围限制、输出格式和验收标准。 主要实现表面:scripts/main.py。 参考指南:references/包含支持规则、提示或清单。 首先要澄清的参数:输入路径、输出路径、范围过滤器、阈值和任何特定于域的约束。 输出学科:保持结果可复现,明确识别假设,避免未文档化的副作用。 快速检查 使用此命令验证打包的脚本入口点可以在更深入的执行之前被解析。 python -m py_compile scripts/main.py 审计准备命令 使用这些具体命令进行验证。它们故意自成体系,避免占位符路径。 python -m py_compile scripts/main.py python scripts/main.py --help python scripts/main.py --input "审计验证样本,具有明确的症状、历史、评估和下一步计划。" 工作流程 在进行详细工作之前,确认用户目标、所需输入和不可商量的约束。 验证请求是否与文档化的范围相匹配,如果任务需要不支持的假设,请提前停止。 使用打包的脚本路径或仅使用实际可用的输入的文档化推理路径。 返回一个结构化的结果,分离假设、可交付成果、风险和未解决的项目。 如果执行失败或输入不完整,请切换到回退路径并声明阻止完全完成的内容。 特征 智能基因选择:自动根据p值和倍数变化识别最重要的10个基因 排斥算法:使用力导向定位防止文本标签重叠 可定制:可配置的阈值、标签样式和定位选项 多种输出格式:支持PNG、PDF、SVG 安装 pip install pandas matplotlib numpy scipy 用法 基本用法 from volcano_plot_labeler import label_volcano_plot import pandas as pd # 加载您的数据 df = pd.read_csv('differential_expression_results.csv') # 生成标记的火山图 fig = label_volcano_plot( df, log2fc_col='log2FoldChange', pvalue_col='padj', gene_col='gene_name', top_n=10 ) fig.savefig('volcano_plot_labeled.png', dpi=300, bbox_inches='tight') 高级用法 from volcano_plot_labeler import label_volcano_plot fig = label_volcano_plot( df, log2fc_col='log2FoldChange', pvalue_col='padj', gene_col='gene_name', top_n=10, pvalue_threshold=0.05, log2fc_threshold=1.0, figsize=(12, 10), repulsion_iterations=100, repulsion_force=0.05, label_fontsize=10, label_color='black', arrow_color='gray', save_path='output.png' ) 命令行用法 python scripts/main.py \ --input data/deseq2_results.csv \ --output volcano_labeled.png \ --log2fc-col log2FoldChange \ --pvalue-col padj \ --gene-col gene_name \ --top-n 10 输入格式 预期的CSV/TSV列: log2FoldChange:Log2倍数变化值 padj或pvalue:校正后的p值或p值