不明飞行物(Ufo)
v1.0.0在分析来自多个来源的解密UAP/UFO/FOIA文件发布时使用——war.gov、AARO、FBI Vault、NARA、国会档案馆等。
运行时依赖
安装命令
点击复制技能文档
UFO 研究工作台 多源 UAP/UFO 释放分类、证据评级和结构化分析报告 —— 具有内置的怀疑主义防护措施。 该技能将解密的 UAP/UFO/FOIA 文档文件夹转换为结构化、评级的分析文物。 它扩展了 uap-release-analyzer,增加了多源分类、证据来源评分、索赔分类法、跨释放比较、时间线和实体关系映射以及显式不确定性跟踪。 核心哲学:将每个文档视为带有索赔的文物,而不是真理。 评估来源,而不仅仅是内容。 始终区分文档中所说的内容和分析师从独立验证中推断出的内容。 何时使用:当用户要求分析、比较或调查 UAP/UFO 文档释放时。 示例提示: "分析 UAP 释放文件夹 at ~/Downloads/release_03/" "比较 release_01 和 release_02 ——有什么变化?" "为这些 AARO 文件构建证据矩阵" "这个 FBI Vault 块中有什么样的编辑模式?" "从这些国会听证会 PDF 中映射实体和时间线" "我有来自 war.gov、AARO 和 FBI Vault 的文件 —— 对它们进行分类" 任何请求结构化的 UAP/UFO 研究报告 如果用户只提供文件夹路径并说 "这里有什么?",则应用此技能。 如果他们提到特定的机构或释放源,则使用此技能中的多源分类框架对每个源进行正确的分类和路由。 升级的工作流程 此技能在原始 uap-release-analyzer 管道上添加了五个层: 第 0 层 —— 源分类 → 这是什么样的释放?哪个机构/场所? 第 1 层 —— 清单和提取 → 有哪些文件?提取文本 (pdfplumber)。 第 2 层 —— 索赔分类法 → 根据类型对每个可提取的索赔进行分类。 第 3 层 —— 证据评级 → 评分来源、相关性和可靠性。 第 4 层 —— 跨释放差异 → 与前一释放相比有什么变化? 第 5 层 —— 结构化文物 → 生成评级、警告的输出包。 第 0 层 —— 多源分类 在运行任何提取之前,分类释放源。 不同的源具有不同的可靠性配置文件、元数据约定和编辑规范。 请参阅 references/source-taxonomy.md 以获取完整的分类表。 源信号类型可靠性基线典型格式 war.gov/UFO/ 官方 DOW 释放门户 高 (官方) PDF、PNG、视频 AARO 国会授权办公室 高 (官方) PDF 报告、数据表 FBI Vault FOIA 处理的案件文件 中等 (编辑) 扫描 PDF、PNG NARA 档案记录组 中等-高 PDF、微胶片扫描 国会档案 听证会记录、CRS 报告 高 (官方记录) PDF、HTML DoS 电缆 国务院外交交通 中等 (编辑) PDF 第三方编译 由研究人员/非政府组织聚合 可变 —— 单独评级 混合 分类输出:在任何分析之前,标记每个文件的来源来源。 这驱动了第 3 层的证据评级。 第 1 层 —— 清单和文本提取 运行 scripts/inventory.py 以构建 inventory.csv,其中每行对应一个文件:文件名、页数、大小、来源标签、格式、文本层状态。 这是 uap-release-analyzer 的直接改编。 对于文本提取,使用 scripts/extract_text.py [start] [end] (pdfplumber-based)。 没有文本层的文件会产生 0 个字符的输出 —— 这些被标记为需要 OCR,而不是默默地丢弃。 脚本是幂等和可分块的。 第 2 层 —— 索赔分类法 在文本提取后,将文本中的每个可识别的索赔分类为以下类型之一: 索赔类型定义信号 目击报告 视觉观察报告 (飞行员、地面、平民) 相关传感器数据、多个证人 仪表读数 传感器读数 (雷达、FLIR、红外、卫星) 校准平台、原始数据可用 举报人证词 来自命名或匿名内部人员的证词 相关性、职位访问、时间一致性 机构备忘录 内部政府通信、政策文件 链式保管、分类级别、日期 编辑模式 被撤销的内容和相关的 FOIA 代码 现在、模式一致性 时间线不一致 两个文档关于同一事件的相互矛盾 之间的显式日期不匹配、相互矛盾的帐户 照片/视频 附加到文件或在文件中引用的视觉媒体 链式保管、元数据完整性、来源 其他/未分类 对于不符合上述类别的索赔的抓取所有 Flag 用于手动审查 分类是尽力而为的 (关键字 + 模式匹配),而不是完整的 NLP。 不确定性注册表 (第 5 层) 必须注意这一限制。 第 3 层 —— 证据评级和来源评分 每个索赔或文档在三个轴上接收来源评分。 请参阅 references/evidence-grading.md 以获取完整的评分表。 轴 A —— 源可靠性 (1-5) 评分含义 5 官方从验证的政府门户 (war.gov、AARO、congress.gov) 发布 4 FOIA 从公认的档案 (FBI Vault) 发布 3 第三方编译 2 编辑模式 1 其他/未分类 轴 B —— 相关性 (1-5) 评分含义 5 相关传感器数据、多个证人 4 校准平台、原始数据可用 3 相关性、职位访问、时间一致性 2 现在、模式一致性 1 其他/未分类 轴 C —— 可靠性 (1-5) 评分含义 5 官方发布 4 FOIA 发布 3 编辑模式 2 相关传感器数据、多个证人 1 其他/未分类 评分是主观的,可能需要手动审查。 请参阅 references/evidence-grading.md 以获取完整的评分表。