Korean Gov Programs — 技能工具
v1.0.8[自动翻译] Collect Korean government support programs (TIPS, Small Business, R&D grants) into structured JSONL files. Supports incremental collection with checkp...
0· 677·1 当前·1 累计
安全扫描
OpenClaw
安全
medium confidenceThe skill is an internally consistent web-scraper for Korean government support program pages that writes JSONL output and uses checkpointing; nothing in the provided files suggests unrelated or malicious behavior, but part of the main script was truncated in the review material so there is some residual uncertainty.
评估建议
This appears to be a straightforward scraper: it will perform HTTP requests to government sites and create files in whatever output directory you specify (including a .checkpoint.json). Before running, consider: (1) run it in an isolated directory you control to avoid accidental file placement; (2) respect target sites' robots.txt and rate limits (the script already sleeps 0.8s between requests), and be aware some sources require Selenium/Playwright (skipped by this script); (3) the code optiona...详细分析 ▾
✓ 用途与能力
The name/description describe collecting Korean government program listings; the repo contains scraping code (scripts/collect.py) and a stats helper (scripts/stats.sh) that align with that purpose. There are no unrelated credentials, binaries, or external packages requested.
✓ 指令范围
Runtime instructions and code perform HTTP GETs against government sites, parse HTML, and append structured JSONL records to an output directory, storing progress in .checkpoint.json. The code only reads/writes files under the user-specified output directory and does not access unrelated system files or secrets in the visible portion.
✓ 安装机制
No install spec; this is instruction+script only and uses only Python standard libraries and a bash helper. Nothing is downloaded from arbitrary URLs or installed automatically.
ℹ 凭证需求
No required environment variables or credentials are declared. The code optionally reads GOV_SCRAPER_UA to override the User-Agent, which is benign but not documented in SKILL.md (optional only). No sensitive credentials are requested.
✓ 持久化与权限
Skill does not request always:true and does not modify other skills or system-wide configs. It creates/updates only its own output files and .checkpoint.json in the user-specified directory (append-only behavior is implemented).
安全有层次,运行前请审查代码。
运行时依赖
无特殊依赖
版本
latestv1.0.82026/2/19
Auto-update 2026-02-25: maintenance & improvements
● 无害
安装命令 点击复制
官方npx clawhub@latest install korean-gov-programs
镜像加速npx clawhub@latest install korean-gov-programs --registry https://cn.clawhub-mirror.com
技能文档
한국 정부지원사업(TIPS, 소상공인, R&D)을 구조화된 JSONL 파일로 수집하는 스킬. 체크포인트 기반 증분 수집으로 중복 없이 안전하게 운영.
수집 소스
| 소스 | 카테고리 | 방식 | 상태 |
|---|---|---|---|
| 기업마당(BizInfo) | 소상공인 | 정적 HTML | ✅ 동작 |
| NIA 한국지능정보사회진흥원 | 정보화사업 | onclick 패턴 | ✅ 동작 |
| 기업마당 기술창업 필터 | 기술창업/R&D | 정적 HTML | ✅ 동작 |
| 소상공인시장진흥공단(SEMAS) | 소상공인 | JS 렌더링 필요 | ⚠️ 스킵 |
| 중소벤처기업부(MSS) | 정부지원 | JS 렌더링 필요 | ⚠️ 스킵 |
| K-Startup | 창업지원 | JS 렌더링 필요 | ⚠️ 스킵 |
| 연구개발특구진흥재단(Innopolis) | R&D | JS 렌더링 필요 | ⚠️ 스킵 |
| 창업진흥원(KISED) | 창업 | eGovFrame 오류 | ⚠️ 스킵 |
JS 렌더링 필요 사이트는 Selenium/Playwright 환경에서 별도 수집 필요.
사용법
# 기본 수집 (./data 디렉토리에 저장)
python3 scripts/collect.py --output ./data# 커스텀 출력 디렉토리
python3 scripts/collect.py --output /path/to/output
# 수집 현황 확인
bash scripts/stats.sh ./data
JSONL 스키마
{
"title": "사업명",
"category": "소상공인 | 기술창업 | 정보화사업 | R&D",
"source": "수집 출처 기관명",
"url": "상세 페이지 URL",
"amount": "지원 금액 (있는 경우)",
"deadline": "마감일 (예: ~2026-03-31)",
"description": "부가 설명",
"collected_at": "2026-02-19T08:53:00.000000"
}
체크포인트 & 안전 수집
- APPEND 전용: 기존 파일 덮어쓰기 절대 없음
- 중복 방지: title 기준 중복 자동 스킵
- 체크포인트:
.checkpoint.json에 진행 상태 저장 → 재실행 시 이어서 수집 - 딜레이: 요청 간 0.8초 대기 (서버 부하 방지)
출력 파일
data/
├── soho_programs.jsonl # 소상공인 지원사업
├── gov_programs.jsonl # 정부 R&D / 기술창업 지원사업
└── .checkpoint.json # 체크포인트 (자동 생성)
파일 구조
korean-gov-programs/
├── SKILL.md # 이 파일
└── scripts/
├── collect.py # 통합 수집 스크립트
└── stats.sh # 수집 현황 출력
数据来源:ClawHub ↗ · 中文优化:龙虾技能库
OpenClaw 技能定制 / 插件定制 / 私有工作流定制
免费技能或插件可能存在安全风险,如需更匹配、更安全的方案,建议联系付费定制