幻想から実践的な学術研究ワークフローへ: OpenClaw スキルを使用して論文追跡システムを構築しました

0. 原点: 一線を越えそうになったときの教訓

2026 年 3 月に、私は AI に論文を書くように依頼しました。プロセスはスムーズでした。論文は明確に構造化されており、図は素晴らしく、データは非常に合理的です。

そして私は次のことを発見しました: **これらのデータは AI によって生成されたものであり、実際の実験から生成されたものではありません。 **

92% の成功率、500 機のドローンのスケーラビリティ分析 - 完璧に見えますが、すべて「合理的な減点」です。このまま提出したら学歴詐称です。

この経験により、私はあることについて完全に考えさせられました。 **LLM における最大の危険は、質問に正しく答えられないことではなく、自信を持って答えても答えが間違ってしまうことです。学術的な環境では、この自信が致命的なものになる可能性があります。 **

そこで、文献調査のワークフローを再設計しました。核となる原則は 1 つだけです。

**検証不可能なコンテンツを生成しないでください。すべてのドキュメントは手動で検索され、実際に存在する必要があります。すべてのデータは十分に文書化されている必要があります。 **

これは、2 つのスキル「paper-research」と「paper-verifier」の本来の設計意図です。

1. 問題の核心: AI による直接的な文献検索はなぜ信頼できないのでしょうか?

Google Scholar には、厳密なクローラー対策メカニズムがあります。 Selenium/Playwright の自動操作は、IP ブロック、検証コードのトリガー、結果が不安定になる傾向があります。さらに重要なこと: AI によって検索された論文はまったく存在しない可能性があります - LLM は、「合理的に聞こえる」幻覚的な回答が得意です。文献レビューでは、これは最も危険な地雷原です。

よくある偽文学のルーチン:

論文のタイトルと著者を作成する
存在しない学術会議の捏造
引用数やインパクトファクターの誇張
一般雑誌をその地域のトップジャーナルと呼ぶ

したがって、私は「ばかげている」ように見えますが、絶対に信頼できる方法、人間と機械のコラボレーション、人間中心を選択しました。

2. 全体的な設計: 4 ステップの閉ループワークフロー

手动搜索文献
     ↓
交互式收集元数据
     ↓
LLM 辅助生成综述
     ↓
Zotero 统一管理
     ↓
paper-verifier 交叉验证（可选）

核となるロジック: 人は「本物を見つける」責任があり、LLM は「本物を効率的に組織する」責任があります。 LLM はコンテンツを生成することはなく、人間が入力した実際の情報を整理して表示するだけです。

3. 論文調査スキル: 完全な文献調査ワークフロー

3.1 クイック初期化

# 创建研究工作区
./scripts/setup_manual_search.sh ./my_research "UAV path planning"

これにより、指定されたディレクトリに 3 つのファイルが生成されます。

my_research/
├── 搜索指南.md         # 告诉你去哪搜、怎么搜
├── 文献记录模板.json   # 论文元数据存储格式
└── 收集文献.sh         # 交互式收集脚本

3.2 検索ガイド: 戦略を含む手動検索ガイド「Search Guide.md」は単なる「Google Scholar の検索」ではなく、次の内容が含まれています。

推奨データベース:

Google Scholar (包括的で最も完全な)
IEEE Xplore (エンジニアリングの権威)
Web of Science (トップジャーナルインデックス)
ACMデジタルライブラリ（コンピュータ）

検索戦略:

# 示例：2023-2025 年 UAV 路径规划相关一区论文
"UAV path planning" AND "low altitude" AND year:2023..2025
site:ieeexplore.ieee.org "urban air mobility"

フィルタリング基準:

被引用数で並べ替え、被引用数の多い論文を優先します
ジャーナルが中国科学院の第 1 地区にあるかどうかを確認します (fenqubiao.com でクエリ)
DOI またはアクセス可能なリンクを記録する

中国科学院の分野 1 の参考リスト (スキルに組み込まれています):

タイプ	代表誌
IEEE トランザクション	トロ、おっぱい、テ、TCST
ロボットのトップイシュー	オートマティカ、JFR、RAS
航空サミット	ICRA、IROS、AIAA サイテック

3.3 インタラクティブな文献コレクション

方法は 2 つあり、対話型スクリプトを使用することをお勧めします。

cd my_research
./收集文献.sh

スクリプトは、各論文に関する情報を徐々に要求します。

===== 文献收集 =====
论文标题: Multi-Agent Path Planning for UAV Swarms
作者: Zhang S, Li M, Wang W
年份: 2024
期刊/会议: IEEE Transactions on Robotics
DOI: 10.1109/TRO.2024.3391285
引用数: 45
关键词: UAV, path planning, multi-agent, reinforcement learning
一句话总结: 用集中式训练+分布式执行的框架解决
            无人机集群路径冲突问题...
继续添加下一篇? (y/n):

遅すぎる場合は、「ドキュメントレコード template.json」を直接編集することもできます。

[
  {
    "title": "Multi-Agent Path Planning for UAV Swarms",
    "authors": ["Zhang S", "Li M", "Wang W"],
    "year": 2024,
    "venue": "IEEE Transactions on Robotics",
    "doi": "10.1109/TRO.2024.3391285",
    "citations": 45,
    "keywords": ["UAV", "path planning", "multi-agent"],
    "summary": "集中式训练+分布式执行框架解决无人机集群路径冲突"
  }
]

3.4 JSON 文献レビューからのマークダウンの生成

収集が完了したら、ワンクリックで構造化されたレビューを生成します。

python3 scripts/paper_collection.py \
    --input 文献记录模板.json \
    --output-md 文献综述.md

出力形式はおおよそ次のとおりです。

## 1. 研究背景

### 1.1 无人机集群路径规划

无人机集群路径规划是城市低空空域管理的核心问题...
Zhang et al. (2024) 提出的集中式训练+分布式执行框架...

### 1.2 多智能体强化学习

MARL 是解决分布式协同决策的主流方法...

## 2. 方法论分类

### 2.1 基于优化的方法
...

### 2.2 基于学习的方法
...

## 3. 关键文献汇总

| 论文 | 年份 | venue | 方法 | 贡献 |
|------|------|-------|------|------|
| Zhang et al. | 2024 | TRO | MARL | 提出 MGAT-AC 架构 |
...

LLM の役割はここに完全に反映されています。LLM は論文を見つけることではなく、手動で収集した実際の情報を構造化されたレビューテキストに整理することです**。

3.5 Zotero 同期: 個人文献データベースの確立

収集した文献は、ワンクリックで Zotero にインポートできます。

export ZOTERO_LIBRARY_ID="你的图书馆ID"
export ZOTERO_API_KEY="你的API Key"

python3 scripts/zotero_manager.py \
    --library-id $ZOTERO_LIBRARY_ID \
    --api-key $ZOTERO_API_KEY \
    batch-add --file 收集的文献.json

このようにして、手動で収集されたすべての実際のドキュメントが Zotero に同期され、再利用可能な個人ドキュメントライブラリが形成されます。新しい調査を行うたびに、既存のライブラリに段階的に追加できます。

4. 論文検証者スキル: 信頼性の相互検証文献を集めた後も検証が必要です。これは 2 番目のスキルである論文真正性検証ツールです。

4.1 なぜ検証が必要なのでしょうか?

手動検索ではエラーが発生する可能性もあります。

DOI が間違って入力されました
著者名のスペルが間違っています
雑誌名は正式名ではなく略称で表記されます。
引用数の記録が間違っていた（数十倍）
ゾーン 1 だと思っていましたが、単なる CCF-B でした。

したがって、レビューを完了する前に、紙の検証ツールを使用してクロスチェックを行ってください。

4.2 DOI + メタデータの検証

python3 scripts/verify_papers.py \
    --input papers.json \
    --output verification_report.md

「papers.json」形式:

{
  "title": "Multi-Agent Path Planning for UAV Swarms",
  "authors": "Zhang S, Li M",
  "year": 2024,
  "venue": "IEEE Transactions on Robotics",
  "doi": "10.1109/TRO.2024.3391285",
  "citations": 45
}

スクリプトは 2 つの API を通じてチェックされます。

Crossref API — 公式メタデータを取得します。

タイトルは正確に一致していますか？
著者のリストは正しいですか?
年は一致していますか？
雑誌の正式名称は何ですか?

Semantic Scholar API — 二次検証:

紙が実際に存在するかどうか
実際の被引用数はどれくらいですか？
論文の要旨を入手して内容を確認する

4.3 検証レポートのフォーマット

## 核查报告

### ✓ Zhang et al. (2024) - TRO
- DOI: 10.1109/TRO.2024.3391285 → 有效
- 期刊: IEEE Transactions on Robotics → 中科院一区 ✓
- 引用数: 声称45 → 实际52（Semantic Scholar）
  ⚠️ 引用数有出入，差7次
- 作者: Zhang S, Li M, Wang W → 核对通过 ✓

### ✗ Li et al. (2023) - ICRA
- DOI: 10.1109/ICRA.2023.1001234 → 有效
- ⚠️ 论文标题不匹配：实际为 "Single-Agent ..."
  → 请核实是否填错了论文

このようにして、手動入力エラーを即座に検出できます。

5. 2 つのスキルのファイル構造

~/.openclaw/workspace/skills/
├── paper-research/          # 文献研究工作流
│   ├── SKILL.md            # 使用说明
│   ├── references/
│   │   └── zotero_setup.md # Zotero 配置指南
│   └── scripts/
│       ├── setup_manual_search.sh    # 工作区初始化
│       ├── paper_collection.py       # 文献收集+综述生成
│       ├── zotero_manager.py         # Zotero API 同步
│       ├── search_scholar.py         # Scholar 搜索（需API）
│       ├── search_serpapi.py         # SerpAPI 搜索
│       └── generate_summary.py       # 综述文本生成
│
└── paper-verifier/         # 真实性核查
    ├── SKILL.md
    └── scripts/
        └── verify_papers.py # 核心核查脚本

6. RAGナレッジベースとの連携

収集された実際のドキュメントはレビューを生成するだけでなく、その後の Q&A や執筆支援のために LLMRAG ナレッジベースに入力することもできます。

リンクプロセス全体:

手动搜索 → 收集到 JSON → 生成 Markdown 综述
    ↓
导入 Zotero（长期管理）
    ↓
添加到 LLMRA G知识库（向量检索）
    ↓
后续论文写作时，RAG 问答检索真实文献

このように、文献調査は 1 回限りの作業ではなく、蓄積、検索、再利用できる知識資産です。

7. 設計思想のまとめ

このワークフローの設計は、次の基本的な質問に答えます。 **学術研究における LLM の境界はどこですか? **

LLM の得意分野	LLMは苦手（人は来ないといけない）
情報を収集・整理する	ドキュメントが実際に存在するかどうかを確認する
構造化テキストを生成する	DOI / 引用数の精度を検証する
知識のギャップとつながりを見つける	信頼できるデータベースを検索する
研磨とリライト	どの論文をレビューに含めるに値するかを決定する

これは、私の以前の論文事件から学んだ教訓とも一致しています。ソースを追跡できないものは LLM に生成させないでください。すべてのデータとすべてのドキュメントは追跡可能でなければなりません。

##8.今後の展開の方向性

SerpAPI にアクセスして半自動 Google Scholar 検索を実装します (手動操作を削減)
Zotero API との双方向同期により、読み取った論文のメタデータを自動的に取得します
組み込みの引用形式テンプレートを使用して、ドメイン固有のジャーナル/会議の知識ベースを構築します。
検証された文書を黒曜石ノート形式に自動的に変換し、ダブルチェーンノートエコシステムに統合します

スキルパス: ~/.openclaw/workspace/skills/paper-research/ および paper-verifier/

※著者：神楽タルト | 2026-04-15 |将来の自分と、文献レビューを行う必要があるすべての研究者のために書かれました*