幻想から実践的な学術研究ワークフローへ: OpenClaw スキルを使用して論文追跡システムを構築しました
0. 原点: 一線を越えそうになったときの教訓
2026 年 3 月に、私は AI に論文を書くように依頼しました。プロセスはスムーズでした。論文は明確に構造化されており、図は素晴らしく、データは非常に合理的です。
そして私は次のことを発見しました: **これらのデータは AI によって生成されたものであり、実際の実験から生成されたものではありません。 **
92% の成功率、500 機のドローンのスケーラビリティ分析 - 完璧に見えますが、すべて「合理的な減点」です。このまま提出したら学歴詐称です。
この経験により、私はあることについて完全に考えさせられました。 **LLM における最大の危険は、質問に正しく答えられないことではなく、自信を持って答えても答えが間違ってしまうことです。学術的な環境では、この自信が致命的なものになる可能性があります。 **
そこで、文献調査のワークフローを再設計しました。核となる原則は 1 つだけです。
**検証不可能なコンテンツを生成しないでください。すべてのドキュメントは手動で検索され、実際に存在する必要があります。すべてのデータは十分に文書化されている必要があります。 **
これは、2 つのスキル「paper-research」と「paper-verifier」の本来の設計意図です。
1. 問題の核心: AI による直接的な文献検索はなぜ信頼できないのでしょうか?
Google Scholar には、厳密なクローラー対策メカニズムがあります。 Selenium/Playwright の自動操作は、IP ブロック、検証コードのトリガー、結果が不安定になる傾向があります。さらに重要なこと: AI によって検索された論文はまったく存在しない可能性があります - LLM は、「合理的に聞こえる」幻覚的な回答が得意です。文献レビューでは、これは最も危険な地雷原です。
よくある偽文学のルーチン:
- 論文のタイトルと著者を作成する
- 存在しない学術会議の捏造
- 引用数やインパクトファクターの誇張
- 一般雑誌をその地域のトップジャーナルと呼ぶ
したがって、私は「ばかげている」ように見えますが、絶対に信頼できる方法、人間と機械のコラボレーション、人間中心を選択しました。
2. 全体的な設計: 4 ステップの閉ループ ワークフロー
手动搜索文献
↓
交互式收集元数据
↓
LLM 辅助生成综述
↓
Zotero 统一管理
↓
paper-verifier 交叉验证(可选)
核となるロジック: 人は「本物を見つける」責任があり、LLM は「本物を効率的に組織する」責任があります。 LLM はコンテンツを生成することはなく、人間が入力した実際の情報を整理して表示するだけです。
3. 論文調査スキル: 完全な文献調査ワークフロー
3.1 クイック初期化
# 创建研究工作区
./scripts/setup_manual_search.sh ./my_research "UAV path planning"
これにより、指定されたディレクトリに 3 つのファイルが生成されます。
my_research/
├── 搜索指南.md # 告诉你去哪搜、怎么搜
├── 文献记录模板.json # 论文元数据存储格式
└── 收集文献.sh # 交互式收集脚本
3.2 検索ガイド: 戦略を含む手動検索ガイド「Search Guide.md」は単なる「Google Scholar の検索」ではなく、次の内容が含まれています。
推奨データベース:
- Google Scholar (包括的で最も完全な)
- IEEE Xplore (エンジニアリングの権威)
- Web of Science (トップジャーナルインデックス)
- ACMデジタルライブラリ(コンピュータ)
検索戦略:
# 示例:2023-2025 年 UAV 路径规划相关一区论文
"UAV path planning" AND "low altitude" AND year:2023..2025
site:ieeexplore.ieee.org "urban air mobility"
フィルタリング基準:
- 被引用数で並べ替え、被引用数の多い論文を優先します
- ジャーナルが中国科学院の第 1 地区にあるかどうかを確認します (fenqubiao.com でクエリ)
- DOI またはアクセス可能なリンクを記録する
中国科学院の分野 1 の参考リスト (スキルに組み込まれています):
| タイプ | 代表誌 |
|---|---|
| IEEE トランザクション | トロ、おっぱい、テ、TCST |
| ロボットのトップイシュー | オートマティカ、JFR、RAS |
| 航空サミット | ICRA、IROS、AIAA サイテック |
3.3 インタラクティブな文献コレクション
方法は 2 つあり、対話型スクリプトを使用することをお勧めします。
cd my_research
./收集文献.sh
スクリプトは、各論文に関する情報を徐々に要求します。
===== 文献收集 =====
论文标题: Multi-Agent Path Planning for UAV Swarms
作者: Zhang S, Li M, Wang W
年份: 2024
期刊/会议: IEEE Transactions on Robotics
DOI: 10.1109/TRO.2024.3391285
引用数: 45
关键词: UAV, path planning, multi-agent, reinforcement learning
一句话总结: 用集中式训练+分布式执行的框架解决
无人机集群路径冲突问题...
继续添加下一篇? (y/n):
遅すぎる場合は、「ドキュメント レコード template.json」を直接編集することもできます。
[
{
"title": "Multi-Agent Path Planning for UAV Swarms",
"authors": ["Zhang S", "Li M", "Wang W"],
"year": 2024,
"venue": "IEEE Transactions on Robotics",
"doi": "10.1109/TRO.2024.3391285",
"citations": 45,
"keywords": ["UAV", "path planning", "multi-agent"],
"summary": "集中式训练+分布式执行框架解决无人机集群路径冲突"
}
]
3.4 JSON 文献レビューからのマークダウンの生成
収集が完了したら、ワンクリックで構造化されたレビューを生成します。
python3 scripts/paper_collection.py \
--input 文献记录模板.json \
--output-md 文献综述.md
出力形式はおおよそ次のとおりです。
## 1. 研究背景
### 1.1 无人机集群路径规划
无人机集群路径规划是城市低空空域管理的核心问题...
Zhang et al. (2024) 提出的集中式训练+分布式执行框架...
### 1.2 多智能体强化学习
MARL 是解决分布式协同决策的主流方法...
## 2. 方法论分类
### 2.1 基于优化的方法
...
### 2.2 基于学习的方法
...
## 3. 关键文献汇总
| 论文 | 年份 | venue | 方法 | 贡献 |
|------|------|-------|------|------|
| Zhang et al. | 2024 | TRO | MARL | 提出 MGAT-AC 架构 |
...
LLM の役割はここに完全に反映されています。LLM は論文を見つけることではなく、手動で収集した実際の情報を構造化されたレビュー テキストに整理することです**。
3.5 Zotero 同期: 個人文献データベースの確立
収集した文献は、ワンクリックで Zotero にインポートできます。
export ZOTERO_LIBRARY_ID="你的图书馆ID"
export ZOTERO_API_KEY="你的API Key"
python3 scripts/zotero_manager.py \
--library-id $ZOTERO_LIBRARY_ID \
--api-key $ZOTERO_API_KEY \
batch-add --file 收集的文献.json
このようにして、手動で収集されたすべての実際のドキュメントが Zotero に同期され、再利用可能な個人ドキュメント ライブラリが形成されます。新しい調査を行うたびに、既存のライブラリに段階的に追加できます。
4. 論文検証者 スキル: 信頼性の相互検証文献を集めた後も検証が必要です。これは 2 番目のスキルである 論文真正性検証ツール です。
4.1 なぜ検証が必要なのでしょうか?
手動検索ではエラーが発生する可能性もあります。
- DOI が間違って入力されました
- 著者名のスペルが間違っています
- 雑誌名は正式名ではなく略称で表記されます。
- 引用数の記録が間違っていた(数十倍)
- ゾーン 1 だと思っていましたが、単なる CCF-B でした。
したがって、レビューを完了する前に、紙の検証ツールを使用してクロスチェックを行ってください。
4.2 DOI + メタデータの検証
python3 scripts/verify_papers.py \
--input papers.json \
--output verification_report.md
「papers.json」形式:
{
"title": "Multi-Agent Path Planning for UAV Swarms",
"authors": "Zhang S, Li M",
"year": 2024,
"venue": "IEEE Transactions on Robotics",
"doi": "10.1109/TRO.2024.3391285",
"citations": 45
}
スクリプトは 2 つの API を通じてチェックされます。
Crossref API — 公式メタデータを取得します。
- タイトルは正確に一致していますか?
- 著者のリストは正しいですか?
- 年は一致していますか?
- 雑誌の正式名称は何ですか?
Semantic Scholar API — 二次検証:
- 紙が実際に存在するかどうか
- 実際の被引用数はどれくらいですか?
- 論文の要旨を入手して内容を確認する
4.3 検証レポートのフォーマット
## 核查报告
### ✓ Zhang et al. (2024) - TRO
- DOI: 10.1109/TRO.2024.3391285 → 有效
- 期刊: IEEE Transactions on Robotics → 中科院一区 ✓
- 引用数: 声称45 → 实际52(Semantic Scholar)
⚠️ 引用数有出入,差7次
- 作者: Zhang S, Li M, Wang W → 核对通过 ✓
### ✗ Li et al. (2023) - ICRA
- DOI: 10.1109/ICRA.2023.1001234 → 有效
- ⚠️ 论文标题不匹配:实际为 "Single-Agent ..."
→ 请核实是否填错了论文
このようにして、手動入力エラーを即座に検出できます。
5. 2 つのスキルのファイル構造
~/.openclaw/workspace/skills/
├── paper-research/ # 文献研究工作流
│ ├── SKILL.md # 使用说明
│ ├── references/
│ │ └── zotero_setup.md # Zotero 配置指南
│ └── scripts/
│ ├── setup_manual_search.sh # 工作区初始化
│ ├── paper_collection.py # 文献收集+综述生成
│ ├── zotero_manager.py # Zotero API 同步
│ ├── search_scholar.py # Scholar 搜索(需API)
│ ├── search_serpapi.py # SerpAPI 搜索
│ └── generate_summary.py # 综述文本生成
│
└── paper-verifier/ # 真实性核查
├── SKILL.md
└── scripts/
└── verify_papers.py # 核心核查脚本
6. RAGナレッジベースとの連携
収集された実際のドキュメントはレビューを生成するだけでなく、その後の Q&A や執筆支援のために LLMRAG ナレッジ ベースに入力することもできます。
リンクプロセス全体:
手动搜索 → 收集到 JSON → 生成 Markdown 综述
↓
导入 Zotero(长期管理)
↓
添加到 LLMRA G知识库(向量检索)
↓
后续论文写作时,RAG 问答检索真实文献
このように、文献調査は 1 回限りの作業ではなく、蓄積、検索、再利用できる知識資産です。
7. 設計思想のまとめ
このワークフローの設計は、次の基本的な質問に答えます。 **学術研究における LLM の境界はどこですか? **
| LLM の得意分野 | LLMは苦手(人は来ないといけない) |
|---|---|
| 情報を収集・整理する | ドキュメントが実際に存在するかどうかを確認する |
| 構造化テキストを生成する | DOI / 引用数の精度を検証する |
| 知識のギャップとつながりを見つける | 信頼できるデータベースを検索する |
| 研磨とリライト | どの論文をレビューに含めるに値するかを決定する |
これは、私の以前の論文事件から学んだ教訓とも一致しています。ソースを追跡できないものは LLM に生成させないでください。すべてのデータとすべてのドキュメントは追跡可能でなければなりません。
##8.今後の展開の方向性
- SerpAPI にアクセスして半自動 Google Scholar 検索を実装します (手動操作を削減)
- Zotero API との双方向同期により、読み取った論文のメタデータを自動的に取得します
- 組み込みの引用形式テンプレートを使用して、ドメイン固有のジャーナル/会議の知識ベースを構築します。
- 検証された文書を黒曜石ノート形式に自動的に変換し、ダブルチェーンノートエコシステムに統合します
スキルパス: ~/.openclaw/workspace/skills/paper-research/ および paper-verifier/
※著者:神楽タルト | 2026-04-15 |将来の自分と、文献レビューを行う必要があるすべての研究者のために書かれました*