实现阶段与验收标准

定义从第一行代码到系统完整运行的分阶段计划，每个阶段的交付物、依赖和验收标准。
原则：先跑通主线，再扩展支线。 每个 Phase 结束时，系统应该可以独立运行并产生价值。

依赖关系图

Phase 1: 项目骨架 + 记忆系统
    │
    ├──→ Phase 2: 叙事发现引擎
    │        │
    │        └──→ Phase 5: Persona Agent 池
    │                 │
    ├──→ Phase 3: 数据采集引擎 ──┐
    │                           ├──→ Phase 6: 错配检测 + 合成层
    ├──→ Phase 4: 情绪引擎 ─────┘
    │
    └──→ Phase 7: 自动化运行

并行可能：
  Phase 2 (叙事) 和 Phase 3 (数据) 和 Phase 4 (情绪) 可以并行开发
  但都依赖 Phase 1 完成

MVP 定义

最小可用系统 = Phase 1 + Phase 2 + Phase 5（部分）

即：记忆系统 + 叙事发现 + 2个 Persona 的基础分析。可以开始从新闻中发现叙事并给出初步判断，即使没有数据校准和错配检测。

Phase 1：项目骨架 + 记忆系统

目标：搭建可运行的项目基础，完成数据存储层。

交付物

1. 项目初始化
   - pyproject.toml + 依赖安装
   - 目录结构创建
   - 配置管理（config.py + .env）

2. 数据库层
   - embedded-postgres 连接管理
   - SQLAlchemy ORM 模型（对应 02-data-model.md 的所有表）
   - 数据库迁移脚本（Alembic）
   - 初始化脚本（init_db.py）

3. 事件总线
   - 进程内 EventBus 实现
   - 事件持久化到数据库

4. 存储接口
   - NarrativeStore 实现（CRUD + 语义搜索）
   - IndicatorStore 实现
   - SentimentStore 实现
   - JudgmentStore 实现

5. LLM 调用层
   - LiteLLM 封装
   - 结构化输出校验
   - 重试和降级逻辑

6. 测试
   - 数据库 CRUD 单元测试
   - 事件总线单元测试
   - LLM 调用 mock 测试

验收标准

□ pip install -e ".[dev]" 成功
□ python scripts/init_db.py 成功创建所有表
□ pytest tests/unit/ 全部通过
□ 可以通过代码创建/查询 Narrative、Judgment 等实体
□ EventBus 可以发布和订阅事件，事件持久化到 DB
□ LLM 调用层可以正常调用 Claude 并返回结构化 JSON

预估工作量

核心开发：数据库模型 + ORM + 存储接口
重点难点：embedded-postgres 配置、pgvector 扩展安装、SQLAlchemy async 模式

Phase 2：叙事发现引擎

目标：从新闻中自动提取和追踪叙事。

交付物

1. 叙事提取
   - LLM Prompt 设计和调优
   - 结构化输出校验
   - 批量处理能力

2. 语义匹配
   - Embedding 接口实现（前期用 OpenAI，可切换）
   - pgvector 语义搜索
   - 相似度阈值调优

3. 叙事状态机
   - 状态转换逻辑
   - candidate → active 验证规则
   - active → fading 衰退检测

4. 叙事关系图
   - NarrativeEdge CRUD
   - 合并/分裂检测（基础版）

5. RSS 接入
   - 至少接入 2-3 个财经 RSS 源
   - 定时拉取和去重

6. 测试
   - 叙事提取单元测试（mock LLM 输出）
   - 语义匹配准确率测试
   - 状态机转换测试

验收标准

□ 输入一篇新闻，可以输出结构化的叙事命题
□ 新叙事可以自动匹配到已有叙事（相似度 > 0.85）
□ 不相似的叙事自动创建为 candidate
□ candidate 满足条件后自动转为 active
□ RSS 源可以定时拉取，去重后送入叙事提取
□ narrative_events 表记录了所有状态变化

Phase 3：数据采集引擎

目标：从多个数据源采集指标，计算宏观信号。

交付物

1. OpenBB 集成
   - Provider 实现
   - 核心指标采集（利率、利差、股指、外汇、商品）

2. Binance 集成
   - 资金费率采集
   - 持仓量采集
   - 清算数据采集

3. 指标计算引擎
   - Z-score 计算
   - 百分位计算
   - 趋势判断
   - 异常标记

4. 采集调度
   - APScheduler 配置
   - 分频率采集

5. 测试
   - 指标计算单元测试（已知输入 → 预期输出）
   - 数据源 mock 测试

验收标准

□ 可以从 OpenBB 获取至少 10 个核心宏观指标
□ 可以从 Binance 获取资金费率和持仓量
□ 指标计算（Z-score、百分位、趋势）结果正确
□ 异常指标自动标记并发布事件
□ indicator_snapshots 表持续积累数据

暂不实现

IBKR 实时数据（复杂度高，OpenBB 已覆盖大部分需求）
Longbridge 接入（Phase 3 可先跳过，后续补充中国市场）

Phase 4：情绪引擎

目标：采集市场情绪数据。

交付物

1. 散户情绪
   - Fear & Greed Index 采集
   - 融资融券数据（如 Longbridge 可用）

2. 媒体情绪
   - 新闻标题情绪（LLM 批量打分）
   - 央行声明鸽鹰度分析

3. 机构行为
   - ETF 资金流（OpenBB 覆盖）
   - CFTC 持仓（OpenBB 覆盖）

4. 极端情绪检测
   - 阈值配置
   - 事件发布

5. 测试
   - 情绪打分单元测试
   - 极端检测测试

验收标准

□ 可以输出 SentimentSnapshot（散户 + 媒体 + 机构）
□ 极端情绪自动检测并发布事件
□ sentiment_snapshots 表持续积累数据

暂不实现

社交媒体爬取（需要额外的反爬策略，优先级低）
KOL 观点聚合（数据源不稳定）

Phase 5：Persona Agent 池

目标：实现蒙特卡罗式的多 Persona 对抗分析。

交付物

1. Persona 管理
   - skill.md 解析器
   - Persona 同步脚本
   - PersonaVersion 管理

2. 首批 Persona（2-3个）
   - Soros（反身性）
   - Buffett（价值投资）
   - 周金涛（周期论）
   - 从 skill.md 加载配置

3. 独立分析
   - Persona 分析 Prompt
   - 结构化输出
   - 超时和降级处理

4. 对抗辩论（基础版）
   - 单轮质疑-回应
   - 辩论记录持久化

5. Ensemble 合成
   - 加权投票
   - 共识度计算

6. 测试
   - 单个 Persona 分析测试
   - 辩论流程测试
   - 合成逻辑测试

验收标准

□ 3 个 Persona 可以从 skill.md 加载配置
□ 输入叙事 + 指标 + 情绪，每个 Persona 输出独立判断
□ 对抗辩论可以生成质疑和回应
□ Ensemble 输出加权合成的 regime 判断
□ persona_judgments 表记录了每次独立判断

Phase 6：错配检测 + 合成层

目标：实现智库 vs 情绪的错配检测，输出 Alpha/Beta 信号。

交付物

1. 错配检测
   - 智库共识提取
   - 情绪方向计算
   - 错配度量化
   - 四象限分类

2. 信号过滤
   - 阈值配置
   - 持续时间追踪

3. 交易提案（预留）
   - TradeProposal 基础结构
   - 投资逻辑自动生成（LLM）

4. 事后验证
   - 验证引擎实现
   - Persona 表现统计更新

5. 测试
   - 错配计算单元测试
   - 四象限分类测试
   - 信号过滤测试

验收标准

□ judgment.completed 事件触发后自动计算错配度
□ 四象限分类正确
□ 满足阈值的信号自动发布 mismatch.detected 事件
□ 事后验证可以对比判断 vs 实际结果
□ Persona 权重根据验证结果自动更新

Phase 7：自动化运行

目标：系统全自动运行，可定时产出分析报告。

交付物

1. 主循环
   - 所有引擎串联运行
   - 定时调度配置
   - 事件驱动的自动触发

2. 报告生成
   - 每日/每周分析报告（Markdown 格式）
   - 当前 regime、活跃叙事、错配信号汇总

3. 告警
   - 高置信度信号通知
   - 数据源故障告警
   - 异常检测告警

4. Streamlit Dashboard（可选）
   - 叙事图谱可视化
   - 指标仪表盘
   - 信号历史

5. 元学习（基础版）
   - 每周回顾
   - Persona 表现统计
   - 优化建议生成

6. 测试
   - 端到端集成测试
   - 24小时稳定性测试

验收标准

□ 系统可以 24/7 自动运行，无需人工干预
□ 每日产出分析报告
□ 高信号强度的错配触发告警
□ 系统运行 7 天无崩溃
□ 元学习模块可以产出可操作的优化建议

总览

Phase 1  项目骨架 + 记忆系统    ← 基础，所有后续依赖
Phase 2  叙事发现引擎           ← 系统的"眼睛"
Phase 3  数据采集引擎           ← 系统的"校准器"
Phase 4  情绪引擎               ← 系统的"温度计"
Phase 5  Persona Agent 池       ← 系统的"大脑"
Phase 6  错配检测 + 合成层       ← 系统的"决策层"
Phase 7  自动化运行             ← 系统的"心脏"

Phase 2/3/4 可并行开发
Phase 5 依赖 Phase 2
Phase 6 依赖 Phase 3 + 4 + 5
Phase 7 依赖所有

关联文档：规范总览 · 开发与运行环境 · 六大引擎详细设计

实现阶段与验收标准 ​

依赖关系图 ​

MVP 定义 ​

Phase 1：项目骨架 + 记忆系统 ​

交付物 ​

验收标准 ​

预估工作量 ​

Phase 2：叙事发现引擎 ​

交付物 ​

验收标准 ​

Phase 3：数据采集引擎 ​

交付物 ​

验收标准 ​

暂不实现 ​

Phase 4：情绪引擎 ​

交付物 ​

验收标准 ​

暂不实现 ​

Phase 5：Persona Agent 池 ​

交付物 ​

验收标准 ​

Phase 6：错配检测 + 合成层 ​

交付物 ​

验收标准 ​

Phase 7：自动化运行 ​

交付物 ​

验收标准 ​

总览 ​

实现阶段与验收标准

依赖关系图

MVP 定义

Phase 1：项目骨架 + 记忆系统

交付物

验收标准

预估工作量

Phase 2：叙事发现引擎

交付物

验收标准

Phase 3：数据采集引擎

交付物

验收标准

暂不实现

Phase 4：情绪引擎

交付物

验收标准

暂不实现

Phase 5：Persona Agent 池

交付物

验收标准

Phase 6：错配检测 + 合成层

交付物

验收标准

Phase 7：自动化运行

交付物

验收标准

总览