目的

要让LLM能够创作符合人设的赛马娘怪文书的同人文，有以下几种思路：

使用足够多的怪文书语料微调开源大模型
使用RAG的方式给LLM提供相关角色的人设，或者是优秀的范例
使用function call 的方法在LLM创作前先爬取相关的网页，包括角色设定、优秀的怪文书样例等

下面是使用 RAG+Web Crawler 的方法进行怪文书写作的示例。

Demo

项目说明

这个项目已经过时了。2025年3月，MCP（模型上下文）协议刚出，赋予了Agent 方便调用工具的能力。当时的LLM 不知道赛马娘等游戏的角色信息，搜索功能也不完善。我想结合特定领域的搜索，自己用Langchian搓了一个写小说的Agent，核心在于从网络获取LLM预训练没有的知识的能力。经过一年发展，Agent转向了cli的skills，LLM预训练的规模越来越大，知识越来越多，能力越来越强。下面是Google 的Antigravity在仅使用一个获取信息的Skill（umamusume-web-crawler）的情况下，完成的小说撰写。

agent已经能相当好的完成这个任务了，不再需要这个多余的流程了。

ENV

OS

在Ubuntu、MacOS、WSL(Ubuntu)中进行过测试。在Windows上无法运行，因为crawl4ai所需的Playwright会出现问题。

Proxy

使用http代理，因为赛马娘的萌娘百科通常需要使用代理才能访问。如果没有配置代理，将使用无代理的爬虫。

Python 环境

使用anaconda或者uv

conda

    conda create -n umamusume-novel python=3.12
    conda activate umamusume-novel
    pip install -r requirements.txt

uv

    uv venv --python 3.12
    source .venv/bin/activate
    uv sync

安装crawl4ai所需的浏览器

    playwright install

.env

    cat .env.template > .env

将.env.template复制为.env，修改其中的API_KEY。

我测试时使用的LLM为QWEN，和OPENAI的格式是兼容的。如果要使用OPENAI，直接修改INFO_LLM_MODEL_NAME等即可，不用管前缀和下面的OPENAI_API_KEY。

QWEN的API在官网中获取，免费也是有不少额度的。

INFO_LLM_MODEL_NAME 可以使用一些Tool Call能力强的模型；

WRITER_LLM_MODEL_NAME 可以使用一些更擅长创作的模型。

运行

赛马娘怪文书写作

阶段1: 使用RAG MCP先查询本地向量数据库的赛马娘的角色信息,获得相对准确的信息, 阶段2: 使用WEB MCP在网络上查询赛马娘的角色信息, 阶段3: 根据这些信息去创作小说。

其中阶段1和阶段2使用INFO_LLM_MODEL_NAME来调用工具获取信息，而阶段3创作小说不需要调用工具，使用WRITER_LLM_MODEL_NAME这种更擅长生成的模型。

运行source .venv/bin/activate开启环境

方法一：

在终端1中运行bash ./scripts/run-server.sh开启服务器

等待Web MCP 和 RAG MCP 启动成功，RAG使用本地的向量数据库，因此会比较慢。

在终端2中运行bash ./scripts/run-client.sh开启客户端

通过修改./scripts/run-param.sh中的端口来修改配置。

方法二：命令行客户端

# 方式 1：启动服务器并直接进入流式客户端（推荐）
python main.py with-client

# 方式 2：启动服务器并进入非流式客户端
python main.py with-client --no-stream

# 方式 3：仅启动服务器（后台运行）
python main.py server-only
# 然后在另一个终端使用客户端
python -m src.umamusume_novel.client.cli --stream

客户端模式说明：

流式模式（默认）：实时显示生成过程，包括 RAG 搜索、Web 搜索、生成内容
非流式模式：等待完整结果后一次性显示

方法三：前端展示

终端1中运行python main.py server-only，开启服务。

终端2中运行cd frontend进入 frontend ,运行pnpm run dev启动前端开发服务器

启动成功后，终端会显示本地访问地址，通常是 http://localhost:5173/。在浏览器中打开这个地址即可访问前端界面。

在log文件中查看工具调用和服务器的输出。

在frontend/public 下添加background.jpg可设置背景。

结果

Result工具调用的结果等

Novel生成的一些同人小说

服务配置

默认端口配置

使用以下默认端口：

服务	端口	说明
主服务器	`1111`	小说生成主服务，提供 `/ask` 和 `/askstream` 接口
RAG MCP	`7777`	RAG 知识库检索服务
Web MCP	`7778`	Web 搜索服务
前端开发服务器	`5173`	Vue 前端开发服务器（开发模式）

项目结构

    umamusume-novel/
    |-.env                        # 配置文件，需要自己配置key（如API密钥等）
    |-.env.template               # 环境变量模板，供参考和新环境设置
    |-LICENSE                     # 项目许可证文件
    |-
    |-logs/                       # 日志文件存放目录
    |   |-rag_mcp.log             # RAG MCP服务日志
    |   |-web_mcp.log             # Web MCP服务日志
    |   |-server.log              # Server服务日志
    |-
    |-resources/                  # 资源文件存放目录
    |   |-docs/                   # RAG所需文档
    |   |-results/                # 工具运行结果，生成的一些小说样本
    |-
    |-scripts/                    # 包含所有Shell脚本的目录
    |   |-run-client.sh           # 运行客户端脚本，用于启动客户端
    |   |-run-param.sh            # 参数配置文件，定义了服务器端口等参数
    |   |-run-server.sh           # 启动服务器脚本，负责启动MCP Server及小说生成服务
    |   |-stop-server.sh          # 停止服务器脚本，用于终止运行中的服务
    |-
    |-src/                        # 源代码根目录
    |   |-umamusume_novel/        # 主项目包
    |       |-client/             # 客户端模块
    |       |   |-__init__.py
    |       |   |-umamusume_client.py  # 客户端实现文件
    |       |   |-cli.py               # 命令行调用
    |       |
    |       |-prompt/             # Agent的提示词库
    |       |   |-searchinweb.md
    |       |   |-writenovel.md
    |       |   |-...
    |       |
    |       |-rag/                # RAG相关模块
    |       |   |-__init__.py
    |       |   |-rag.py          # RAG核心逻辑实现
    |       |   |-raginfomcp.py   # RAG MCP服务实现
    |       |
    |       |-server/             # 服务端模块
    |       |   |-__init__.py     # 初始化文件
    |       |   |-novel_generator.py  # 小说生成FASTAPI接口
    |       |   |-novel_service.py  # 小说生成逻辑实现
    |       |   |-rag_query.py    # RAG查询逻辑实现
    |       |   |-umamusume_create_novel.py  # 服务端主程序入口
    |       |
    |       |-web/                # Web相关模块
    |           |-__init__.py     # 初始化文件
    |           |-webinfomcp.py   # Web MCP服务实现 (使用 umamusume-web-crawler 库)
    |-frontend/
    |   |- ... (前端代码)
    |-
    |-tests/                      # 测试脚本
    |   |-test_search.py          # 测试搜索功能
    |   |-test_crawler.py         # 测试爬虫功能
    |   |-...
    |-
    |-pyproject.toml              # 项目配置文件
    |-uv.lock
    |-requirements.txt            # 项目依赖项文件，列出所有必需的Python包
    |-README.md                   # 项目说明文档，包括安装、运行指南等

NOTICE

Disclaimer for Generated Content:

The software may generate content, output, or data as a result of its operation. The copyright holder provides no warranty, express or implied, regarding the accuracy, reliability, or suitability of such generated content. The use of the software and any content it generates is entirely at your own risk. The copyright holder shall not be liable for any damages, losses, or consequences arising from the use or misuse of the generated content.

关于生成内容的免责声明：

本软件在运行过程中可能生成内容、输出或数据。版权持有者对这些生成内容的准确性、可靠性或适用性不提供任何形式的担保。使用本软件及其生成内容的风险完全由使用者自行承担。版权持有者不对因使用或误用生成内容而造成的任何损害、损失或后果承担责任。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

目的

Demo

项目说明

ENV

OS

Proxy

Python 环境

.env

运行

赛马娘怪文书写作

结果

相关工具

‌RAG（Retrieval Augmented Generation）

Web Crawler

Web Search

服务配置

默认端口配置

项目结构

NOTICE

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 80 Commits
docs		docs
frontend		frontend
resources		resources
scripts		scripts
src/umamusume_novel		src/umamusume_novel
tests		tests
.env.template		.env.template
.gitignore		.gitignore
.python-version		.python-version
LICENSE		LICENSE
main.py		main.py
pyproject.toml		pyproject.toml
readme.md		readme.md
requirements.txt		requirements.txt
requirements_lock.txt		requirements_lock.txt
umamusume_client.py		umamusume_client.py
uv.lock		uv.lock

Folders and files

Latest commit

History

Repository files navigation

目的

Demo

项目说明

ENV

OS

Proxy

Python 环境

.env

运行

赛马娘怪文书写作

结果

相关工具

‌RAG（Retrieval Augmented Generation）

Web Crawler

Web Search

服务配置

默认端口配置

项目结构

NOTICE

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages