Skip to content

ygw365/voice_timeline

Repository files navigation

Fuson 浮声

你的声音,你做主。一款拒绝打断你思考的本地语音捕捉器。


为什么不是输入法?

现有的语音工具在替你决定什么时候说完——你停顿思考,它擅自断句;你录下灵感,它锁在云端训练模型。

Fuson 浮声把控制权还给你:

  • 按住即录,松手方止:哪怕沉默三分钟,只要你没松手,录音继续。这是你的思考留白权。
  • 本地优先,云端透明:语音文件存在你的硬盘,API Key 你自己掌控。我们不做数据中间商。
  • 时间线,非输入框:捕捉的灵感进入个人时间线,你可以今晚再决定是发给同事、写入笔记,还是永久存档。

核心特性

🎙️ 反打断采集
Semantic VAD 技术:你说完了?系统不知道,只有你松手才算结束。保护中式迂回思维与深度心流。

🔒 数据主权架构
BYOK(Bring Your Own Key)模式:自带火山/阿里/讯飞 API Key,费用直接付给云厂商,软件方零触碰你的语音内容。

🗂️ 语音胶囊版本控制
每个录音生成可审计的"胶囊":原始音频 + ASR 文本 + AI 润色版,Diff 对比,随时回滚。像 Git 管理代码一样管理你的思维。

📍 上下文锚定
自动记录录音时的屏幕内容(PDF 标题、浏览器标签),让灵感与场景永久绑定,不再忘记"当时为什么想到这个"。


为谁而生?

  • 知识工作者:写作者、律师、医生、研究员——需要长段 uninterrupted 思考记录
  • 隐私敏感者:商业机密、患者隐私、客户谈话——绝不允许上云
  • 数字极简主义者:厌倦订阅制,希望一次配置,终身拥有,数据可带走

环境要求

  • Rust 1.75+
  • Cargo 1.75+
  • 麦克风设备
  • ASR API 凭证(阿里云 / 火山引擎)

安装

# 克隆项目后编译
cargo build --release

配置

编辑 ~/Documents/fuson/config.json

{
  "provider": "aliyun",
  "access_key": "你的 AccessKey ID",
  "secret_key": "你的 AccessKey Secret",
  "app_key": "你的 AppKey"
}

运行

# Tauri 桌面应用
cd src-tauri && cargo tauri dev

技术栈

依赖 用途
Tauri 2 桌面应用框架
cpal 跨平台音频采集
hound WAV 文件读写
reqwest HTTP 客户端(异步)
tokio 异步运行时
sqlx SQLite 数据库
serde JSON 序列化/反序列化

后续计划

  • 支持实时流式识别(WebSocket)
  • 添加说话人分离功能
  • 支持更多语言识别
  • 语音胶囊文件系统
  • 本地优先存储策略
  • 全局热键支持

Fuson 浮声
Float your voice, own your thought.
让声音浮于本地,让思想归于你。

License

MIT License

About

voice_timeline

Resources

Stars

Watchers

Forks

Packages

 
 
 

Contributors

Languages