逛 GitHub 的时候,发现了一个 AI 会议总结 & 录音笔记工具。
刚刚在 GitHub 上开源,就获得了 1.7K 的 Star。
它非常适合注重隐私的小团队、初创公司或个人,需要高效的会议记录和知识沉淀工具,又不想把会议录音交给第三方公司。
可以基于这个开源项目搭一个应用,数据全在自己手里。
01
项目简介
Speakr 是一款开源免费、支持完全本地化部署的 AI 会议助手,专为解决传统会议记录效率低、隐私风险高的问题而设计。
自动化处理录音内容,让你能快速获取文字记录、智能摘要,甚至通过聊天交互方式提取会议关键信息,同时确保数据100%私密存储。以下是其核心特点:
① 自动转文字:
把录音(MP3, WAV 都行,甚至能直接在浏览器里录)扔给 Speakr,它就能帮你把里面的讲话内容一字一句地转成文字稿。
Speakr 能自动阅读整个转录稿,生成一个简洁的标题和内容摘要,让你一眼抓住会议核心。
你可以像跟朋友聊天一样,在 Speakr 的界面上问:“刚才讨论的预算具体是多少?” 或者 “小明对项目A提了哪些建议?”。Speakr 会理解你问题的意思,从会议记录里找出相关部分回答你。如果会议上有好几个人讲话,Speakr 还能尝试区分谁说了哪句话。转写出来会标记「说话人1」、「说话人2」。之后你可以在一个专门的界面里,把这些「说话人1」改成「张三」,「说话人2」改成「李四」。02
如何部署
Speakr 支持两种部署方式,标准模式和 ASR 模式,ASR 模式带说话人分离。
以 ASR 模式安装举例,你可以通过如下命令进行初始化和配置:
mkdir speakr-asr && cd speakr-asr
cat > docker-compose.yml <
services:
app:
image: learnedmachine/speakr:latest
container_name: speakr
restart: unless-stopped
ports:
- "8899:8899"
env_file:
- .env
volumes:
- ./uploads:/data/uploads
- ./instance:/data/instance
depends_on:
- whisper-asr
whisper-asr:
image: onerahmet/openai-whisper-asr-webservice:latest-gpu
container_name: whisper-asr
ports:
- "9000:9000"
environment:
- ASR_MODEL=large-v3
- ASR_ENGINE=whisperx
- HF_TOKEN=your_huggingface_token
deploy:
resources:
reservations:
devices:
- driver: nvidia
count: 1
restart: unless-stopped
EOF
cat > .env <
TEXT_MODEL_BASE_URL=https://api.openai.com/v1
TEXT_MODEL_API_KEY=your_openai_api_key
TEXT_MODEL_NAME=gpt-4-turbo
USE_ASR_ENDPOINT=true
ASR_BASE_URL=http://whisper-asr:9000
ASR_DIARIZE=true
ASR_MIN_SPEAKERS=2
ASR_MAX_SPEAKERS=5
ADMIN_USERNAME=admin
ADMIN_EMAIL=admin@example.com
ADMIN_PASSWORD=changeme
ALLOW_REGISTRATION=false
EOF
docker compose up -d
Docker 启动之后,可以访问地址:http://localhost:8899 来访问搭建好的应用。
它把强大的 AI 转录、总结和对话能力,通过一个美观的界面,打包成一个你可以完全掌控在自己手中的软件。
Speakr 绝对值得一试,它能成为你个人或团队的强大 AI 会议助理。
03
都看到这了,关注下吧。
这个公众号历史发布过很多有趣的开源项目,如果你懒得翻文章一个个找,你直接关注微信公众号:逛逛 GitHub ,后台对话聊天就行了。
#逛逛GitHub #开源
#GitHub #AI