社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  Git

GitHub 上开源的 AI 录音笔记神器,真的绝了。

逛逛GitHub • 1 周前 • 494 次点击  

逛 GitHub 的时候,发现了一个 AI 会议总结 & 录音笔记工具。

刚刚在 GitHub 上开源,就获得了 1.7K 的 Star。

它非常适合注重隐私的小团队、初创公司或个人,需要高效的会议记录和知识沉淀工具,又不想把会议录音交给第三方公司。

可以基于这个开源项目搭一个应用,数据全在自己手里。

01

项目简介

Speakr 是一款开源免费、支持完全本地化部署的 AI 会议助手,专为解决传统会议记录效率低、隐私风险高的问题而设计。

开源地址:https://github.com/murtaza-nasir/speakr

自动化处理录音内容,让你能快速获取文字记录、智能摘要,甚至通过聊天交互方式提取会议关键信息,同时确保数据100%私密存储。以下是其核心特点:

① 自动转文字:

把录音(MP3, WAV 都行,甚至能直接在浏览器里录)扔给 Speakr,它就能帮你把里面的讲话内容一字一句地转成文字稿。

② 智能总结:
光有文字稿可能还太长?
Speakr 能自动阅读整个转录稿,生成一个简洁的标题和内容摘要,让你一眼抓住会议核心。
③ 聊天问答:
这个最酷。
你可以像跟朋友聊天一样,在 Speakr 的界面上问:“刚才讨论的预算具体是多少?” 或者 “小明对项目A提了哪些建议?”。
Speakr 会理解你问题的意思,从会议记录里找出相关部分回答你
④ 区分说话人:
如果会议上有好几个人讲话,Speakr 还能尝试区分谁说了哪句话。转写出来会标记「说话人1」、「说话人2」。
之后你可以在一个专门的界面里,把这些「说话人1」改成「张三」,「说话人2」改成「李四」。
以后系统还能记住这些人名,方便下次自动识别。
⑤ 录音:

02

如何部署

Speakr 支持两种部署方式,标准模式和 ASR 模式,ASR 模式带说话人分离。

以 ASR 模式安装举例,你可以通过如下命令进行初始化和配置:

# 创建项目目录mkdir speakr-asr && cd speakr-asr
# 创建 docker-compose.ymlcat > docker-compose.yml <services:  # 主应用服务  app:    image: learnedmachine/speakr:latest    container_name: speakr    restart: unless-stopped    ports:       - "8899:8899"    env_file:      - .env    volumes:      - ./uploads:/data/uploads      - ./instance:/data/instance    depends_on:      - whisper-asr
  # ASR 转录服务  whisper-asr:    image: onerahmet/openai-whisper-asr-webservice:latest-gpu    container_name: whisper-asr    ports:      - "9000:9000"    environment:      - ASR_MODEL=large-v3      - ASR_ENGINE=whisperx      - HF_TOKEN=your_huggingface_token    deploy:      resources:        reservations:          devices:            - driver: nvidia              count: 1    restart: unless-stoppedEOF
# 创建配置文件cat > .env <# API 设置TEXT_MODEL_BASE_URL=https://api.openai.com/v1TEXT_MODEL_API_KEY=your_openai_api_keyTEXT_MODEL_NAME=gpt-4-turbo
# ASR 设置USE_ASR_ENDPOINT=trueASR_BASE_URL=http://whisper-asr:9000ASR_DIARIZE=trueASR_MIN_SPEAKERS=2ASR_MAX_SPEAKERS=5
# 管理员账户ADMIN_USERNAME=adminADMIN_EMAIL=admin@example.comADMIN_PASSWORD=changeme
# 高级设置ALLOW_REGISTRATION=falseEOF
# 启动服务docker compose up -d

Docker 启动之后,可以访问地址:http://localhost:8899 来访问搭建好的应用。

    它把强大的 AI 转录、总结和对话能力,通过一个美观的界面,打包成一个你可以完全掌控在自己手中的软件。

    Speakr 绝对值得一试,它能成为你个人或团队的强大 AI 会议助理。

    03

    都看到这了,关注下吧。

    这个公众号历史发布过很多有趣的开源项目,如果你懒得翻文章一个个找,你直接关注微信公众号:逛逛 GitHub ,后台对话聊天就行了。

    #逛逛GitHub #开源  #GitHub #AI

    Python社区是高质量的Python/Django开发社区
    本文地址:http://www.python88.com/topic/185647
     
    494 次点击