78 0

AI 视频图文创作助手是一款 Web 工具, 基于 AI 大模型, 一键将视频和音频转化为各种风格的文档, 无需登录注册, 前后端本地部署,以极低的成本体验 AI 视频/音频转风格文档服务。

这个项目目前在gitlab上拥有总星标数量:✨2k stars

AI-Media2Doc - 一键将视频和音频转化为多种风格的文档

✨ 核心功能

  • ✅ 完全开源:MIT 协议授权,支持本地部署。
  • 🔒 隐私保护:无需登录注册,任务记录保存在本地
  • 💻 前端处理:采用 ffmpeg wasm 技术,无需本地安装 ffmpeg
  • 🎯 多种风格支持:支持小红书/公众号/知识笔记/思维导图/内容总结等多种文档风格支持。
  • 🤖 AI 对话:支持针对视频内容进行 AI 二次问答。
  • 🎬 支持字幕导出: 结果一键导出为字幕文件。
  • 🖼️ 智能截图: 基于字幕信息智能截图并插入文章, 无需视觉大模型, 实现真正的图文并茂。
  • 🎨 支持自定义 Prompt:支持在前端自定义配置 prompt。
  • 🐳 一键部署:支持 Docker 一键部署。
  • 🔒 支持设置访问密码: 后端设置访问密码之后, 前端用户需要填写该密码才可以正常使用。

🔜 未来计划

  • 🎙️ 音频识别支持使用 fast-whisper 本地大模型处理,进一步降低成本

项目链接

GitHub:https://github.com/hanshuaikang/AI-Media2Doc

 

相关文章

Kimi k2 - 开源 ChatGPT 替代方案 成本降低 95%
Seelen UI - 打造个性化Windows桌面的利器 秒变 Mac OS 界面风格
ChatTTS - 用于对话场景的免费文本转语音TTS模型
HYPIR - 中国科学院团队推出的图像修复大模型
Stirling PDF - 优秀开源的PDF在线处理工具
IOPaint - 超强的AI图像修复工具

发布评论