努力鸭

AI-Media2Doc - 一键将视频和音频转化为多种风格的文档

链接直达

319 0

AI 视频图文创作助手是一款 Web 工具, 基于 AI 大模型, 一键将视频和音频转化为各种风格的文档, 无需登录注册, 前后端本地部署，以极低的成本体验 AI 视频/音频转风格文档服务。

这个项目目前在gitlab上拥有总星标数量：✨2k stars

AI-Media2Doc - 一键将视频和音频转化为多种风格的文档

✨ 核心功能

✅ 完全开源：MIT 协议授权，支持本地部署。
🔒 隐私保护：无需登录注册，任务记录保存在本地
💻 前端处理：采用 ffmpeg wasm 技术，无需本地安装 ffmpeg
🎯 多种风格支持：支持小红书/公众号/知识笔记/思维导图/内容总结等多种文档风格支持。
🤖 AI 对话：支持针对视频内容进行 AI 二次问答。
🎬 支持字幕导出: 结果一键导出为字幕文件。
🖼️ 智能截图: 基于字幕信息智能截图并插入文章, 无需视觉大模型, 实现真正的图文并茂。
🎨 支持自定义 Prompt：支持在前端自定义配置 prompt。
🐳 一键部署：支持 Docker 一键部署。
🔒 支持设置访问密码: 后端设置访问密码之后, 前端用户需要填写该密码才可以正常使用。

🔜 未来计划

🎙️ 音频识别支持使用 fast-whisper 本地大模型处理，进一步降低成本

项目链接

GitHub：https://github.com/hanshuaikang/AI-Media2Doc

GitHub项目

0 6

暗壳AI - 家居行业AIGC设计平台

Upscayl - 免费开源的 AI 图片无损放大工具

Kimi k2 - 开源 ChatGPT 替代方案成本降低 95%

Seelen UI - 打造个性化Windows桌面的利器秒变 Mac OS 界面风格

ChatTTS - 用于对话场景的免费文本转语音TTS模型

HYPIR - 中国科学院团队推出的图像修复大模型

Stirling PDF - 优秀开源的PDF在线处理工具

IOPaint - 超强的AI图像修复工具

发布评论取消回复