article_image

我一直觉得飞书妙记是一个很不错的产品,可以解决很多场景下的问题,比如会议纪要、长视频转文字,甚至给视频做字幕。

而这款 Memo AI 的出现,很让我感到惊喜,它在本地就给出了一套类似飞书妙记的完整解决方案,解决了很多常见的痛点,比如音视频转文字、字幕生成、翻译和 AI 摘要等功能,甚至还能实现字幕语音二次合成,让用户能够高效处理各种视频音频内容。

🔗 Memo AI 官网

Memo 绝大部分功能都是免费提供与使用,如基础模型语音转写文本不限制分钟,本地字幕不限制翻译数量,字幕合成语音不限制合成数量。

目前下载后使用 App 只需要输入邮箱,就能获取激活码,无需付费。使用也非常简单,基本做到了开箱即用。

语音转文字功能完全免费

Memo AI 的语音转文字功能是免费提供的。支持对 MP4、MP3、AAC、M4A 等音频和视频格式的本地文件进行本地转译。

在转写前会自动下载一个 77 MB 的 Tiny 级别的转写模型,如果追求更高的质量和特定的语言优化,可以在设置中找到更大规模的转写模型,这些高级模型也是免费的。

作为对比,阿里云的云端语音转文字识别的价格约为 30 小时/100 元。

然后你只需要添加视频,然后就可以实时看到转写的进度。

由于 Memo AI 是直接在本地设备上用本地的性能进行的文字转写,也就不存在云端上传的步骤了。

这一点对于大型视频文件转文字来说,也是省时省力,在确保隐私安全的同时,也变相提升了处理速度。

如果你想识别发言人,Memo 也提供了一个 260 MB 的发言人识别组件 ,对于处理会议记录、多人播客节目等转写任务应该会很有帮助。

等待转写完成后,可以导出为纯文本(TXT、MD、DOCX)、字幕格式(SRT、ASS)。甚至可以直接将字幕嵌入视频进行 MP4 格式的导出。

如果你只进行这一步,是不需要调用任何外部 AI 模型、翻译 API 的,自然也是免费的。

目前 Memo 的免费版可以用 CPU 进行字幕转写。如果你的设备是 M 系列的 Mac 设备,直接使用免费版就足够发挥性能优势了。

如果想提升一下速度,比如 Windows 机器想用 GPU 进行加速,可以考虑购买一个 Pro 版本,可以解锁 GPU 转写功能来提高效率。

AI 翻译 TTS 语音合成等高级功能

Memo AI 的主要收费点则是在于 AI 相关的高级功能,比如 GPU 加速、语音合成、批量模式、用它提供的高级模型等,从功能角度看,更多是面向商业的批量用途。对于个人用户而言,付费并不是必选项。

模型支持非常丰富,不仅支持 OpenAI、ChatGLM、DeepSeek、本地的 Ollama 等语言模型。(如果你有自己的 API Key,使用这些模型也是不需要付费的。)

同时也支持传统的 DeepL、Google 等翻译 API 接口,毕竟翻译这样的任务,传统翻译 API 在速度上更有优势。


默认支持 4 家常见模型
默认支持 4 家常见模型

除了默认的几款常见的 AI 模型外,还支持语音合成模型,比如内置了免费的 Edge TTS 和 需要 API 的 OpenAI TTS、ElevenLabs TTS。

这些模型可以运用到给视频做 AI 配音这块。


更多方案可以通过第三方集成添加
更多方案可以通过第三方集成添加

如果上述还不够用,Memo 也能通过第三方集成来进一步扩展它的能力。

如果你喜欢听播客

Memo AI 还支持 Youtube、Apple Podcast、小宇宙等链接转码。可以兼容以下网址:youtube.comxiaoyuzhoufm.compodcasts.apple.compodcasts.google.com

你只需要——

  1. 复制 YouTube 视频或播客的链接
  2. 将其粘贴到 Memo 的输入框内
  3. 点击"转译"开始转换过程

这样一来,一些没有内置中文翻译的 Youtube 视频和超长英文播客,也可以直观地以文字形式进行阅读了。

之前我们在收集每周消息的素材时,就遇到过一个马斯克 8 小时的访谈视频,为了了解其中的内容而想办法获取和处理字幕,都并不轻松。如果当时有 Memo 的帮助,应该会轻松很多。

更详细的使用介绍和限制,可以在它的官方文档中进行进一步了解:学习使用 Memo AI

正如我开头所说,这是一个飞书妙记很好的本地替代品,而飞书妙记作为一个 SaaS 服务总会存在这样那样的限制(尤其是时长和容量方面)。此前一直没有一个很好的本地化方案。

现在有了 Memo AI 就可以很大程度上满足我的需要了。再加上 Memo 的免费版本放的非常宽松,无需付费就可以实现绝大部分的功能,很值得一试。


author_avatar

#UNTAG Developer