
STT是一款功能强大的本地语音识别转文字工具,基于fast-whisper开源模型开发,可以将视频和音频中的人声识别并转换为文字。它支持多种输出格式,包括JSON、带时间戳的SRT字幕以及纯文本格式,为用户提供了灵活的选择。

STT为用户提供了一个强大而灵活的离线语音识别解决方案,无论是个人使用还是企业部署,都是一个值得尝试的工具。欢迎大家下载使用,如有问题可在GitHub提issue讨论。
Copyright © 2025 AI图片论坛 版权所有. 站点地图