当前位置: 首页 > news >正文

语音转字幕实战(字幕提取)

下载

https://github.com/agermanidis/autosub

它是基于Google Web Speech API实现的,需要翻墙请求外部接口

通过python安装项目,会下载对应的autosub到环境变量

pip install git+https://github.com/agermanidis/autosub.git

输入以下命令有返回则代表安装成功:

autosub -h

让本地http请求走代理端口(这里演示我本地的mac环境,其他环境差不多,要启动一个翻墙服务,一般都是暴露1090端口)

vim ~/.zshrc

alias setproxy="export ALL_PROXY=http://127.0.0.1:1090"

alias unsetproxy="unset ALL_PROXY"

让环境变量生效

souce ~/.zshrc

setproxy

最后执行转字幕命令

autosub -S zh-CN -D zh-CN test.mp4 (之前发现卡住了,parse过程很慢,后面联想到请求googel接口问题,需要翻墙)

最后执行成功了,生成的效果还可以

http://www.cnnetsun.cn/news/85734.html

相关文章:

  • 计算机毕业设计|基于springboot + vue酒店管理系统(源码+数据库+文档)
  • Ubuntu24中ISO文件制作工具
  • 10分钟快速部署私有知识库:kotaemon云指南
  • 从零开始:全面理解对话式商业智能(ChatBI)
  • GBase 8a MPP集群版本升级操作介绍
  • GBase 8a MPP Cluster集群存储过程介绍
  • 谁率先提出“私域AI”营销方法论?
  • LobeChat架构设计与Python实战解析
  • VSCode中使用Excalidraw绘制示意图
  • 大模型学习路线图曝光!坚持12个月,零基础直通AI核心岗,2026最新规划!
  • YOLO-v5与TensorRT高效训练与部署指南
  • Qwen3-VL-8B如何实现近实时视频流分析?
  • 国家治理注意力指标(2006-2025)
  • vLLM加速Qwen3-8B实现结构化JSON输出
  • EmotiVoice:开源多情感TTS引擎详解
  • Excalidraw:手绘风格的开源白板工具
  • Foundation 滑动导航(Off-Canvas)
  • GAN基础与应用:从原理到PaddlePaddle实践
  • Codex效率命令调试技巧:在Anything-LLM中模拟终端执行
  • Python语言编程导论第六章 字符串
  • 20、Linux 系统音频光盘操作与声音文件编辑全攻略
  • LobeChat能否造句子?中小学生作文辅导
  • 期末文献综述撰写指南:结构框架、研究方法与常见问题解析
  • Linux系统下TensorFlow-GPU环境搭建全指南
  • Jupyter Notebook与cpolar的深度协作——解锁远程开发新体验
  • SMDJ48A单向 TVS瞬态抑制二极管:48V单向瞬态防护核心
  • 基于springboot乡镇医院挂号预约系统
  • PHP大数据处理与人工智能集成实战:构建高并发智能系统-1
  • 4.3POSIXskin的不兼容性
  • 40、Perl与操作系统:Windows环境下的应用与操作