之前用过N种方法下载TED字幕,现在都已失效。无奈之下 在5.1期间DIY了一个Perl脚本,之前的博客有过介绍。这两天有网友问我用法,总结一下,如下:
用法:
tedsubtitle "TED演讲URL" 语言编码(中文:chi_hans,英文:eng) 输出字幕文件
或者直接修改subtitle.bat批处理文件里的URL链接与语言。
如果看到这里,您还没有用起来,请移步看这个
教程
例如:
tedsubtitle "
http://www.ted.com/talks/stephen_wolfram_computing_a_theory_of_everything.html" eng wolfram.srt
说明:
1 语言标识( Language Code)请见
http://www.disandu.com/download/languageCode.txt
2 目前只支持命令行模式,Windows平台通过 “开始菜单” 点 “运行”,输入cmd进入命令行模式,执行上述命令之前需先cd进入tedsubtitle文件所在目录。
3 字幕文件为SubRip格式。或者直接修改打包中的testTedSub.bat文件,更改URL与输出文件名,然后执行BAT文件。
4 Windows默认播放器不能载入字幕文件,推荐用KMplayer或QQ影音。
5 经过测试,tedsubtitle程序能运行Windows32位与64位平台,所以不单独对各个平台进行打包。
6任何问题和建议都请联系我:
think.hy@gmail.com
或者直接在Github
项目里写issue.
====================================================================================
更新记录:
11/09/11 重新上传发布TedSubtitle,增加了readme.txt与tedsubtitle.bat。发布报告见:http://blog.youkuaiyun.com/thinkhy/article/details/6768175
11/09/03 优化了部分代码和输出信息,增加了对命令行参数个数的判断。
11/08/06 增加了自动识别广告时间的功能(见源代码),需要最新版exe文件的同学给我发Email。
11/06/25 最新脚本代码
https://gist.github.com/949659 ,目前主要对广告时间进行微调。
12/01/26 调整了广告时间的匹配正则表达式
12/01/27 更新了博客文章,介绍脚本的使用方法:
http://blog.youkuaiyun.com/thinkhy/article/details/7216354
12/04/17 更新了下载地址。
12/08/05 命令行中的URL需用引号包括起来,否则会出现命令参数解析失败。
12/10/21 根据
doyouwanna反馈的问题,添加了对前置%号的html特殊字符的解析。 感谢doyouwanna!
12/12/22 Yan Xue Feng反馈工具已失效,赶在世界末日之后的第一个小时,修改了问题^_^ Thanks to Yan Xue Feng.
13/03/23 Xianglin Meng反馈talk id无法获取,原因是ted.com最近更新了Javascript脚本,问题已经解决。 Thanks to Xianglin.
12/15/2013 CYan反馈中文字幕播放时出现乱码,原因是播放器不能解析utf-8编码的文本,中文编码已改为CP936,问题解决。 Thanks to CYan.
3/19/2014 make some changes to accommodate the update of TED.com.
Thanks to Xianglin for throwing me an email and sharing his subtitle package with me. [thinkhy 3/19/2014]
Thanks to Xianglin for throwing me an email and sharing his subtitle package with me. [thinkhy 3/19/2014]