Skip to content

Latest commit

 

History

History
144 lines (92 loc) · 4.81 KB

移植shaka-player字幕解析部分为本地程序.md

File metadata and controls

144 lines (92 loc) · 4.81 KB

前言

目前shaka-packager并不支持dash mp4内嵌字幕转回文本字幕

之前从shaka-player翻译了部分代码,实现了dash mp4内嵌vtt的解析,不过不太完善

于是决定直接从shaka-player里面把解析部分单独拿出来

步骤

首先下载shaka-player的源代码,github直接下载zip就可以了

然后将lib文件夹解压,重命名为shaka

通过简单阅读源代码,可以发现代码中大量使用goog.providegoog.require

我们需要知道的是该项目使用了google-closure-library这个库

以及使用google-closure-compiler进行编译,即将整个项目编译为单个js文件

接下来新建一个parsertest.js文件,在这个文件里面,我们通过类似的写法调用解析的方法即可

这部分可以参考mp4_vtt_parser_unit.js

更多官方案例(PS 大多数时候看官方的测试用例可以学到很多东西)

这里简化了下,最终代码如下

goog.module('parser');

require("google-closure-library");
goog.require("shaka.text.Mp4VttParser");
const fs = require("fs");

try {
    const vttInitSegment = new Uint8Array(fs.readFileSync("test/assets/vtt-init.mp4"));
    const vttSegment = new Uint8Array(fs.readFileSync("test/assets/vtt-segment.mp4"));
    console.log("文件加载完成");
    const parser = new shaka.text.Mp4VttParser();
    console.log("Mp4VttParser初始化析完成");
    parser.parseInit(vttInitSegment);
    console.log("vttInitSegment解析完成");
    const time = {periodStart: 0, segmentStart: 0, segmentEnd: 0};
    const result = parser.parseMedia(vttSegment, time);
    console.log("vttSegment解析完成");
    for (let i = 0; i < result.length; i++){
        console.log(result[i]);
    }
} catch (err) {
    console.trace(err);
}

这里读取了本地文件,将shaka-player用的测试文件复制过来即可

这里直接弄好了,路径是test/assets/vtt-init.mp4test/assets/vtt-segment.mp4

现在代码是没办法直接运行的,因为node不认识goog.xxx

所以要使用google-closure-compiler将全部js编译成一个js

第一步执行npm install命令

第二步将shaka/debug/log.js里面的window.console && window.console.log.bind改为true

因为node没有window

第三步在shaka/util/xml_utils.jsclass之前,也就是shaka.util.XmlUtils = class前面加一句

  • var { Node, DOMParser, Element } = require('xmldom');

第四步在node_modules/xmldom/lib/dom-parser.js末尾导出的地方加三句

exports.Node = require('./dom').Node;
exports.Element = require('./dom').Element;
exports.Document = require('./dom').Document;

第五步在node_modules/xmldom/lib/dom.js末尾导出的地方加两句

exports.Element = Element;
exports.Document = Document;

第六步在shaka/text/ttml_text_parser.js开头加两句

var { Document } = require('xmldom');
var doc = new Document();

然后把const span = document.createElement('span');document改为doc

这样才能正常解析ttml

现在可以执行下面的命令编译为一个单独的js了

有兴趣可以参考closure-library官方文档,看看hello world的整体过程

  • https://google.github.io/closure-library/develop/get-started

命令如下

npx google-closure-compiler --js parsertest.js --js shaka/**/*.js --js=node_modules/xmldom/**/*.js --js=node_modules/google-closure-library/**/*.js --js=!**/goog/asserts/asserts.js --dependency_mode=PRUNE --entry_point=goog:parser --js_output_file=parsertest_compiled.js

具体可以通过npx google-closure-compiler --help查看详细说明

简单解释一下

  • --js 后面接要一起编译的js文件
    • 可以是单个文件
    • 可以是xx/*.js或者xx/**/*.js这样的通配符表示
    • 最前面加一个!表示排除
  • --dependency_mode 表示编译的模式
    • PRUNE 表示根据--entry_point设定的文件,然后只导入需要的依赖,这很重要,不然会把很多用不到的也编译了,然后出现很多找不到window的报错(被坑了很久)
  • --entry_point 入口点,姑且理解为主程序入口吧
  • --js_output_file 最终输出文件

注意命令中的=不是必须的

现在可以执行node parsertest_compiled.js命令测试了

解析正常~