MEmoConv

在TalkNet_ASD的环境下如果是3090的机器上，那么需要安装更新版本的cuda下的torch, 但是cap机器访问不了外网，所以需要手动下载 pip3 install torch==1.9.0+cu111 torchvision==0.10.0+cu111 torchaudio==0.9.0 https://download.pytorch.org/whl/cu111/torch-1.9.0+cu111-cp37-cp37m-linux_x86_64.whl https://download.pytorch.org/whl/cu111/torchvision-0.10.0%2Bcu111-cp37-cp37m-linux_x86_64.whl https://download.pytorch.org/whl/torchaudio-0.9.0-cp37-cp37m-linux_x86_64.whl

下载数据, 可以从YouTube上下载或者从百度云下载

python37 环境, youtube-dl 工具如何下载数据，高质量数据且包含更多信息的数据. 存储目录: /Users/jinming/Desktop/works/memoconv_rawmovies

youtube-dl --ignore-errors -c -f bestvideo+bestaudio --merge-output-format mp4 --output '/Users/jinming/Desktop/works/memoconv_rawmovies/%(title)s' --playlist-items 16 'https://www.youtube.com/watch?v=AAT5NepFkaQ&list=PLwqZU7cJTZQ_uVVudaXaxIZ6O4xaUtARb'

目标是1000个对话，一部电视剧挑选20个对话(20/3=7集左右)，共需要50部电视剧

从百度云下载。之前的用的搜索的地址，失效了。

Leo emobert docker 更新ffmpeg -- 之前配置的 2.8.7 版本不行

还是很麻烦的 https://blog.csdn.net/yuxielea/article/details/103146362 配置 x264 和环境

ffmpeq 抽取语音信号

cd /Users/jinming/Desktop/works/memoconv_convs/fendou ffmpeg -i fendou_2.mp4 -vn -f wav -acodec pcm_s16le -ac 1 -ar 16000 fendou_2.wav

采用讯飞的语音转写功能，使用双人对话场景，可以生成说话人，可以生成每个词对应的时间戳，完美契合我们的场景。

目前的讯飞听见的字幕生成、讯飞听见都不行。等待开发者API的返回结果看看咋样。 --垃圾 Discard

找一个合适的demo --Done

满足哪些要求呢？语音视觉清晰，情感丰富，情感变化比较多不要求有多情感标注。最好是有turn内情感变化和turn之间的情感变化。另外主题要符号通俗易懂且政治正确。 fumuaiqing_1 fumuaiqing_20

Update for 11/01 --DDL 11/15

论文修改，再过几遍，修改一遍，让李老师帮忙再修改一遍
模型修正，采用更高效的融合方法要求database的详细信息, datasheet, supplemental matrial -- 准备一下，问问宇晴参考这篇论文 https://arxiv.org/abs/1803.09010

Name		Name	Last commit message	Last commit date
Latest commit History 114 Commits
codes		codes
extract_fts		extract_fts
preprocess		preprocess
.gitignore		.gitignore
README.md		README.md
memoconv		memoconv
test		test

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

MEmoConv

下载数据, 可以从YouTube上下载或者从百度云下载

Leo emobert docker 更新ffmpeg -- 之前配置的 2.8.7 版本不行

ffmpeq 抽取语音信号

采用讯飞的语音转写功能，使用双人对话场景，可以生成说话人，可以生成每个词对应的时间戳，完美契合我们的场景。

找一个合适的demo --Done

Update for 11/01 --DDL 11/15

About

Releases

Packages

Contributors 2

Languages

AIM3-RUC/MDI-M3ED

Folders and files

Latest commit

History

Repository files navigation

MEmoConv

下载数据, 可以从YouTube上下载 或者 从百度云下载

Leo emobert docker 更新ffmpeg -- 之前配置的 2.8.7 版本不行

ffmpeq 抽取语音信号

采用讯飞的语音转写功能，使用双人对话场景，可以生成说话人，可以生成每个词对应的时间戳，完美契合我们的场景。

找一个合适的demo --Done

Update for 11/01 --DDL 11/15

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

下载数据, 可以从YouTube上下载或者从百度云下载

Packages