日本电影元数据 抓取工具 | 刮削器,配合本地影片管理软件EMBY,KODI等管理本地影片,该软件起到分类与元数据抓取作用,利用元数据信息来分类,供本地影片分类整理使用。
秒杀JavHelper和EverAver
- 免责声明
- 注意
- 你问我答 FAQ
- 效果图
- 如何使用
- 下载
- 简明教程
- 模块安装
- 配置
- (可选)设置自定义目录和影片重命名规则
- 运行软件
- 影片原路径处理
- 异常处理(重要)
- 导入至媒体库
- 关于群晖NAS
- 写在后面
- 本软件仅供技术交流,学术交流使用,本项目旨在学习 Python3
- 本软件禁止用于任何非法用途
- 使用者使用该软件产生的一切法律后果由使用者承担
- 禁止商业用途
- 使用该软件前,请自觉遵守当地法律法规
- 本软件作者保留最终决定权和最终解释权
推荐用法: 使用该软件后,对于不能正常获取元数据的电影可以用 Everaver 来补救
暂不支持多P电影
- 该软件不提供任何影片下载地址,仅供本地影片分类整理使用。
- 元数据包括了影片的:封面,导演,演员,简介,类型......
- 软件永久免费。除了作者钦点以外
- 认真看 异常处理(重要)
-
release的程序可脱离python环境运行,可跳过 模块安装
Release 下载地址(仅限Windows): -
Linux,MacOS请下载源码包运行
-
Windows Python环境:点击前往 选中executable installer下载
-
MacOS Python环境:点击前往
-
Linux Python环境:Linux用户懂的吧,不解释下载地址
1.把软件拉到和电影的同一目录
2.设置ini文件的代理(路由器拥有自动代理功能的可以把proxy=后面内容去掉)
3.运行软件等待完成
4.把JAV_output导入至KODI,EMBY中。
详细请看以下教程
pip install requests
pip install pyquery
pip install lxml
pip install Beautifulsoup4
pip install pillow
[common]
main_mode=1
failed_output_folder=failed
success_output_folder=JAV_output[proxy]
proxy=127.0.0.1:1080
timeout=10
retry=3[Name_Rule]
location_rule=actor+'/'+number
naming_rule=number+'-'+title[update]
update_check=1[media]
media_warehouse=emby
#emby or plex[directory_capture]
directory=
[common]
main_mode=1
1为普通模式
2为整理模式:仅根据女优把电影命名为番号并分类到女优名称的文件夹下
failed_output_folder=failed
success_output_folder=JAV_outputd
设置成功输出目录和失败输出目录
打开config.ini
,在[proxy]
下的proxy
行设置本地代理地址和端口,支持Shadowxxxx/X,V2XXX本地代理端口:
例子:proxy=127.0.0.1:1080
素人系列抓取建议使用日本代理
路由器拥有自动代理功能的可以把proxy=后面内容去掉
本地代理软件开全局模式的同志同上
如果遇到tineout错误,可以把文件的proxy=后面的地址和端口删除,并开启vpn全局模式,或者重启电脑,vpn,网卡
[proxy]
timeout=10
10为超时重试时间 单位:秒
[proxy]
retry=3
3即为重试次数
[update]
update_check=1
0为关闭,1为开启,不建议关闭
[media]
media_warehouse=emby
#emby or plex
可选择emby, plex
如果是PLEX,请安装插件:XBMCnfoMoviesImporter
[debug_mode]
switch=1
如要开启调试模式,请手动输入以上代码到config.ini
中,开启后可在抓取中显示影片元数据
[directory_capture]
directory=
如果directory后面为空,则抓取和程序同一目录下的影片,设置为*
可抓取软件所在目录下的所有子目录中的影片
[Name_Rule]
location_rule=actor+'/'+number
naming_rule=number+'-'+title
已有默认配置
title = 片名
actor = 演员
studio = 公司
director = 导演
release = 发售日
year = 发行年份
number = 番号
cover = 封面链接
tag = 类型
outline = 简介
runtime = 时长
上面的参数以下都称之为变量
自定义规则方法:有两种元素,变量和字符,无论是任何一种元素之间连接必须要用加号 + ,比如:'naming_rule=['+number+']-'+title
,其中冒号 ' ' 内的文字是字符,没有冒号包含的文字是变量,元素之间连接必须要用加号 +
目录结构规则:默认 location_rule=actor+'/'+number
不推荐修改时在这里添加title,有时title过长,因为Windows API问题,抓取数据时新建文件夹容易出错。
影片命名规则:默认 naming_rule=number+'-'+title
在EMBY,KODI等本地媒体库显示的标题,不影响目录结构下影片文件的命名,依旧是 番号+后缀。
[update]
update_check=1
1为开,0为关
如果config.ini
中directory=
后面为空的情况下
当文件名包含:
中文,字幕,-c., -C., 处理元数据时会加上中文字幕标签
可以打开cmd命令提示符,把 AV_Data_capture.py/.exe
拖进cmd窗口回车运行,查看错误,出现的错误信息依据以下条目解决
跳转 网络设置
在软件所在文件夹下新建 JAV_output 文件夹,可能是你没有把软件拉到和电影的同一目录
请设置好代理
同上
目前可以提取元素的影片:JAVBUS上有元数据的电影,素人系列:300Maan,259luxu,siro等,FC2系列
下一张图片来自Pockies的blog 原作者已授权
目前作者已经完善了番号提取机制,功能较为强大,可提取上述文件名的的番号,如果出现提取失败或者异常的情况,请用以下规则命名
妈蛋不要喂软件那么多野鸡片子,不让软件好好活了,操
COSQ-004.mp4
针对 野鸡番号 ,你需要把文件名命名为与抓取网站提供的番号一致(文件拓展名除外),然后把文件拖拽至core.exe/.py
野鸡番号:比如 XXX-XXX-1
, 1301XX-MINA_YUKA
这种野鸡番号,在javbus等资料库存在的作品。
重要:除了 影片文件名 XXXX-XXX-C
,后面这种-C的是指电影有中文字幕!
条件:文件名中间要有下划线或者减号"_","-",没有多余的内容只有番号为最佳,可以让软件更好获取元数据
对于多影片重命名,可以用ReNamer来批量重命名
暂时无解,可能是网络问题或者pillow模块打包问题,你可以用源码运行(要安装好第一步的模块)
开启SMB在Windows上挂载为网络磁盘即可使用本软件,也适用于其他NAS
怎么样,看着自己的日本电影被这样完美地管理,是不是感觉成就感爆棚呢?
tg官方电报群: 点击进群