南京邮电大学 - 校大学生科协WoC仓库(2023~2024 Python组任务),用于存放WoC项目。作者 @WiIIiamWei @uiuik0
本仓库仅供讲师浏览。未经允许直接使用/照抄其中代码是不允许且违反WoC规则的。
本项目正式结项。项目可见性将从私人转为公开。
还在新手村,高手请不要笑我。
所有项目已基本完成,可以验收,有空会改进。
模型使用tensorflow.keras
搭建,结构为CNN。
模型:Releases
模型使用keras
搭建,在开源模型Resnet50基础上修改。图片处理使用rembg
去背景。
图片处理(训练集):picprocess_train.ipynb
图片处理(测试集):picprocess_test.ipynb
图片处理(Alpha通道换白底):convert.ipynb
文件:Releases
测试集输出数据:submission_final.csv
已基本实现所有要求的功能。
爬取数据(为方便浏览,改成了csv):抖音热搜榜.csv
项目已经成功爬取至少365条评论,运行 还算稳定(需要fresh cookies) 不太稳定,在不同环境上表现不同。
正确爬取的数据嵌入在爬取代码中。
从淘宝搜索页提取的XHR文件提取商品id:get_id.ipynb
提取登录cookies:get_cookies.ipynb
爬取:tb.ipynb