Skip to content

NJUPT-SAST Winter of Code Challange (2023-2024 Python Group)

Notifications You must be signed in to change notification settings

WiIIiamWei/NJUPT-SAST-WoC-2023-Python

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

50 Commits
 
 
 
 
 
 
 
 

Repository files navigation

NJUPT-SAST-WoC-2023-Python

南京邮电大学 - 校大学生科协WoC仓库(2023~2024 Python组任务),用于存放WoC项目。作者 @WiIIiamWei @uiuik0

本仓库仅供讲师浏览。未经允许直接使用/照抄其中代码是不允许且违反WoC规则的。

本项目正式结项。项目可见性将从私人转为公开。

还在新手村,高手请不要笑我。

现在的状态

所有项目已基本完成,可以验收,有空会改进。

MNIST手写数字识别

模型使用tensorflow.keras搭建,结构为CNN。

代码:NJUPT_WOC-MNIST-fin.ipynb

模型:Releases

猫狗识别

模型使用keras搭建,在开源模型Resnet50基础上修改。图片处理使用rembg去背景。

代码

模型:catdogde_ww.ipynb

图片处理(训练集):picprocess_train.ipynb

图片处理(测试集):picprocess_test.ipynb

图片处理(Alpha通道换白底):convert.ipynb

模型

文件:Releases

测试集输出数据:submission_final.csv

爬取抖音

已基本实现所有要求的功能。

代码:tiktok_2.ipynb

爬取数据(为方便浏览,改成了csv):抖音热搜榜.csv

爬取淘宝评论

项目已经成功爬取至少365条评论,运行 还算稳定(需要fresh cookies) 不太稳定,在不同环境上表现不同。

正确爬取的数据嵌入在爬取代码中。

代码

从淘宝搜索页提取的XHR文件提取商品id:get_id.ipynb

提取登录cookies:get_cookies.ipynb

爬取:tb.ipynb