首先呢先来介绍一下何为paddlehub
paddlehub:便捷地获取PaddlePaddle生态下的预训练模型,完成模型的管理和一键预测。配合使用Fine-tune API,可以基于大规模预训练模型快速完成迁移学习,让预训练模型能更好地服务于用户特定场景的应用 接下来大家一起来看看吧,看完保证你会搭建paddlehub的web服务端。
我们有时候想把照片中的人像抠出来,是不是还需要打开ps呢?还要一点一点的去抠图。大家看下面这个的效果,符不符合你的要求呢?
DeepLabv3+ 是Google DeepLab语义分割系列网络的最新作,其前作有 DeepLabv1, DeepLabv2, DeepLabv3。在最新作中,作者通过encoder-decoder进行多尺度信息的融合,同时保留了原来的空洞卷积和ASSP层, 其骨干网络使用了Xception模型,提高了语义分割的健壮性和运行速率,在 PASCAL VOC 2012 dataset取得新的state-of-art performance。该PaddleHub Module使用百度自建数据集进行训练,可用于人像分割,支持任意大小的图片输入。 deeplabv3p_xception65_humanseg文档链接
你有多久没有换过你的QQ、微信头像了呢?看看下面这个效果,是不是有一种想把头像风格化的心情,哈哈。
艺术风格迁移模型可以将给定的图像转换为任意的艺术风格。本模型StyleProNet整体采用全卷积神经网络架构(FCNs),通过encoder-decoder重建艺术风格图片。StyleProNet的核心是无参数化的内容-风格融合算法Style Projection,模型规模小,响应速度快。模型训练的损失函数包含style loss、content perceptual loss以及content KL loss,确保模型高保真还原内容图片的语义细节信息与风格图片的风格信息。预训练数据集采用MS-COCO数据集作为内容端图像,WikiArt数据集作为风格端图像。 stylepro_artistic文档链接
小伙伴们看到这里是不是感觉,咦怎么又是这个模型呢? 哈哈 你没看错图像合并就是先用这个模型进行抠图,在进行合并的,这样大家就可以想去哪里就去哪里啦!
DeepLabv3+ 是Google DeepLab语义分割系列网络的最新作,其前作有 DeepLabv1, DeepLabv2, DeepLabv3。在最新作中,作者通过encoder-decoder进行多尺度信息的融合,同时保留了原来的空洞卷积和ASSP层, 其骨干网络使用了Xception模型,提高了语义分割的健壮性和运行速率,在 PASCAL VOC 2012 dataset取得新的state-of-art performance。该PaddleHub Module使用百度自建数据集进行训练,可用于人像分割,支持任意大小的图片输入。 deeplabv3p_xception65_humanseg文档链接
文字识别大家一定都非常熟悉了,不管是在我们生活中还是工作中,用到的都是非常多的,大家也可以看看效果(偷偷告诉你们连笔字效果不行,哈哈)
chinese_ocr_db_crnn_server Module用于识别图片当中的汉字。其基于chinese_text_detection_db_server检测得到的文本框,继续识别文本框中的中文文字。识别文字算法采用CRNN(Convolutional Recurrent Neural Network)即卷积递归神经网络。其是DCNN和RNN的组合,专门用于识别图像中的序列式对象。与CTC loss配合使用,进行文字识别,可以直接从文本词级或行级的标注中学习,不需要详细的字符级的标注。该Module是一个通用的OCR模型,支持直接预测。 chinese_ocr_db_crnn_server文档链接