Skip to content

Commit

Permalink
add ckpt
Browse files Browse the repository at this point in the history
  • Loading branch information
zglxjtu committed Feb 29, 2024
1 parent bdc0a12 commit 444155b
Show file tree
Hide file tree
Showing 4 changed files with 46 additions and 17 deletions.
61 changes: 46 additions & 15 deletions README.md
Original file line number Diff line number Diff line change
Expand Up @@ -40,6 +40,7 @@ python eval.py

## 📢 更新公告
- 2024年01月24日:新增了在84亿tokens预训练语料上的两个新模型Llama2-Chinese-92M-v1-smallvocab与Llama2-Chinese-218M-v1,与Llama2-Chinese-92M-v1进行对比分析模型大小和词表大小对预训练效果的影响!
- 2024年02月29日:新增了在634亿tokens预训练语料上的模型Llama2-Chinese-218M-v3,并以此为基座,使用医学垂直领域SFT数据进行finetune得到模型Llama2-Chinese-218M-v3-MedicalChat

## 🤖预训练
一个好的预训练基座模型要具备**续写**的能力。
Expand Down Expand Up @@ -144,7 +145,7 @@ python sft.py
| Llama2-Chinese-92M-v1-smallvocab<br/>**Notes:vocab size:21131** | (82.78亿 Tokens)<br/>Wiki中文百科<br/>+BaiduBaiKe<br/>+shibing624/medical | max_seq_len=512<br/>dim=512<br/>n_layers=8<br/>n_heads=8 | [模型下载](https://pan.baidu.com/s/1bKtAo8MBlDur6JIDW5cSYg)提取码:ttst |
| Llama2-Chinese-218M-v1 |(82.78亿 Tokens)<br/>Wiki中文百科<br/>+BaiduBaiKe<br/>+shibing624/medical | max_seq_len=1024<br/>dim=1024<br/>n_layers=12<br/>n_heads=8 | [模型下载](https://pan.baidu.com/s/1wLVGFbT4OF4LG2E8Ymf6VA)提取码:c10m |
| Llama2-Chinese-218M-v2 | (140亿 Tokens)<br/>Wiki中文百科<br/>+BaiduBaiKe<br/>+shibing624/medical<br/>+C4_zh | max_seq_len=1024<br/>dim=1024<br/>n_layers=12<br/>n_heads=8 | [模型下载](https://pan.baidu.com/s/1cud_kEyRpXLR74DTRvqjGQ)提取码:dkne |
| Llama2-Chinese-218M-v3 | (634亿 Tokens)<br/>Wiki中文百科<br/>+BaiduBaiKe<br/>+shibing624/medical<br/>+C4_zh<br/>+WuDaoCorpora | max_seq_len=1024<br/>dim=1024<br/>n_layers=12<br/>n_heads=8 | 正在加紧训练中!! |
| Llama2-Chinese-218M-v3 | (634亿 Tokens)<br/>Wiki中文百科<br/>+BaiduBaiKe<br/>+shibing624/medical<br/>+C4_zh<br/>+WuDaoCorpora | max_seq_len=1024<br/>dim=1024<br/>n_layers=12<br/>n_heads=8 | [模型下载](https://pan.baidu.com/s/1-Zd0uBUY23lCvr5s_QSwwg)提取码:tpyy |

### 各个预训练模型效果对比
预训练loss可视化展示:
Expand All @@ -157,6 +158,10 @@ python sft.py

对比模型说明:**Llama2-Chinese-92M-v2** vs **Llama2-Chinese-218M-v2**
![loss_tokens.png](loss_tokens.png)
预训练语料v3:(634亿 Tokens) Wiki中文百科 + BaiduBaiKe + shibing624/medical + C4_zh + WuDaoCorpora

对比模型说明:**Llama2-Chinese-218M-v3**
![loss_tokens-v3.png](loss_tokens-v3.png)
主要从**续写能力**的角度对比各个预训练模型:
```bash
#预训练模型的推理:eval_pretrain.py。
Expand All @@ -167,24 +172,31 @@ python eval_pretrain.py
#示例一:Input:‘床前明月光,疑是地上霜。举头望明月,’
Llama2-Chinese-92M-v1 response:‘倚阑干照斜阳。● 早春何处无天,谁将归家归。谁愿去依花向,谁来教谁回。● 玉泉何处无玉泉,碧水如莲开处。何处何许何许人,何许何何何许地。● 青山里,春色深,月色寒。月影轻,春草凉。月来斜阳,雨声稀’
Llama2-Chinese-92M-v2 response:‘却见天涯何处无。3、 想问你为什么对我这么好?1、 你是否在问自己,我为什么一直爱你?2、我对你有多好?3、 我是谁? 4、 我是谁? 5、 为什么我从来都不像你。’
Llama2-Chinese-218M-v1 response:‘低头思故乡。遥知兄弟登高处,遍插茱萸少一人。注释1、明月光:月光是秋天的明丽之色。清秋:秋季。2、知月与明影:见 知月与明影,比喻知识 知识 知识 知识 知识 知识 知识 知识 知识 秋之明影。唐·韩愈《祭李太白》诗:“一树秋光满 关’
Llama2-Chinese-218M-v1 response:‘低头思故乡。2. 泪眼相对愁成丝,眉梢泪滴泪自流。3. 斜阳外,落花深似海。4. 泪眼横飞心易碎, 千言难答是何许? 梦不成, 泪洒江天。5. 泪眼空, 伤心无处诉, 思君如忆君,泪自流。6. 泪雨声、’
Llama2-Chinese-218M-v2 response:‘低头思故乡。遥知兄弟登高处,遍插茱萸少一人。注释1、明月光:月光是秋天的明丽之色。清秋:秋季。2、知月与明影:见 知月与明影,比喻知识 知识 知识 知识 知识 知识 知识 知识 知识 秋之明影。唐·韩愈《祭李太白》诗:“一树秋光满 关’
Llama2-Chinese-218M-v3 response:‘低头思故乡。人生如风,风雨来时裹住风,风雨后时披着雨。世事茫茫难料,世间万物皆随波逐流。人生如梦,醒与醉随人自个儿。人生如风,风起时能吹动树枝摇摆不定;人生如梦,梦醒时却依然在梦乡挣扎。人生如风,风狂时能翻滚浪涛,风雨中仍能’

#示例二:Input:‘《小王子》是一本畅销童话书,它讲述了:’
Llama2-Chinese-92M-v1 response:‘小王子和他的公主的故事,讲述的是一个善良、勇敢、智慧、善良的小男孩,他们之间的爱情、友情,他们之间的亲情,他们的爱情、友情,他们之间的情感,他们之间的故事,最后的故事……《小王子》以漫画的形式把小王子和善良可爱的小公主的故事呈现给读者,相信大家一定可以从中领略到小王子和公主的故事带来的乐趣,从中体会到小王子的人生真谛。。内容简介:《小王子:小王子》故事 ’
Llama2-Chinese-92M-v2 response:‘我有一座神奇的城堡。我有一个神奇的故事;我有一个美丽的童话;我有一个可爱的童话;我有一个神奇的童话。“书虫 好书 书品 美书” 内容简介: 当阅读完了“书虫,好书,书品美书”,你一定感到你读出来的书比读一本书的好;当你看完了“书虫,好书” 最后,你会发现,书的世界竟是这么地广阔……本书中的所有童话童话,都是这样一’
Llama2-Chinese-218M-v1 response:‘小王子和他的伙伴们在森林里玩耍。他们遇见了很多小动物,可是它们却都讨厌他们。小王子想让小动物们开心,所以要去找小动物们开心……本书故事情节生动,内容丰富多彩,非常适合小朋友阅读。《小王子》的插画很特别,除了小王子外,还有灰姑娘、爱莎、小矮人、灰姑娘、丑小鸭……’
Llama2-Chinese-218M-v1 response:‘小王子和他的伙伴——小丑们要和人类结缘。在他们的帮助下,小王子又遇到了各种怪事,小丑们又碰来了各种奇遇,他不仅救出了人类,还帮助了人类,还救出许多小王子。小王子和孩子们一起,和孩子们一起成长,一起冒险……书中的故事内容丰富,充满了乐趣……孩子们在阅读的过程中,将会逐渐熟悉并喜爱各种神奇的东西,同时也发现许多奇妙的趣事。’
Llama2-Chinese-218M-v2 response:‘小王子和他的伙伴们在森林里玩耍。他们遇见了很多小动物,可是它们却都讨厌他们。小王子想让小动物们开心,所以要去找小动物们开心……本书故事情节生动,内容丰富多彩,非常适合小朋友阅读。《小王子》的插画很特别,除了小王子外,还有灰姑娘、爱莎、小矮人、灰姑娘、丑小鸭……’
Llama2-Chinese-218M-v3 response:‘小王子去森林探望父亲。森林中发生了很多有趣的事情,可是小王子却非常不高兴,因为小树不见了,小树被埋了地底下。小树死了,小王子非常伤心。小王子想出许多办法来把树救出来,可是树好像一点也没死掉,它又跑到森林中央去。小树被埋在沙堆里了,可是小树并没有死,小王子觉得小树好像很关心他们,便’
```
2. **微调模型**

| 模型名称 | SFT语料 | 🤗模型参数 | 下载地址 |
|------------------------------------|----------------------------------------------------------------------------|-------------------------------------------------|----------------------------------------------------------|
| Llama2-Chinese-92M-v1-NormalChat | alpaca-zh+bell | max_seq_len=512<br/>dim=512<br/>n_layers=8<br/>n_heads=8 | [模型下载](https://pan.baidu.com/s/14hwHVvv_5YrIrJg2NWI62g)提取码:da7h|
| Llama2-Chinese-92M-v1-MedicalChat | shibing624/medical<br/>+HuatuoGPT-sft-data-v1<br/>+DISC-Med-SFT<br/>+ChatMed_Consult-v0.3 | max_seq_len=512<br/>dim=512<br/>n_layers=8<br/>n_heads=8 | [模型下载](https://pan.baidu.com/s/14hwHVvv_5YrIrJg2NWI62g)提取码:da7h|
| Llama2-Chinese-92M-v2-NormalChat | alpaca-zh+bell | max_seq_len=512<br/>dim=512<br/>n_layers=8<br/>n_heads=8 | [模型下载](https://pan.baidu.com/s/1slimqUbDsnChqFY3CsybVw)提取码:bjal |
| Llama2-Chinese-92M-v2-MedicalChat | shibing624/medical<br/>+HuatuoGPT-sft-data-v1<br/>+DISC-Med-SFT<br/>+ChatMed_Consult-v0.3 | max_seq_len=512<br/>dim=512<br/>n_layers=8<br/>n_heads=8 | 正在加紧训练中!!! |
| Llama2-Chinese-218M-v1-NormalChat | alpaca-zh+bell | max_seq_len=1024<br/>dim=1024<br/>n_layers=12<br/>n_heads=8 | [模型下载](https://pan.baidu.com/s/1cud_kEyRpXLR74DTRvqjGQ)提取码:dkne |
| Llama2-Chinese-218M-v1-MedicalChat | shibing624/medical<br/>+HuatuoGPT-sft-data-v1<br/>+DISC-Med-SFT<br/>+ChatMed_Consult-v0.3 | max_seq_len=1024<br/>dim=1024<br/>n_layers=12<br/>n_heads=8 | 正在加紧训练中!!! |

| 模型名称 | SFT语料 | 🤗模型参数 | 下载地址 |
|------------------------------------|-------------------------------------------------------------------------------------------|-------------------------------------------------|-----------------------------------------------------------------|
| Llama2-Chinese-92M-v1-NormalChat | alpaca-zh+bell | max_seq_len=512<br/>dim=512<br/>n_layers=8<br/>n_heads=8 | [模型下载](https://pan.baidu.com/s/14hwHVvv_5YrIrJg2NWI62g)提取码:da7h |
| Llama2-Chinese-92M-v1-MedicalChat | shibing624/medical<br/>+HuatuoGPT-sft-data-v1<br/>+DISC-Med-SFT<br/>+ChatMed_Consult-v0.3 | max_seq_len=512<br/>dim=512<br/>n_layers=8<br/>n_heads=8 | [模型下载](https://pan.baidu.com/s/14hwHVvv_5YrIrJg2NWI62g)提取码:da7h |
| Llama2-Chinese-92M-v2-NormalChat | alpaca-zh+bell | max_seq_len=512<br/>dim=512<br/>n_layers=8<br/>n_heads=8 | [模型下载](https://pan.baidu.com/s/1slimqUbDsnChqFY3CsybVw)提取码:bjal |
| Llama2-Chinese-92M-v2-MedicalChat | shibing624/medical<br/>+HuatuoGPT-sft-data-v1<br/>+DISC-Med-SFT<br/>+ChatMed_Consult-v0.3 | max_seq_len=512<br/>dim=512<br/>n_layers=8<br/>n_heads=8 | 正在加紧训练中!!! |
| Llama2-Chinese-218M-v1-NormalChat | alpaca-zh+bell | max_seq_len=1024<br/>dim=1024<br/>n_layers=12<br/>n_heads=8 | 正在加紧训练中!!! |
| Llama2-Chinese-218M-v1-MedicalChat | shibing624/medical<br/>+HuatuoGPT-sft-data-v1<br/>+DISC-Med-SFT<br/>+ChatMed_Consult-v0.3 | max_seq_len=1024<br/>dim=1024<br/>n_layers=12<br/>n_heads=8 | 正在加紧训练中!!! |
| Llama2-Chinese-218M-v2-NormalChat | alpaca-zh+bell | max_seq_len=1024<br/>dim=1024<br/>n_layers=12<br/>n_heads=8 | [模型下载](https://pan.baidu.com/s/1cud_kEyRpXLR74DTRvqjGQ)提取码:dkne |
| Llama2-Chinese-218M-v2-MedicalChat | shibing624/medical<br/>+HuatuoGPT-sft-data-v1<br/>+DISC-Med-SFT<br/>+ChatMed_Consult-v0.3 | max_seq_len=1024<br/>dim=1024<br/>n_layers=12<br/>n_heads=8 | 正在加紧训练中!!! |
| Llama2-Chinese-218M-v3-NormalChat | alpaca-zh+bell | max_seq_len=1024<br/>dim=1024<br/>n_layers=12<br/>n_heads=8 | 正在加紧训练中!!! |
| Llama2-Chinese-218M-v3-MedicalChat | shibing624/medical<br/>+HuatuoGPT-sft-data-v1<br/>+DISC-Med-SFT<br/>+ChatMed_Consult-v0.3 | max_seq_len=1024<br/>dim=1024<br/>n_layers=12<br/>n_heads=8 | [模型下载](https://pan.baidu.com/s/1-Zd0uBUY23lCvr5s_QSwwg)提取码:tpyy |
目前没有在标准测试集上验证SFT模型效果。仅仅给出以下示例:
```bash
#SFT微调模型的推理:eval.py。
Expand All @@ -195,19 +207,38 @@ python eval.py
Llama2-Chinese-92M-v1-NormalChat response:‘是的,由于我的工作忙,我会很可能会坐在办公室里坐。你可以尝试保持安静并遵守交通规则,尝试在办公室里或周末去散步或散步,这有助于缓解紧张的语气。’
Llama2-Chinese-92M-v1-MedicalChat response:‘您的症状可能是由多种原因引起的,例如低血压、脑部疾病、颈椎病、贫血、贫血、低血糖、颈椎病等。以下是一些缓解这种情况的方法:1. 休息:在长时间使用电脑或手机前,放松身体,放松肌肉,缓解晕厥。2. 按摩:轻轻按摩头部或颈部,缓解头晕。3. 热敷:使用热毛巾或热水袋敷在头部或颈部上,缓解’
Llama2-Chinese-92M-v2-NormalChat response:‘我无法确定您所在的位置。您可以在公司办公室的电脑上查询我查询的信息。不过,如果您访问了该公司的网站或应用,您可以访问该公司的客服部门,查看最近的办公室的列表,看看是否有可能是无法进入该公司的办公室。通常办公室可能是安静的,没有噪音,而且可能不会发出任何声音。因此,我建议您与您公司客服联系以获取相关信息并咨询您所在公司的办公室。’
Llama2-Chinese-218M-v1-NormalChat response:‘我无法确定您所描述的问题,因此无法回答。是一种可能的诊断是偏头痛。这通常与气候变化、心理压力或饮食因素有关。 它可能会导致以下症状:1. 热或热配菜。2. 热食物或饮料。3. 食物中添加的盐或糖。’
Llama2-Chinese-92M-v2-MedicalChat response:‘’
Llama2-Chinese-218M-v1-NormalChat response:‘’
Llama2-Chinese-218M-v1-MedicalChat response:‘’
Llama2-Chinese-218M-v2-NormalChat response:‘我无法确定您所描述的问题,因此无法回答。是一种可能的诊断是偏头痛。这通常与气候变化、心理压力或饮食因素有关。 它可能会导致以下症状:1. 热或热配菜。2. 热食物或饮料。3. 食物中添加的盐或糖。’
Llama2-Chinese-218M-v2-MedicalChat response:‘’
Llama2-Chinese-218M-v3-NormalChat response:‘’
Llama2-Chinese-218M-v3-MedicalChat response:‘长时间保持同一姿势会导致血液循环不畅,影响血使用的食用,从而导致头晕。您可以尝试以下方法缓解:1. 调整坐姿或站立的姿势,让身体的休息时间;2. 经常活动身体,如走动、做一些简单的伸展运动;3. 保持良好的睡眠质量,避免在睡前过度使用电子设备;4. 饮食要均衡,避免吃太过于油腻或刺激性的食物。’

#示例二:Input:‘前列腺囊肿的症状是什么?’——医学向问题
Llama2-Chinese-92M-v1-NormalChat response:‘人类大脑中的神经控制系统是研究人类大脑结构和功能的重要手段。它们负责控制大脑的温度、光线、温度、大气、睡眠、心理健康等方面的功能。这些控制系统在人类大脑中扮演着至关重要的角色,从而对大脑的影响非常显著。’
Llama2-Chinese-92M-v1-MedicalChat response:‘尿频、尿急、尿痛;慢性前列腺炎;排尿不畅;遗精;会阴痛;夜尿频多,频尿;夜间阴茎勃起;尿频;睾丸疼痛;尿痛;尿分心;排尿疼痛’
Llama2-Chinese-92M-v2-NormalChat response:‘影片光速是有可能划破天际的,可能带来无限可能的进展,可能会有点困难。不过,由于该故事情节并不准确,所以仅凭这些信息是不够准确诊断的。建议您咨询专业的医学e-卡路里评估方法,以获取更准确的诊断。’
Llama2-Chinese-218M-v1-NormalChat response:‘也被称为“水花如水”,通常指在火上燃烧的面包或饭单,也称为“烤面包”。这些食物,即面包,通常含有脂肪,蛋白质和.’
Llama2-Chinese-92M-v2-MedicalChat response:‘’
Llama2-Chinese-218M-v1-NormalChat response:‘’
Llama2-Chinese-218M-v1-MedicalChat response:‘’
Llama2-Chinese-218M-v2-NormalChat response:‘也被称为“水花如水”,通常指在火上燃烧的面包或饭单,也称为“烤面包”。这些食物,即面包,通常含有脂肪,蛋白质和.’
Llama2-Chinese-218M-v2-MedicalChat response:‘’
Llama2-Chinese-218M-v3-NormalChat response:‘’
Llama2-Chinese-218M-v3-MedicalChat response:‘尿频;脓性分泌物;血尿;尿急;前列腺痛;脓肿;尿痛;尿后滴沥;排尿困难及尿潴留

#示例三:Input:‘请问,世界上最大的动物是什么?’——科普向问题
Llama2-Chinese-92M-v1-NormalChat response:‘世界上最大的动物是蓝鲸。’
Llama2-Chinese-92M-v1-MedicalChat response:‘38%的动物都是天马科动物,而“天牛”的称法是 10%的,因为这种动物会作为天马长成而生存,所以,它们是家牛的一种。’
Llama2-Chinese-92M-v2-NormalChat response:‘世界上最大的动物是蓝鲸。它们是鲸类中最大的,可以长达30米,重达173吨。它们是地球上最大的动物,可以长达30米长,体重可达7吨,并且可以长达38米高。’
Llama2-Chinese-218M-v1-NormalChat response:‘世界上最大的动物是蓝鲸。它们的体重可以达到4000至5000公斤,体重可达到7000至9000公斤。他们来自海洋,并且是地球上最适应 蓝鲸是一种非常适应生存由海洋环境而产生的哺乳动物。它们可以达到1.2至1.4米重。它们以鱼类为食,但也会吃小鱼。蓝鲸是肉食性的动物,但它们也可以吃小型’
Llama2-Chinese-92M-v2-MedicalChat response:‘’
Llama2-Chinese-218M-v1-NormalChat response:‘’
Llama2-Chinese-218M-v1-MedicalChat response:‘’
Llama2-Chinese-218M-v2-NormalChat response:‘世界上最大的动物是蓝鲸。它们的体重可以达到4000至5000公斤,体重可达到7000至9000公斤。他们来自海洋,并且是地球上最适应 蓝鲸是一种非常适应生存由海洋环境而产生的哺乳动物。它们可以达到1.2至1.4米重。它们以鱼类为食,但也会吃小鱼。蓝鲸是肉食性的动物,但它们也可以吃小型’
Llama2-Chinese-218M-v3-MedicalChat response:‘除了导致的,在一般情况下,保持适当的中毒处理方法是首先通过服用药物。’
Llama2-Chinese-218M-v2-MedicalChat response:‘’
Llama2-Chinese-218M-v3-NormalChat response:‘’
```

可以明显看出,经过medical SFT数据微调后的模型在医学向问题的回答上比其他模型更加准确,但是对于日常科普向问题的回答遗忘性太大。
Expand Down
Loading

0 comments on commit 444155b

Please sign in to comment.