1.最强开源多模态生成模型MM-Interleaved:首创特征同步器
最近,上海人工智能实验室联合香港中文大学多媒体实验室(MMLab)、清华大学、商汤科技、多伦多大学等多家高校、机构,共同发布了一个多才多艺的最强开源多模态生成模型 MM-Interleaved,借助全新提出的多模态特征同步器刷新多项任务 SOTA。它拥有对高分辨率图像细节和微妙语义的精准理解能力,支持任意穿插的图文输入和输出,带来了多模态生成大模型的崭新突破。
论文地址:https://arxiv.org/pdf/2401.10208.pdf
项目地址:https://github.com/OpenGVLab/MM-Interleaved
模型地址:https://huggingface.co/OpenGVLab/MM-Interleaved/tree/main/mm_interleaved_pretrain
2.刚刚,字节版GPTs「扣子」上线了
近日,字节跳动正式推出「Coze 扣子」AI Bot 开发平台。任何用户都可以快速、低门槛地搭建自己的 Chatbot,且平台支持用户将其一键发布到飞书、微信公众号、豆包等渠道。
3.无注意力大模型Eagle7B:基于RWKV,推理成本降低10-100 倍
基于 RWKV-v5 架构构建,该架构的推理成本较低(RWKV 是一个线性 transformer,推理成本降低 10-100 倍以上);
在 100 多种语言、1.1 万亿 token 上训练而成;
在多语言基准测试中优于所有的 7B 类模型;
在英语评测中,Eagle 7B 性能接近 Falcon (1.5T)、LLaMA2 (2T)、Mistral;
英语评测中与 MPT-7B (1T) 相当;
没有注意力的 Transformer。
4.小红书开源「InstantID」效果炸裂,被Yann LeCun点赞,迅速蹿上Github热榜
论文地址:https://arxiv.org/abs/2401.07519
InstantID 主页:https://instantid.github.io/
Demo 尝鲜:https://huggingface.co/spaces/InstantX/InstantID
5.OpenArt 是为一个每个人提供AI生成工具平台