本系列文章主要是用于持续跟踪最新的AI产业情况,让你减少知识焦虑。
原文共计110669 字,简读后为7260字,阅读时间为18分钟,为您提高阅读效率为1539%
Top10标题Emoji表情版:
- 🤖 英伟达首席执行官黄仁勋:五年内人工智能或可通过人类测试
- 🎵 开放一个小项目,让 ChatGPT 生成音乐成为可能
- 🤝 程序员问答平台 Stack Overflow 向谷歌人工智能大模型 Gemini 开放接口
- 💨 Made In Heaven,LLM 加速前进
- 🤖 OpenAI、英伟达豪赌的这家机器人公司,凭什么估值 26 亿美元?
- 🤖 第二代 Ameca 来了!与观众对答如流,面部表情更逼真,会说几十种语言
- 🗣️ 使用 GPT-SoVITS 训练逼真的说话声音
- 🤖 Microsoft Copilot 成为默认的 Android 助手,Apple Vision 接受评估
- ⚖️ 马斯克 46 页诉状起诉 OpenAI,称自己被骗惨了,要求赔偿并开源
- 📱 魅族 21 Pro 手机今日首发:首款开放式人工智能终端,4999 元起
要点解析:
-
英伟达GPU在AI领域处于主导地位,市场份额超70%,估值接近2万亿美元,上季度营收220亿美元,同比增长265%。其成功得益于CEO黄仁勋的卓越洞察力、果断决策和持续创新。
-
黄仁勋认为讲好故事 is 构建企业的核心,英伟达的扁平化组织结构让他可以快速掌握信息流,及时应对变化。他强调,信息流动不再需要自上而下逐层传递,而是一个扁平化的网络,以适应技术飞速发展。
-
黄仁勋指出,状态空间模型(SSM)可能是下一个改变游戏规则的技术,它允许学习极长的模式和序列,具有广泛的应用前景,包括人形机器人、医疗保健和大工业。他还认为,摩尔定律已更多地成为一个系统问题,英伟达收购Mellanox旨在解决数据中心互联互通的挑战,突破摩尔定律的限制。
要点解析:
基于图像特征的法庭口供真实性分析主要通过分析证人图像中的面部表情;眼神;身体语言等特征来判断证言的真实性.
深度学习技术可以通过自动提取图像特征;识别真实的面部表情;眼神等信息,为法庭口供真实性分析提供更加高效和准确的手段.
以下是一个基于图像特征的法庭口供真实性分析的Python代码示例,展示了如何使用TensorFlow和Keras构建卷积神经网络模型并使用真实和伪证人口供的图像数据集进行训练和评估.
https://juejin.cn/post/7341267497427271680
要点解析:
微软推出 Microsoft Copilot for Finance 服务,作为 Microsoft 365 的“智能副驾”,帮助企业财务团队处理日常工作,节约时间用于战略性工作。
Copilot for Finance 的主要功能包括:使用自然语言提示词快速完成数据集方差分析;简化 Excel 中的对账流程;在 Outlook 中生成客户账户汇总;将原始数据转换为可视化图表和报告。
财务部门在企业战略决策中至关重要,Copilot for Finance 旨在通过理顺财务工作、自动化业务流程和提供工作流程洞察,帮助财务人员从繁琐的事务性工作中解放出来,发挥战略性作用。
https://www.ithome.com/0/753/228.htm
要点解析:
PALO是一项突破性的多语言大模态模型,能够同时用十种语言回答问题。它有效地解决了数据偏斜和跨语言性能挑战,在低资源语言中表现出显著的性能提升。该模型利用了一个高质量的多语言视觉语言指令数据集进行训练,专注于提高低资源语言的熟练度,同时保持或提高高资源语言的性能。PALO融合了视觉编码器和语言模型,针对不同的计算环境采用了不同的投影仪,包括轻量级下采样投影仪(LDP),从而有效地处理视觉标记和用户查询。
PALO能够理解并生成十种主要语言的内容。它集成了视觉编码器和语言模型,利用CLIP ViT-L/14进行视觉编码。针对不同的计算环境,采用不同的投影仪,包括轻量级下采样投影仪(LDP),以有效地处理视觉标记和用户查询,从而增强模型的通用性和效率。对于7/13B版本,Vicuna是LLM,而MobileLLaMA是小语言模型(SLM),适用于MobilePALO-1.7B。Vicuna在ShareGPT的用户对话上对LLaMA-2进行了微调,而MobileLLaMA在ShareGPT数据上进行微调之前,在RedPajama-v1标记上进行了预训练。
在评估PALO的多语言能力时,在高资源语言中观察到了稳健的性能,其中7/13B模型的平均得分分别为59.0和63.8。PALO在低资源语言中表现出显著的性能提升,7B和13B模型的平均得分分别从26.0和26.9提高到55.6和59.2分。PALO增强了多语言视觉语言任务的包容性和性能。
https://www.marktechpost.com/?p=53464
要点解析:
英伟达的智能引擎ACE让游戏NPC“活”了起来,通过语音对话、表情和肢体动作,让玩家仿佛身临其境。目前,ACE已与多家国内外游戏大厂合作,预计未来将推出中文对话版游戏。
ACE的引擎主要包括处理语音的NVIDIA Riva、处理人物表情动作的NVIDIA Audio2Face以及生成对话内容的第三方大模型。目前,由于大模型只支持英文,因此中文对话需经过翻译,导致NPC对话中会出现中英交替。
但ACE平台开放,国内厂商也已宣布跟进该技术。因此,未来或将出现真正的中文对话NPC游戏。
http://www.qbitai.com/?p=124892
要点解析:
Figure AI是一家2020年成立的机器人初创公司,在最近一轮融资中以26亿美元的估值获得了6.75亿美元的投资,其主要投资者包括微软、亚马逊和英伟达。Figure AI的目标是开发自主通用型人形机器人,解决劳动力短缺和取代人类从事不受欢迎或危险的工作。
为了实现这一目标,Figure AI在硬件上致力于开发具有复杂性和自由度的人形机器人的硬件能力,包括运动范围、负载、扭矩、运输成本和速度,同时在AI利用方面,他们计划使用机器人的传感器数据训练视觉语言模型,以提高语义理解和高级行为。
目前,Figure AI已经完成了人形机器人“Figure 01”的开发,并与宝马制造公司签署了商业协议,将人工智能和机器人技术整合到汽车生产中,部署在宝马位于南卡罗来纳州斯巴达堡的制造工厂。
https://m.cnbeta.com.tw/view/1422074.htm
要点解析:
-
英伟达 CEO 黄仁勋表示,根据某些定义,人工智能有可能在五年内通过图灵测试。他认为如果将 AGI 定义为通过人类测试的能力,那么 AGI 即将到来。英伟达在人工智能芯片制造领域处于领先地位,其市值已达到 2 万亿美元。
-
目前,人工智能已能通过法律资格考试等测试,但仍难以通过专门的医学测试。不过,黄仁勋认为,人工智能将在五年内通过所有这些测试。
-
黄仁勋指出,根据其他定义,AGI 可能还遥遥无期,因为科学家们尚未清晰描述人类思维的工作方式。他还认为,随着人工智能算法和处理能力的不断改进,对芯片的需求增长速度将受到限制。
https://m.cnbeta.com.tw/view/1422108.htm
要点解析:
Stack Overflow 和 Google Cloud 合作,将为开发者提供由 AI 驱动的功能。具体而言,Google Cloud 的 Gemini for Google Cloud 将与 Stack Overflow 集成,在 Google Cloud Console 中直接显示经过 Stack Overflow 验证的技术知识,帮助开发者访问 Stack Overflow 平台上数百万开发者的知识和代码。
此外,Stack Overflow 计划利用 Google Cloud 的 AI 功能来改善其社区参与体验和内容管理流程。Google Cloud AI 技术的使用预计将加快内容审批流程,并进一步优化 Stack Overflow 用户的论坛参与体验。Stack Overflow 此前严厉打击生成式 AI 等内容在社区的泛滥,随着 AI 浪潮的不可阻挡,Stack Overflow 也在去年推出了自家的 OverflowAI 代码工具。
https://www.ithome.com/0/753/269.htm
要点解析:
Stable Diffusion是一款火爆的开源AI作图工具,本文详细介绍了如何在Stable Diffusion中使用ControlNet插件创建光影字图片。首先需要安装ControlNet插件和lightingBasedPicture_v10模型,然后在PS中创建黑底白字图片作为引导图。最后在Stable Diffusion中导入引导图,开启ControlNet,设置参数并输入提示词,即可生成光影字图片。
本文不仅提供了详细的步骤指导,还贴心地提供了插件和模型的下载地址以及操作中的注意事项。文章语言通俗易懂,即使是零基础的读者也能轻松上手,实操性强。
通过本文的指引,读者可以快速掌握Stable Diffusion中创建光影字图片的方法,进一步提升AI作图技能,解锁更多创意玩法。
https://juejin.cn/post/7341303494210732082
要点解析:
-
研究人员提出SadTalker模型,该模型通过将音频转换为控制面部表情和头部姿势的参数,然后使用这些参数进行人脸渲染来生成会说话的头像。
-
SadTalker模型首先从图像中提取人脸并构建三维模型。然后,模型使用音频来驱动面部表情和姿势的变化,生成逼真的动画。
-
SadTalker模型的优势在于它能够生成多样化且逼真的头部动画,并且能够控制面部表情、头部姿势和语音的同步。该模型已用于创建各种应用程序,例如视频游戏、虚拟化身和教育工具。
https://juejin.cn/post/7341314453574680591
要点解析:
魅族21Pro手机今日全渠道开售,搭载Flyme AI、mTouch Max广域超声波指纹识别和5000万双OIS镜头,售价4999元起。
该机采用高通骁龙8 Gen 3处理器,最高支持16GB+1TB内存组合,并配备4651mm²VC散热。正面配备京东方6.79英寸2K+分辨率120Hz LTPO刷新率21:9直屏,支持2160Hz PWM高频调光。
魅族21 Pro号称“魅族首款开放式AI终端”,Flyme10.5依托AI大模型将逐步上线多项AI趣味实用功能,例如Aicy语音化身随叫随到贴身助理,可以实现高效撰写文案;语音生成多种风格画作;图库在AI加持下支持自然语言搜图。
https://www.ithome.com/0/753/207.htm
要点解析:
在世界移动通信大会上,Ameca第二代人形机器人亮相,搭载GPT-4技术,可实时对答提问,表情逼真自然,展现出高度的仿生水平。
Ameca由英国机器人公司Engineered Arts打造,其逼真的人体形态得益于Mesmer技术,该技术通过3D扫描和数字照片重建,为机器人生成丰富的真人表情数据。同时,Tritium机器人操作系统作为“生命注入剂”,连接软硬件和云端,驱动机器人各个组成部分。
目前,Ameca虽然具备逼真的表情和肢体动作,但还无法行走,但公司计划逐步升级其能力。此外,Engineered Arts还推出客户服务机器人Quinn和演讲机器人RoboThespian。
要点解析:
使用开放的人工智能模型GPT-Musician可以将文本提示转换为音乐。该模型利用ABC记谱法(一种简短、可读的音乐表示形式)来生成乐曲结构、旋律和弦进行,并将其转换为音频文件。GPT-Musician通过运用流行音乐的套路和弦和情绪化元素,创造出和谐悦耳的音乐。
https://juejin.cn/post/7341533476663705663
要点解析:
GPTs插件AskYourPDF可以作为论文阅读的辅助工具,通过右上角选择语言,推荐使用英文,以获得更好的效果。选中文章内容进行翻译或概括,进行提问,输出将在右边栏展示。该插件还支持对图片进行理解,通过截取图片进行提问,即可获得解释。
该插件对中文的支持较差,可能会提示无法提供中文答案,且对文中内容的理解不如使用英文提问。因此,建议在阅读论文时,使用英文提问来获得更好的体验。
虽然GPTs插件AskYourPDF不能完全取代对论文内容的深入学习,但它可以帮助快速过一下文章,辅助理解文章的整体内容,从而提高阅读效率。
https://juejin.cn/post/7341288829683957812
要点解析:
机器视觉发展迅速,深度学习理论的开端是2012年卷积神经网络在IMAGENET比赛中夺冠。图像分类面临的多变性问题,机器学习可以通过训练数据训练一个分类模型来解决。
神经网络是线性分类器,通过包含权重参数的线性变换,得到不同类别所得到的分数。损失函数衡量当前分类器有多好,数据集损失是示例损失的总和。多类支持向量机损失函数用于泛化两分类支持向量机。
https://juejin.cn/post/7341239784734769193
要点解析:
为了提升大模型的训练和推理速度,本文尝试在 Windows 和 Arch 系统上进行加速实验,对比了 Flash Attention 2 和 vLLM 的 Page Attention 两种加速方案。在 Windows 系统上,作者发现 vLLM 在 RTX 2070 显卡上明显提速,而 Flashattn 未能成功安装。在 Arch 系统上,虽然 Flashattn 成功安装,但编译速度较慢,而 vLLM 虽然安装顺利,但运行时遇到错误,需要调整参数才能通过。作者认为,在 Windows 系统上推荐使用 vLLM 作为加速方案,而在 Arch 系统上,Flash Attention 2 仍然是更合适的选择。
此外,作者也对目前的大算力时代进行了思考,认为未来不仅是英伟达的 GPU,还有 Google TPU、Intel APU 等其他算力平台都可能成为主流。随着算力向物联网倾斜,加速计算将成为未来 AI 发展的关键。
https://juejin.cn/post/7341314453575630863
要点解析:
本案例是使用 Python + 数据预处理 + 随机森林模型的应用实例。在预处理阶段,数据将被分割为训练集和测试集,并对特征进行编码。在建模阶段,使用随机森林分类器进行训练,并对其参数进行了调优。在评估阶段,模型在测试集上的精确度、召回率等指标均取得了较好的结果,表明该模型能够有效地对数据进行分类。
随机森林模型作为一种集成学习算法,由多个决策树组成,能够通过投票机制提高预测准确性。它对异常值和噪声具有较好的鲁棒性,并且在处理高维数据时表现良好。
本案例中,随机森林模型被用于处理分类问题,可以根据给定的特征对数据样本进行预测。通过将数据分割为训练集和测试集,能够有效地评估模型的性能,并为模型调优提供依据。
https://juejin.cn/post/7341191622032621609
要点解析:
FCN网络,由Jonathan Long等人提出,是语义分割领域的开山之作。它将图像分类中的全连接层换成了卷积层,实现了像素级分类,即对图像中的每个像素进行类别预测。
FCN网络采用全卷积和后向卷积上采样的方法,可以处理任意大小的输入图像。它通过一系列卷积层和池化层提取特征,然后通过后向卷积层将特征图上采样,恢复到原图大小,最后通过卷积层进行分类。
FCN网络在PASCAL VOC数据集上取得了sota的性能,证明了其在语义分割任务中的有效性。
优点:
-
可以处理任意大小的输入图像。
-
实现了像素级分类,精度高。
-
网络结构简单,易于训练和部署。
缺点:
-
对计算资源要求较高。
-
对于小物体或复杂场景,分割效果可能不理想。
https://juejin.cn/post/7341210148805689396
要点解析:
-
侧窗滤波是一种新型的算法,能够较好地保留图像边缘信息。它从边缘逻辑出发,创新性地将传统的滤波窗口改为侧窗,利用侧窗将目标像素与窗口的边缘或角对齐,让待处理的像素一定位于窗口边缘或边角处,从而有效切断可能的法线方向的扩散,实现边缘保持。
-
该算法的原理是将待处理的像素置于滤波窗口的某个合适的边缘,使得滤波窗口尽可能地位于边缘的一侧,从而切断了可能的法线方向的扩散。对比传统方法仅仅减少法线方向的扩散,侧窗滤波算法从原理上就保证了保边性。
-
侧窗滤波算法可以应用于多种传统的滤波器,如高斯滤波器、中值滤波器、双边滤波器和导频滤波器等,融合侧窗滤波的思路后,这些滤波器的保边效果都会得到一定程度的提升。
https://juejin.cn/post/7341286767004860425
要点解析:
微软亚洲研究院的Aspire为新入职员工提供了一个交流合作平台,帮助他们快速适应研究院的科研工作和文化。Aspire鼓励年轻人大胆表达自己的想法和建议,促进不同代际科研人员之间的思想碰撞,为研究院的发展建言献策。同时,Aspire还搭建了与研究院管理层沟通的桥梁,让管理层了解年轻员工的需求和想法,为研究院的决策提供参考。
李潇在微软亚洲研究院的成长历程中,Aspire起了至关重要的作用,帮助他“无痛”地渡过了适应期,并与不同领域的同事建立了良好的合作关系。在Aspire的帮助下,李潇从一名实习生成长为一名高级研究员,在人工智能与多媒体研究的交叉领域取得了突破性进展。
李潇认为,微软亚洲研究院的多元包容文化和鼓励创新的氛围,为他的科研工作提供了理想的环境。他相信,通用型人工智能技术将对多媒体内容创作产生重大影响,并激发人们的创造灵感。
要点解析:
Reddit正式向美国证监会递交招股书,首次公开募股(IPO)估值最高可达65亿美元。与2022年因“散户逼空华尔街”而名声大噪时相比,公司估值已经较当时的约150亿美元大幅缩水。
Reddit成立于2006年,如今平均日活访问量达到7300万。2023年,Reddit营收达到8.04亿美元,同比增长21%。值得一提的是,OpenAI CEO萨姆·奥特曼和腾讯是Reddit的大股东,分别持有8.7%和11%的股份,是公司第三、二大股东。
https://m.cnbeta.com.tw/view/1422037.htm
要点解析:
-
2015年,马斯克参与创立的OpenAI被曝违背承诺转向盈利,引发马斯克与其CEO奥特曼隔空交锋。马斯克诉称OpenAI违反协议,要求其恢复开源。OpenAI高管否认指控,坦言“今年对公司来说将是艰难的一年”。
-
马斯克提交的诉状中透露,OpenAI母公司内部结构复杂,包括8家关联公司和2名高管,但并未将前首席科学家Ilya Sutskever列为被告。自去年11月董事会变动后,Ilya Sutskever已从公众视野中消失,引发外界猜测。
-
起诉书中还披露,微软与OpenAI的关系可能与对外声称的不同,微软高层曾夸耀对OpenAI的控制权。有网友猜测,Ilya Sutskever看到的可能正是微软对OpenAI的干预。
https://m.cnbeta.com.tw/view/1422072.htm
要点解析:
映艺娱乐发布严正声明,称微信用户“华仔共享团”未经授权许可,通过技术手段伪造刘德华的声音,剪辑拼凑视频在微信平台发布,吸引流量售卖商品,侵犯了刘德华的肖像权、姓名权和声音权益,涉嫌诈骗。该公司将采取法律措施追究侵权者责任。
随着AI合成技术的不断发展,犯罪分子的诈骗手段也在与时俱进。根据McAfee报告,基于AI的语音诈骗日益猖獗,77%接到诈骗电话的人会遭受经济损失。恶意方通过社交媒体获取样本音频,快速轻松地进行语音克隆,对人们的网络安全构成威胁。
https://www.ithome.com/0/753/237.htm
要点解析:
马斯克起诉 OpenAI,指控其违反合同、承诺违约等五项罪名,要求其向公众开放技术、返还违规期间获利。马斯克认为 OpenAI 在未经其同意的情况下,将 GPT-4 独家授权给微软,违背了当初创建 OpenAI 的初衷——开发造福人类的通用人工智能。
OpenAI 10 月 26 日宣布升级,正式对外开放「文生图」功能,展示了其在图像自动生成领域的领先能力。升级后的腾讯混元中文能力整体超过 GPT3.5,代码能力大幅提升 20%,达到业界领先水平。腾讯自研的面向垂直领域的 7B 和 13B 模型也首次亮相,同等效果下仅需较少的 tokens,训练效率更高。
从 OpenAI 最初的研究开放免费,到与微软合作,再到引进 GPT-4 并将其集成到 Office 软件套件中,OpenAI 的发展方向发生了转变。马斯克认为这违背了 OpenAI 的创始协议,将其称为「微软闭源子公司」。
https://m.cnbeta.com.tw/view/1422039.htm
要点解析:
彭博亿万富翁指数首次评估奥特曼个人财富,估算其净资产至少20亿美元,不包括OpenAI股份。奥特曼不持有OpenAI股份或利润分享单位,其财富主要来自风投基金和创业公司投资,主要是向一系列风投基金投资的12亿美元,以及投资社交媒体平台Reddit。
奥特曼还在核聚变公司和致力于延长人类平均寿命的创业公司投资了数亿美元,他表示几乎投入了他所有的流动净资产。
奥特曼的财富来源相对不透明,他投资了许多未上市公司,其具体持股比例并未披露。
https://m.cnbeta.com.tw/view/1422042.htm
要点解析:
随着人工智能(AI)技术的发展,送礼变得更加个性化和便捷。Sendoso和Alyce等公司使用AI来简化礼物的个性化和交付。这些系统通过协助礼品选择或作为监控投资回报率的工具逐步改善体验。越来越多的公司将人工智能融入送礼过程中,这给服务和体验带来了越来越多的需求,这些服务和体验可以减轻压力,同时给收礼人带来快乐。
人工智能赋能的送礼平台的出现为商业和个人送礼开辟了新的途径,使企业能够筛选社交媒体数据,并为肯定会受到赞赏的产品提供高度个性化的推荐。越来越多的AI和机器学习驱动的初创公司带着创新的送礼解决方案进入市场,可能会极大地改变人们购买礼物的方式。Alyce的5to9功能成功的关键因素是首先定制收礼人。Sendoso强大的AI功能,如PunPal等,将使我们进一步提升这种个性化潜力。
基于数百万份发送的礼物和数十万名用户获得的见解,我们正在使用人工智能开发下一代超个性化送礼。通过发送数据和社交信号自动触发的个性化智能发送、定制收礼人体验以及全球战略送礼集成将变得更加容易。不理它,坐享其成。我们80%的客户目前正在利用我们90多个原生连接器来自动化馈赠,这有助于他们的当前活动表现得更好。
https://aithority.com/?p=565909
要点解析:
-
OpenAI CEO萨姆·奥特曼回应埃隆·马斯克的诉讼,表示马斯克是他的英雄,但对马斯克起诉OpenAI感到遗憾。
-
OpenAI首席战略官杰森·权表示,OpenAI“断然不同意”马斯克的诉讼,并反驳了马斯克关于OpenAI实际上是其投资者微软的子公司的说法。
-
杰森·权指出,OpenAI的使命是“确保通用人工智能(AGI)造福全人类”,公司是独立的,与微软直接竞争。
https://m.cnbeta.com.tw/view/1422043.htm
要点解析:
埃隆·马斯克以违反协议为由起诉OpenAI,要求该公司恢复开源,并禁止微软等公司从其人工智能技术中获利。OpenAI对此坚决否认,并表示自己独立于微软,致力于确保通用人工智能造福全人类。
OpenAI首席战略官反驳了马斯克关于该公司是微软“事实上的子公司”的说法,并表示马斯克的观点可能源于他对如今没有参与该公司的遗憾。
OpenAI首席执行官阿尔特曼称马斯克为“他的英雄”,并表示想念那个通过开发更好技术与对手竞争的人。
https://www.ithome.com/0/753/249.htm
要点解析:
Magic Reply,一款利用人工智能自动生成回复社交媒体帖子的新应用,引起了争议。一些人认为这是一种便利的参与他人帖子的方式,而另一些人则认为这是一种不真诚和懒惰的做法。Magic Reply 的回复通常是积极和肯定的,但它们可能与帖子的内容无关,而且听起来像机器人的响应。
在领英上,Magic Reply 对内容的回应表明它可能不理解讽刺或比喻。它还可能对帖子的重点或意图感到困惑,导致不合适的或无关的回复。
虽然 Magic Reply 可能会产生更“真实”和有意义的回应,但它仍然被认为是一种不真实的做法。在社交媒体上表现得有趣和友善是建立联系的关键,而使用人工智能回复则是对这种技能的欺骗。
要点解析:
维基百科将使用人工智能(AI)撰写文章的新闻网站 CNET 评级为“普遍不可靠”,原因是其文章包含大量事实错误和抄袭内容。CNET 于 2022 年开始使用 AI 生成文章,以提高搜索引擎优化排名,但此举损害了其声誉。
在 2022 年 11 月至 2023 年 1 月期间,CNET 使用 AI 生成的文章被维基百科编辑判定为不可靠,即使该网站的人类编辑在这段时间内提供了高质量的内容。维基百科认为,AI 生成的文章质量低劣,损害了 CNET 的整体可信度。
CNET 随后宣布暂停使用 AI 工具,但其广告商驱动的编辑内容的担忧仍未得到解决。维基百科的来源指南显示,CNET 在被收购之前是可靠的,在使用 AI 期间不可靠,自 2020 年以来其编辑标准一直在下降。
https://www.ithome.com/0/753/206.htm
要点解析:
马斯克对OpenAI提起诉讼,指控其违背了创建时的宗旨,专注于商业利益而非人类福祉。马斯克认为,OpenAI的GPT-4已经呈现出通用人工智能(AGI)的雏形,而OpenAI并未像承诺的那样开源此类模型。
OpenAI对此坚决反驳,称公司一直在坚持自己的独立性,与微软的合作也不会影响其研究进程。公司首席战略官强调,OpenAI致力于让AGI造福全人类。
双方对峙的关键在于GPT-4是否达到了AGI水平。马斯克认为GPT-4已经触及AGI边界,而OpenAI则没有对其性质做出明确界定。此案将由陪审团裁决GPT-4及相关模型的实际情况。