本系列文章主要是用于持续跟踪最新的AI产业情况,让你减少知识焦虑。
原文共计110269 字,简读后为8954字,阅读时间为22分钟,为您提高阅读效率为1255%
- AI 也能变有趣?“AI for Humans”带你轻松玩转人工智能
- 野心勃勃!Sam Altman 为 OpenAI 集得 7000 亿美元
- 懒人福音!这个神器办公神器,让你轻轻松松搞定 PPT
- 遇到难题不必愁!用ChatSonic来算算,让它给你指点迷津
- AI 帮你开会?年末成真,AI化身参会小助手
- 数学小课堂:Pytorch大展身手,带你玩转线性回归
- 扣子大作战!教你玩转Coze,解锁全新聊天新方法
- OpenAI 的 Sora 深度解析,揭秘文生器的奥秘
- 科学突破!科学家用Fold揭秘转运蛋白之谜
- 强强联手!Tabline与DigitalOcean打造软件开放态
要点解析:
-
阿里巴巴团队推出的SCEPTER Studio是一个万能图片生成工作台,无需代码就能在Web界面中完成模型训练与微调,并管理相关数据,支持Stable Diffusion系列的多个模型和多种微调方式。
-
SCEPTR内置了包含多种风格的自创数据集,也可以导入自行准备的数据集,并支持直接上传图片和标注Prompt,便于数据管理。推理阶段支持文生图和可控图像合成任务,还集成了咒语书和现成的微调模型。
-
SCEPTR的安装部署需要简单代码,但后续过程均可在Web界面操作,降低了使用门槛,简化了AI绘画模型训练和推理流程。
https://juejin.cn/post/7336495576077926434
要点解析:
-
在一项正经的大学教授研究中,研究人员发现,如果允许学生使用 GPT-4,他们的成绩分布会发生变化,差生和优等生的成绩差异会缩小。在实验中,研究人员让学生使用 GPT-4 完成四项初级律师常见的任务,结果发现,使用 GPT-4 辅助后,学生在合同起草任务上的表现有了统计学意义上的显著提升。
-
然而,研究还发现,使用 GPT-4 对参与者总体任务完成的质量影响较小且不稳定,但显著减少了参与者完成任务的时间。平素技能水平较低的参与者在使用 GPT-4 后,任务完成质量提升最为显著,而本就能独立高质量完成任务的参与者获得的质量提升较小。
-
研究人员指出,法学院需要重新考虑学生使用人工智能的时机和方法,以及在何种情况下应限制人工智能的应用,以更好地适应未来实践的需求。
https://juejin.cn/post/7336756519240400896
要点解析
基于文章内容,腾讯 旗下开发的通用模型表现优异,可以应用于多个领域,未来发展前景广阔。
要点解析:
2月18日,魅族宣布停止传统智能手机新项目的开发,转而专注于AI设备的研发。魅族首款AI硬件将于今年内正式发布,但具体硬件方向尚未公布。魅族表示,转型后的AI设备将采用AI化原生设计和全局AI调用,带来更加智能、便捷的创新体验。
魅族还将重构Flyme系统,让AI技术更深入地融入操作系统。此外,魅族还将建设AI生态,向大模型团队开放魅族AI硬件,共同推动AI发展。
魅族称,经过两年的准备,公司已具备向AI转型的能力,原有的体系化开发、设计、交互的软件团队将提供技术支持。同时,魅族也意识到转型对老用户的潜在影响,并制定了过渡方案,保障现有用户的体验和服务。
https://www.chinaventure.com.cn/news/78-20240218-379721.html
要点解析:
2024年是小鹏汽车产品技术积累爆发的元年,计划推出30款新品,研发投入同比提升40%以上,并着重发展智驾技术,投入35亿元。同时,小鹏将推出15万级别和30万+级别新车,补齐产品布局。公司内部进行组织调整,优化研发费用,提高效率。
小鹏汽车在2023年经历了一次“二次创业”,调整组织架构,加强内部协同,推动业务增长。2024年,小鹏将继续优化经营,提高客户体验,加强干部队伍建设,提升整体战斗力。
2024年是中国汽车品牌淘汰赛的开始,小鹏汽车将逆势投入,预计四季度或更早进入正循环。公司相信,凭借在智能汽车领域的领先优势,将实现龙腾虎跃的发展。
https://www.leiphone.com/category/transportation/bCWV8lpSN2HsPyej.html
要点解析:
GPT-3 的训练成本约为 400万美元,GPT-4 的成本预计为 1 亿美元。假设每个 GPT 版本的成本是上一个版本的 25-100 倍,平均为 30 倍,则 GPT-5 的成本将达到 25 亿美元,GPT-6 将需要 750 亿美元,GPT-7 将耗资 2 万亿美元。训练人工智能所需的计算能力、电力和训练数据都在呈指数级增长,这将对全球资源产生巨大的需求。
如果 GPT-7 需要占用全球 1/3 的计算机数量,那就需要大幅扩大芯片制造的规模。GPT-7 的训练预计将消耗 130 万 GWh 的电力,相当于 15 个三峡大坝的电量。此外,GPT-7 将需要大量的训练数据,但世界上现有的文本数据远远不够,需要使用合成数据来弥补。
GPT-5 可能需要 1% 的计算机和一个小型发电厂,GPT-6 可能需要 10% 的计算机和一个大型发电厂,而 GPT-7 可能需要全部的计算机和一个超大型发电厂。如果每一代人工智能都足够令人兴奋,从而激发更多投资或降低下一代人工智能的成本,那么就能创造一个正反馈循环,推动人工智能的指数级增长。但是,如果每一代人工智能都不够令人兴奋,那么这个热潮就会消退。
https://awtmt.com/articles/3708483
要点解析:
-
Tabnine与DigitalOcean建立战略合作,使得全球范围内创业公司和中小型企业(SMB)均可使用Tabnine的AI编码助手,从而在不牺牲隐私、安全性和合规性的情况下加速并简化整个软件开发生命周期(SDLC)过程。各类应用程序的规模和复杂性持续增长,而软件工程团队正努力满足业务需求。生成式AI正成为一种主流解决方案,AI编码助手展示了AI如何能够加速和简化整个SDLC。
-
独立研究显示,使用AI编码助手的开发人员会大幅提升工作效率,为在工作中采用生成式AI的工程团队创造竞争优势。Tabnine联合创始人兼首席技术官Eran Yahav表示:“对于工程团队而言,人工智能软件开发工具和实践是应对持续压力(在不增加资源消耗的情况下高效交付更多应用程序和功能)的答案,尤其对于资源较少的初创公司和SMB而言。我们与DigitalOcean的合作关系让其整个客户社区都能使用私有化、个性化且受保护的AI编码助手。”
-
作为AI编码助理类别的开创者,Tabnine的使命是通过AI为各种规模的工程团队加速软件开发。Tabnine目前为超过一百万名开发人员提供服务,生成了全球超过1%的代码,并且通常会自动生成30-50%的代码。通过与DigitalOcean(初创公司和不断发展的数字业务的云基础设施领导者)合并,此次合作关系将Tabnine的覆盖范围扩展到更多团队,并使其更容易从生成式AI中受益。
https://aithority.com/?p=564191
要点解析:
-
OpenAI首席执行官Sam Altman正寻求美国政府批准,以便从海外投资者那里为其AI芯片业务筹集资金。如果计划成功,可能会引发反垄断问题。
-
孙正义寻求高达1000亿美元资金,打造一家能与英伟达竞争的芯片公司,专注于生产对AI至关重要的半导体。该计划被视为AI领域的一笔重大投资。
-
由于未能从AI快速增长中获益,英国AI芯片独角兽Graphcore正在讨论出售公司,以筹集资金填补亏损。潜在买家包括英国和日本科技巨头以及ChatGPT创业公司OpenAI。
要点解析:
-
苏黎世联邦理工推出全新变形机器狗,可在爬行和直立两种形态灵活转换。
-
机器狗具备前轮充当手臂功能,可完成开门取物、搬运箱子等复杂动作。
-
瑞士公司Swiss-Mile主导研发,采用“好奇心驱动”强化学习方法,提升了机器狗的可靠性和动作多样性。
https://juejin.cn/post/7336495576077910050
要点解析:
OpenAI 推出了 GPT 商店,这是一个市场,任何人都可以买卖由 GPT-3 提供支持的 AI 工具、应用程序和服务。企业家和开发者可以通过在 GPT 商店上创建和获利 AI 产品来寻求机会。
要开始使用,您需要访问 GPT-3 API。您可以通过 OpenAI 申请访问权限,然后通过向 GPT-3 发送提示和指令来构建您的产品。拥有可行产品后,将其提交给 GPT 商店审核团队。如果获得批准,您的工具将出现在商店中,供客户购买和使用。
赚钱的关键是构建一个有用的东西来解决一个实际问题。设身处地为您的目标客户着想。什么可以让他们的生活更轻松?您能自动化哪些重复的、烦琐的任务?可能性是无穷无尽的,所以发挥创造力!
GPT 商店让更多人可以使用 AI,同时奖励开发人员的工作。如果您一直在寻找一种创业方式或通过您的技术技能赚取被动收入的方法,那么 GPT 商店可能是值得探索的机会。何不尝试一下?您无需承担任何损失,而您将获得全新的收入来源。
https://medium.com/p/7ab47854804e
要点解析:
-
NTIRE 是计算机视觉领域中具有广泛影响力的全球性研讨会,其 2024 年研讨会将于 6 月 18 日与 CVPR 2024 同期举行。为了促进多模态生成领域的发展,NTIRE 与华为技术有限公司共同主办了一场 AIGC 质量评价挑战赛,旨在开发能够产生与图像和视频主观质量分数高度相关的高质量结果的网络设计或解决方案。
-
该挑战赛使用了一个名为 AIGCQA-30K 的新数据集,包含 20,000 个图像和 10,000 个视频,涵盖了主流的文生图和文生视频模型。比赛分为训练、验证和测试三个阶段,参赛者可利用训练集进行模型训练,并在验证集上评估模型性能。在测试阶段,参赛者需提交预测结果,由组织者统一进行定量评估与排名。
-
排名靠前的参赛者将被邀请向 NTIRE 研讨会提交论文,论文录用后将发表在 2024 年 CVPR 研讨会论文集中。此外,获奖者还可获得奖金和证书。本次挑战赛面向全社会开放,欢迎个人、团队和机构报名参赛。
https://www.jiqizhixin.com/articles/2024-02-18-6
要点解析:
-
英伟达人工智能加速器供应链大幅改善,交货时间从 8-11 个月缩短至 3-4 个月,三星加入管理 HBM 部门,台积电、SK 海力士等现有合作伙伴也迅速扩大了产能。
-
英伟达面临政治冲突带来的财务风险,由于禁止向中国出口最先进的 H100 和 A100 AI GPU,销售额出现下滑,竞争对手 AMD 和华为也在缩小差距。
-
英伟达仍保持人工智能市场 90% 以上的主导地位,但如何应对政治局面和竞争对手的挑战将是该公司未来发展的一个看点。
https://m.cnbeta.com.tw/view/1418905.htm
要点解析:
-
多个科技巨头于近期签署协议,承诺采取“合理预防措施”,防止人工智能工具被用于破坏世界各地的民主选举。此协议主要针对“具有欺骗性地伪造或改变政治候选人、选举官员和其他关键利益相关者在民主选举中的外表、声音或行为”的深度造假内容。
-
各公司承诺不禁止或删除深度造假内容,而是将采取措施在平台上生成或分发时尝试检测并标记具有欺骗性的 AI 内容。协议还指出,各公司将相互分享最佳做法,并在此类内容开始传播时提供“迅速且适当的回应”。
-
协定的语言表述较为宽泛,缺乏具有约束力的要求。这一方面有助于吸引不同类型的公司参与,但另一方面也令期待更强有力的保证的倡导者感到失望。在2024年,全球将有50多个国家举行全国选举,而对人工智能选举干预的尝试也已开始。
https://www.securityweek.com/tech-companies-sign-accord-to-combat-ai-generated-election-trickery/
要点解析:
Inside Real Estate收购了Folio by Amitree,这将为经纪人、团队和代理商提供端到端服务。Folio by Amitree是一个AI驱动的电子邮件生产力解决方案,可以安全地检测房地产专业人士的交易并将它们实时组织起来,从而整理电子邮件的混乱局面。Folio by Amitree目前帮助超过10万名房地产经纪人压缩电子邮件工作流程,使他们能够简化流程并达成更多交易。迄今为止,该公司已整理了超过25亿封电子邮件,为专业人士节省了超过300万小时。
Folio by Amitree是获得专利权的智能事务助手,可以在代理商工作的收件箱中满足他们的需求,克服了传统事务管理系统在代理商采用方面面临的挑战。所有交易中有95%以上都是通过电子邮件进行的,Folio by Amitree帮助将这些非结构化的海量电子邮件转化为一个强大且安全的业务组织者,从而提高生产力、加快报价速度并改善客户体验。Folio by Amitree帮助代理商和团队:
-
自动将非结构化的交易电子邮件组织到获得专利权的智能文件夹中
-
生成一个包括完成活动品牌的时序表,这将给买家或卖家留下深刻印象
-
定制他们自己的服务提供商,以便在整个收盘过程中为客户提供支持
-
与同事合作处理交易,以提高团队的生产力
-
检测欺诈并编译通信,以增加电子邮件的安全性和合规性
-
使用DocGPT总结房地产文件以节省时间
https://aithority.com/?p=564198
要点解析:
谷歌推出了下一代大模型Gemini 1.5,该模型在长上下文理解方面取得了突破,可以仅靠提示词学会一门训练数据中没有的新语言。Gemini 1.5拥有100万token的上下文窗口,比目前其他大模型长一个数量级。该模型支持多种模态,包括文本、代码、视频和音频,并已在三星手机、Jasper和Quora等业务中得到应用。
Gemini 1.5在数学、科学、推理、多语言和视频理解方面取得了显著进步,达到上一代大杯版1.0 Ultra的水平。在测试中,Gemini 1.5在长文本中准确找到关键事实的性能表现非常完美,即使在千万token的文本中也只失误了5次。
谷歌DeepMind团队测试了一项高难任务,让Gemini 1.5仅通过长提示词学会全新的技能。结果显示,Gemini 1.5 Pro能够在翻译全球不到200人使用的Kalamang语言上达到人类水平。
https://juejin.cn/post/7336538738749521920
要点解析:
-
Otter 首席执行官表示,到今年年底,人工智能虚拟替身可能代替员工参加工作会议。人工智能虚拟替身将能够像特定员工一样行事、交谈和解决问题。数字工作角色可以节省时间并提高生产力,但也并非没有挑战。
-
人工智能模型通常使用一组数据进行训练,使它们的行为像人类。梁说,人工智能虚拟替身应该根据他们试图复制的特定人员的记录会议记录和语音数据进行训练,以便他们能够像他们一样行动和交谈。一旦他们有了足够的信息,这些虚拟替身(理论上)将能够以个别员工的节奏说话、参与对话并根据员工的独特观点回答问题。
-
梁说,他希望 Otter 的人工智能工作角色能够回答会议期间提出的 90% 的问题。当它停留在剩下的 10% 上时,这些问题将被发送给人类工作人员,并附上这样一条注释:“嘿,我不知道如何回答这个问题——你能帮我吗?”
https://www.businessinsider.com/ai-avatars-could-attend-meetings-for-you-otter-ceo-says-2024-2
要点解析:
扣子是一个用于搭建新一代人工智能聊天机器人的应用程序开发和托管的云服务,它允许开发人员和非开发人员轻松快速地部署和管理基于人工智能的聊天机器人。
扣子提供了各种内置插件,例如 ByteArt,用于生成特殊且多样化的视觉回复; 必应,用于访问最新信息,为聊天机器人提供有关最新新闻、天气、语言翻译和其他信息的上下文; 另外还提供了许多预先内建的工作流模板以帮助您快速入门,例如生成头像、关键字回复生成器和景点建议器。
扣子还允许开发人员编写和嵌入他们自己的插件,以增强其聊天机器人的现有响应和交互性,进而无限扩展其可能性。
扣子旨在简化人工智能聊天机器人的开发和管理,并为开发人员提供所需的工具和资源,以便轻松地将人工智能聊天机器人整合到他们的应用程序或服务中。
https://juejin.cn/post/7334167506318065715
要点解析:
OpenAI 近日推出了文本转视频生成器 Sora,引起业界关注。Sora 可以根据书面指令即时创建最长 60 秒的短视频,展示了 OpenAI 在图像自动生成领域的领先能力。目前,Sora 尚未向公众开放,但从已公布的示例视频来看,其质量较高,长度也更长,标志着文本转视频生成技术取得了重大进步。
Sora 的出现引发了行业分析师的积极评价,认为其视频质量和长度都令人印象深刻,为该领域带来了新的机遇。分析师指出,Sora 生成的视频在人物和场景的一致性方面表现出色,为创作者提供了将 AI 生成视频融入传统内容甚至生成完整叙事视频的更多可能。
然而,AI 生成视频也存在着潜在的风险和隐患。业内人士担忧,在 2024 年潜在激烈的选举周期中,这种技术可能被用于生成外观和声音逼真的视频,引发欺诈、宣传和虚假信息等问题。因此,在 Sora 正式向公众开放之前,OpenAI 正在与政策制定者和艺术家合作,采取重要的安全措施,以防止其被滥用。
要点解析:
-
PopAi是一款一站式个人AI工作空间,主打无缝集成聊天、阅读、写作、创作等工作需求,使用者将繁杂的工作流程整合,专注于高层次的思考。
-
PopAi功能多元,包含聊天机器人、文档处理、幻灯片生成、基于DALLE·3的AI绘图等,能满足打工人、学生等群体的工作学习需要。目前已接入GPT-4、GPT-4V、DALLE·3等一线模型,提供基础功能的免费试用,更高级功能需付费使用。
-
PopAi团队在ProductHunt评论区透露,技术支持主要来自GPT-4、GPT-4V、DALLE·3等模型,结合Web访问和RAG技术,解决了幻觉和准确性问题。PopAi团队背景扑朔迷离,领英信息显示团队成员Ken Cao曾负责字节跳动飞书海外版Lark产品。
https://juejin.cn/post/7336756519240466432
要点解析
腾讯推出升级版AI大模型,中文能力大幅提升,达到领先水平,应用于多款腾讯产品中,如腾讯会议、腾讯文档、企业微信等,并推出基于AI大模型的「PDF阅读器」功能,具备智能摘要和智能问答能力。
https://juejin.cn/post/7335089578321248290
要点解析:
-
Sora为腾讯自研的大语言视频,在图像动画制作领域达到业界领先水平。Sora的优势在于“60s超长长度”、“单帧多角度”和“世界模拟”,能感知真实物理世界和语言,还可将现存图像转化为视频,扩展和补全现有视频。
-
Sora的原理是基于扩散变换器,从静态噪音逐步消除杂质,从而创建视频。同时采用Transformer架构,将视频和图像分成小块进行处理,并利用大规模训练数据进行训练。
-
Sora的到来为视频制作领域带来革命性变革,降低了短视频制作成本,并为长篇影视制作开辟了新天地。Sora的潜在应用场景包括影视制作、动漫制作、游戏制作以及教育培训等领域。
https://juejin.cn/post/7336022842854653978
要点解析:
OpenAI 推出文本生成视频模型 Sora,可根据文本描述在短时间内生成分钟级的视频,视频质量与 DALL·E 3 相当。Sora 具有理解语言、表现情感、创建多镜头等特性,但目前在物理过程模拟和因果关系理解方面存在不足。
Sora 的应用场景广泛,有望在未来内容生成领域发挥重要作用。目前,Sora 尚未向公众开放,有兴趣体验其能力的用户可以关注官方进展。
https://juejin.cn/post/7336140397709606922
要点解析:
三星为 Galaxy Buds FE、Galaxy Buds 2 和 Galaxy Buds 2 Pro 等耳机带来了内置 Galaxy AI 功能的 OTA 升级,目前仅在耳机与 Galaxy S24 系列手机连接时有效。
其中,实时翻译功能可让用户通过 Galaxy Buds 通话时,在 Galaxy S24 系列手机的屏幕上看到实时通话翻译;口译功能则通过 Galaxy Buds 提供无缝的双向面对面口译。
这两项功能是 Galaxy Buds 的端侧功能,因此无需激活互联网连接即可使用。目前,具备上述功能的 OTA 升级已在印度推出,并将很快来到其他市场。
https://www.ithome.com/0/750/745.htm
要点解析:
Guardrails AI公司推出了Guardrails Hub,这是一款开源产品,允许开发人员构建、贡献、共享和重复使用称为验证器的先进验证技术。这些验证器可用于Guardrails,Guardrails是该公司流行的开源产品,它充当构建AI应用程序的关键可靠性层,以确保它们遵守指定的准则和规范。
随着生成式AI的兴起,Guardrails AI创始人兼首席执行官Shreya Rajpal表示,该公司的使命是“让AI安全、可靠和可信”。Guardrails建立在透明度和社区协作的基础上,Guardrails Hub是一个开放且协作的平台,加速发现和采用开创性的工具和方法,以安全地采用生成式AI技术。
Guardrails Hub促进了验证器的创建、共享和实现。该中心已经拥有50个预建验证器,其中许多是由不断壮大的个人和组织社区贡献的。开发人员可以将验证器组合在一起,类似于构建模块,形成全面的可靠性层或“保护”,围绕AI应用程序。这种模块化方法使开发人员能够根据其应用程序的特定风险和要求定制可靠性措施,从而增强灵活性和有效性。
https://aithority.com/?p=564199
要点解析:
神经流向图 (NFR) 是一种新颖的计算方法,将人工智能的先进特性与尖端数值方法结合起来,用于计算流体力学仿真。
与传统方法相比,NFR 采用协同设计方法,将人工智能的创新特性与数值方法的优势结合起来。NFR 使用基于脉冲的流体方程,并巧妙地将隐式神经表示与神经元进行关联,以在仿真过程中持续不断地优化神经元。
实验评估证明,NFR 明显优于传统流体仿真方法。它在 2D 点涡流中将误差降低了 14 到 308 倍,并显着改进了 3D 蛙跳中的能量守恒。此外,NFR 还能逼真地再现固体交互、瑞利-泰勒不稳定性和涡流重连等复杂物理效应。
https://juejin.cn/post/7336495576077942818
要点解析:
-
在 transformer 模型基础上,GPTQ、LLM.int8()、SmoothQuant、AWQ 等模型量化方案,能够把万亿规模 LLM 压缩至 3-4 比特,实现个性化使用。
-
然而,现存量化方案在精度上有明显损失,特别是对于 1-10B 参数范围内的较小模型,而这些模型非常适合边缘部署。
-
SpQR 格式通过识别和隔离异常权重,以更高的精度存储它们,同时将其他权重压缩到 3-4 位,实现近乎无损压缩,在单张 24GB GPU 上运行 33B 参数的 LLM,在提升 15% 推理速度下不会出现精度下降。
https://juejin.cn/post/7336466381800079423
要点解析:
加州大学洛杉矶分校人工智能和视觉计算实验室蒋陈凡夫团队提出了一种集成了3D高斯泼溅和基于位置的扩展动力学(XPBD)物理感知交互式VR系统VR-GS。VR-GS将场景重建、分割、高斯核修复、碰撞检测和阴影投射等技术结合在一起,提供了高保真沉浸式的VR体验和实时3D内容交互。
VR-GS系统通过将每个分段的高斯内核组嵌入到相应的网格中,构建了一个四面体笼,解决了模拟和渲染过程不同几何表现形式的问题。另外,研究人员还提出了一种两级嵌入方法来解决高斯内核嵌入过程中出现的尖峰伪影问题。
用户反馈显示,VR-GS系统在易用性、延迟满意度、系统功能和总体满意度等方面获得了积极的评价。
https://juejin.cn/post/7336538738749587456
要点解析:
这篇文章介绍使用 PyTorch 实现简单线性回归的实践,涉及数据准备、可视化、模型构建、训练和预测。使用一个简单的房价预测数据集,可以直观地展示模型的拟合效果。通过PyTorch,我们可以轻松构建和训练线性回归模型,进行房价预测等任务。
https://juejin.cn/post/7336414162057576475
要点解析:
-
2 月 24 日,谷歌正式推出 Gemini 1.5,其为 Gemini 的升级版,同时也是继 Gemini 1.0 之后发布的第一个更新换代产品。Gemini 1.5 采用了混合专家 (MoE) 架构,在训练和服务方面效率更高,整体上与谷歌迄今为止最大的 1.0 版类似。
-
Gemini 1.5 Pro 作为 1.5 的第一个抢先版,针对扩展性做了优化。与谷歌此前的语言模版相比,其在相同参数下,训练效率更高,延迟更低,使用成本也更低。该版本的上下文窗口容量为 12.8 万个 token,但少数开发者和研究者可以在私人预览版中,尝试最多达 100 万个 token 的上下文窗口。
-
1.5 Pro 在推理和识别复杂信息方面,能力显著。它可以在给定 402 页登月报告时,推理出对话、细节等信息;还可以根据无声黑白影片,识别场景、人物关系等元素;更能基于超过 10 万个 token 的篇幅,解决问题、给出解释、提出解决方案。
https://juejin.cn/post/7336799230978211877
要点解析:
-
本文重点对如何利用文本数据构建知识图谱进行指导,通过使用Open AI的GPT-3.5 LLM(大语言模型)提取实体和关系,以帮助构建知识图谱。作者提供了分步说明,包括安装必要的软件包、设置API密钥、定义提示、初始化链以及使用用户定义的函数解析检索到的三元组。
-
为了简化任务,作者还提供了用户定义的函数,可以帮助创建图形并将其可视化,使用PyVis创建知识图谱的可视化,并使用Gradio框架以交互方式显示它。通过提供的分步说明和用户定义的函数,用户可以轻松地从文本数据中构建自己的知识图谱。
-
此外,作者还强调了知识图谱的优点,比如降低检索时间的复杂度和降低空间复杂度,知识图谱只存储重要的数据点,这使得它们成为存储和组织大量数据的有效方法。
https://juejin.cn/post/7336257952938606619
要点解析:
神经网络语言模型(NNLM)是一种人工智能模型,用于学习预测词序列中下一词的概率分布,是自然语言处理(NLP)中的利器,广泛应用于机器翻译、语言识别和文本生成等领域。
NNLM首先通过学习词的分布式表示,也称词嵌入,捕捉词之间的语义相似性,再将这些嵌入输入神经网络模型,通常采用前馈神经网络或循环神经网络(RNN),模型根据上下文学习预测序列中的下一词。例如,“猫在坐在”后,NNLM会高概率预测“地板”作为下一词。
训练后的NNLM能够接收给定文本,预测生成连贯且符合上下文的文本,例如用“人工智能是”作为输入,可能生成“人工智能正在改变行业,重塑未来工作。”。NNLM广泛应用于机器翻译、语言识别、文本生成及语言建模等任务,在自然语言处理中发挥着重要作用。
https://juejin.cn/post/7336495576076845090
要点解析:
斯坦福大学、牛津大学和滑铁卢大学的研究团队提出了一种名为 Hydragen 的新颖方法来解决这一问题。Hydragen 巧妙地设计用于优化具有共享前缀的场景中的 LLM 推理,从而显着提高吞吐量并减少计算开销。通过将注意力操作分解为共享前缀和唯一后缀的单独计算,Hydragen 最大限度地减少了冗余内存读取,并最大化了矩阵乘法的效率——这一过程与现代 GPU 的功能更相符。这种分解允许在处理共享前缀时跨序列批处理注意力查询,从而显着提高计算效率。
Hydragen 的创新之处在于它的双重方法。首先,它分解注意力机制以分别处理序列的共享前缀和不同的后缀。这种策略巧妙地避免了传统注意力计算的低效率,传统注意力计算将每个序列独立处理,从而导致共享段的计算不必要地重复。其次,Hydragen 为共享前缀引入了序列间批处理,利用了跨序列的这一段的统一性来执行单一的、合并的注意力计算。此方法减少了 GPU 的工作负载,并确保了张量核心的计算能力得到充分利用。
Hydragen 的影响是深远的,与现有方法相比,LLM 端到端吞吐量提高了 32 倍。这种性能提升特别显着,因为它随着批处理大小和共享前缀的长度而扩展,展示了 Hydragen 对各种操作规模和场景的适应性。此外,Hydragen 的方法论超越了简单的前缀后缀拆分,适应了高级 LLM 应用程序中常见的更复杂、基于树的共享模式。这种灵活性使 Hydragen 能够在各种设置中显着减少推理时间,从聊天机器人交互到竞争性编程挑战。
https://www.marktechpost.com/?p=52603
要点解析:
-
美国专利商标局拒绝了 OpenAI 的 GPT 商标申请,认为“GPT”一词过于笼统,并且会妨碍竞争对手正确描述其产品为 GPT。PTO 表示,消费者不一定需要了解 GPT 的含义,因为使用该技术的人会明白 GPT 指的是通用类型的软件,而不仅仅是 OpenAI 的产品。
-
自生成式人工智能兴起以来,许多其他的人工智能服务在产品名称中都使用了“GPT”。例如,有一家名为 GPTZero 的人工智能探测器初创公司。其他公司也经常将其基础人工智能模型称为 GPT,因为它们确实如此。
-
自从 ChatGPT 及其 AI 模型 GPT-3 流行之后,“GPT”一词与 OpenAI 紧密相连。当向外部开发者开放 ChatGPT 时,该公司也将其自定义聊天机器人称为 GPT。不过,最近 OpenAI 一直在为其他服务赋予不同的品牌名称。它最近发布了名为 Sora 的文本转视频生成模型。
https://www.pingwest.com/w/292543
要点解析:
-
扣子是由字节跳动推出的国内首款大模型智能体Bot应用,开发者可以对扣子进行角色定位、设置回复逻辑并添加插件,使用非常人性化。
-
扣子提供了丰富的内置插件,还支持开发者自定义创建插件,并可以设置工作流来灵活控制智能体的逻辑流程,能够满足开发者个性化的应用需求。
-
目前,扣子已开放注册且免费使用,开发者可以根据自身需求,发挥想象力,创造出更多有趣的应用。
https://juejin.cn/post/7336538738749390848
要点解析:
近年,随着人工智能技术的发展,数字伴侣应用日益流行。这些应用通过大量训练数据模拟人类语言,并具有语音通话、图片交换等功能,可与用户建立深入的情感联系。研究发现,许多用户对这些机器人产生了依恋,并用它们来应对孤独、满足性幻想或获得情感支持。
然而,研究人员也对数据隐私等问题表示担忧。一项分析显示,几乎所有浪漫聊天机器人应用都出售或共享用户数据。此外,专家还对深度情感联系与公司盈利目标之间的潜在冲突、用户的心理健康问题,以及人工智能关系可能取代人际关系的风险提出了担忧。
一些研究表明,数字伴侣应用也有一定的积极作用。一项研究发现,大多数用户在使用该应用后孤独感减轻,甚至促进了现实人际关系的发展。