Skip to content

Latest commit

 

History

History
371 lines (188 loc) · 25.2 KB

20240224.md

File metadata and controls

371 lines (188 loc) · 25.2 KB

目的

本系列文章主要是用于持续跟踪最新的AI产业情况,让你减少知识焦虑。

看点

原文共计125779 字,简读后为5819字,阅读时间为15分钟,为您提高阅读效率为2093%

  • 🌟 微软发布 PyRIT 工具,帮专家和工程师识别生成式 AI 模型风险
  • 🎨 Gemini AI 图片生成器:让创意活起来
  • 🤔 Zeroscope AI 怎么用?
  • 🎥 Zeroscope AI:用 AI 把文字变成视频
  • 🎙️ FineVoice 测评:多功能的 AI 配音工作室
  • 🤖 Figure AI:走进人形机器人世界
  • ♟️ Gemini for Google Workspace 耐心布局
  • 🤖 微软、英伟达、亚马逊等大佬瞄准 AI 新风口:类人机器人
  • 🌍 斯坦福大学开创性研究:揭秘 AI 中的地理偏见
  • 📱 Mavenir 推进印度沃达丰 Idea 的开放 RAN 部署

微软、英伟达、亚马逊等大佬瞄准 AI 新风口:类人机器人 🤖

要点解析:

  • 上周有消息称,专注于类人机器人的初创企业Figure AI在微软和OpenAI领投的融资中募资约6.75亿美元,投前估值约20亿美元。除了微软和OpenAI,英伟达、英特尔、LG旗下公司、三星旗下投资机构、贝佐斯旗下公司等也参与了本轮融资。

  • Figure AI去年5月曾完成7000万美元融资,两个月后英特尔投资900万美元。这款类人机器人具备自主学习能力,能够在观看人类示范视频后,经过10小时训练学会视频中的操作技巧,完全自主地完成任务。

  • 今年1月18日,Figure AI宣布将把Figure 01送入宝马位于美国南卡罗莱纳州的斯巴坦堡工厂进行试点,主要代替人类工作者从事一些较危险的任务。

https://awtmt.com/articles/3708939

Figure AI:走进人形机器人世界 🤖

要点解析:

  • Figure AI 是一家成立于 2023 年的初创企业,总部位于加利福尼亚州桑尼维尔,专注于开发可商用的类人机器人。

  • 目前 Figure AI 尚未发布其产品,但已经在其网站上公布了其机器人的关键特征:灵巧的操作能力、传感器感知能力和机器学习能力。

  • Figure AI 的机器人在制造业、医疗、物流、建筑和客户服务等多个行业中拥有广泛的应用前景,但同时它也面临着技术、监管和社会接受等方面的挑战。

https://openaimaster.com/?p=35682

塔塔埃尔西宣布与 AccuKnox 建立战略合作伙伴关系,提供 5G 托管安全服务 🔒

要点解析:

  • Tata Elxsi与云原生安全解决方案提供商AccuKnox建立战略合作伙伴关系,旨在简化5G网络的部署和安全性。

  • 这种合作结合了Tata Elxsi的NEURON网络自动化平台和AccuKnox的NIMBUS云原生安全解决方案,使运营商能够部署和保护云原生工作负载,同时简化部署的复杂性。

  • Tata Elxsi和AccuKnox将在2024年巴塞罗那举行的世界移动通信大会上展示这一集成解决方案,以便运营商能够在多个行业(包括汽车、广播、通信、医疗保健和交通)中充分利用5G技术。

https://aithority.com/?p=565443

Mavenir 推进印度沃达丰 Idea 的开放 RAN 部署 📱

要点解析:

  • Mavenir 将为 Vodafone Idea 提供一套完整的端到端云原生开放 RAN 系统,该系统包括基于商用现货 (COTS) 硬件和 Mavenir 可扩展模块化 OpenBeam™ 无线电的分布式单元 (DU) 解决方案,以及集中式单元 (CU) 加上完整的 Mavenir 远程无线电单元 (RRU) 和 RAN 软件功能,所有这些都运行在行业领先的混合云应用程序平台 Red Hat OpenShift 上,该平台由 Kubernetes 提供支持,并针对城市环境中的部署进行了优化。

  • 目前,Mavenir 与 Vodafone Idea 正在进行开放 RAN 网络试点部署,目前正在进行中的部署始于 2023 年 9 月,涵盖了主要发布站点,目前正在承载实时商业流量,预计会进行大规模部署。

  • 这次试点标志着首次将 O-RAN 兼容的部署引入 Vodafone Idea 的网络,利用 N78 和 N258 毫米波 (mmWave) 频谱频段以及支持 NSA 架构的 B1。

https://aithority.com/?p=565487

凯捷收购 Unity 的数字孪生专业服务,助力数字化转型 💻

要点解析:

  • Capgemini与Unity,领先的实时3D内容创建和增长平台,日前宣布,两家公司达成战略联盟的重大延展,Capgemini将全面整合Unity的数字孪生专业服务部门。根据协议,Unity的数字孪生专业服务团队将加入并嵌入Capgemini,从而形成全球规模最大的Unity企业开发人员团队之一。

  • 这笔交易将加速迭代和实现面向数字孪生工业应用的市场领先实时3D(RT3D)可视化软件。它将使用户能够设想、理解和交互物理系统——这是智能工业的关键推动因素。该交易预计将于2024年第二季度完成。

  • Unity的数字孪生专业服务团队在过去五年与众多公司合作,开发出实时3D解决方案来推动业务成果。随着越来越多的企业寻求将物理世界和数字世界结合起来,客户正在寻求RT3D软件功能以及业务转型、设计和工程专业知识,以便从数字孪生的工业应用中大规模实现价值。

https://aithority.com/?p=565488

LeapXpert 和 ASC 合作,为微软 Teams 提供通信合规记录 🗣️

要点解析:

  • LeapXpert 和 ASC宣布合作,为外部微软团队语音和文本通信提供合规记录。

  • LeapXpert 通信平台现已在微软 Azure 市场推出,并与微软团队原生集成。

  • ASC的录音洞察力是一个完全集成到微软团队的应用程序,支持微软 Dynamics 365,并可在微软 Azure 的全球基础架构中扩展。

https://aithority.com/?p=565485

Connectria 宣布在新加坡建立两个数据中心,用于 IBM Power 和 AWS 混合架构 🇸🇬

要点解析:

  • Connectria 宣布即将在新加坡开设两座新数据中心,以便与亚马逊网络服务 (AWS) 亚太区 (ap-southeast-1) 建立低于 2 毫秒的低延迟连接。这些数据中心旨在增强 IBM i 和 AIX 系统在整个地区的云采用和现代化,实现公共云与传统 IT 环境的无缝集成。这两座 Connectria 数据中心还将在所有 AWS 可用区 (AZ) 内实现跨地域灾难恢复即服务 (DRaaS)。

  • Connectria 的新数据中心采用了经过验证的架构,旨在满足不断增长的基础设施现代化和混合云采用的需求。基于近三十年来作为全球最大的 IBM i 和 AIX 托管提供商之一的经验,Connectria 的亚太数据中心提供基于最新 IBM 硬件构建的最新 IBM Power 基础设施,与 AWS 的延迟低于 2 毫秒。

  • Connectria 提供的 IBM Power 和 AWS 之间的无缝集成可以帮助客户加速数据中心退出以更有效地追求云优先的 IT 策略,并支持对 IBM Power 的现代基础设施和混合云解决方案不断增长的需求。通过将 IBM Power 工作负载连接到 AWS,客户可以利用原生 AWS 服务(如高级数据分析、AI/ML、IoT 等)来增强关键任务应用程序,以添加新功能、提高弹性和加速云创新。

https://aithority.com/?p=565483

德勤获得 Guidewire 迁移加速专业认证 ✔️

要点解析:

  • 全球咨询和技术服务领域的领先供应商德勤凭借出色的迁移加速专业能力,荣获全球Guidewire合作伙伴Connect咨询和全球卓越合作伙伴专业化认证。

  • 截至目前,德勤已与全球40多家客户端开展Guidewire项目合作,可帮助客户降低云迁移成本、缩短实施时间、提高交付质量的可预测性。

  • Guidewire全球联盟副总裁Lisa Walsh表示,Guidewire致力于帮助客户迁移至SaaS平台和应用程序套件。

https://aithority.com/?p=565478

微软发布 PyRIT 工具,帮专家和工程师识别生成式 AI 模型风险 🌟

要点解析:

  • 微软发布开源自动化框架 PyRIT,主要帮助安全专家和机器学习工程师识别生成式 AI 的风险,阻止他们的人工智能系统失控。

  • PyRIT 的工作原理是,PyRit Agent 向目标 Gen AI 系统发送恶意提示词,当它收到 Gen AI 系统的回应时,就会向 PyRIT 评分引擎发送回应。

  • 评分引擎将响应发送给 PyRit 代理,然后,代理根据评分引擎的反馈发送新的提示。这一自动化过程一直持续到安全专家得到所需的结果为止。

https://www.ithome.com/0/751/756.htm

Windows 照片应用迎来 Gen AI 改造:教你如何使用新 AI 功能 📸

要点解析:

  • 微软宣布Windows照片应用更新,增加了生成式AI功能,可擦除照片中的物体,无需依赖Photoshop或Canva等平台,使用更便捷。

  • 目前该工具仅限Windows 10或Windows 11 for Arm64设备上的Windows Insider用户使用,预计很快将向稳定版Windows版本用户推出。

  • 可生成式AI物体移除工具的使用过程很简单,打开Windows照片应用,找到“擦除”选项,按住鼠标左键并在要移除的对象上拖动即可。

https://www.techlusive.in/?p=1463657

Jasper 收购 Stability AI 旗下的图像平台 Clipdrop 🖼️

要点解析:

  • Jasper,一家生成式人工智能应用公司,宣布收购Clipdrop,一个AI图像创建和编辑平台,以增强其多模态企业营销团队协作的能力。Clipdrop拥有数百万用户,使用户能够编辑现有图像、创建新图像并生成大量尺寸、细节和风格的变化。

  • 营销人员和品牌领导者可以通过Clipdrop加速广告策略并创建品牌创意。Jasper的首席执行官Timothy Young表示,营销是视觉化的,Clipdrop将成为一个综合的端到端的营销协作工具,帮助企业团队实现个性化营销、自动化和优化整个策略。

  • Clipdrop团队将立即加入Jasper,继续领导Jasper的多模态研发,Jasper将继续扩大在欧洲的业务,并从人才和客户获取方面进行投资,为巴黎充满活力的AI社区做出贡献。

https://aithority.com/?p=565474

Prosimo 推出业内首个用于多云网络的 AI 套件 ☁️

要点解析:

  • 普罗西莫宣布推出人工智能套件,用于多云网络,以帮助团队更快的将人工智能工作负载推向市场。它提供了一个垂直整合的平台,使企业可以借助多云网络套件,为人工智能做好准备。

  • 普罗西莫采取了全生命周期的处理方法,提供两种关键能力:人工智能的多云网络和用于多云网络的Nebula。人工智能的多云网络提供了人工智能工作负载的核心连接、安全性和基础设施的基础构建块,而Nebula则支持云网络基础架构的快速观察、监控、故障排除和成本优化。

  • 普罗西莫的人工智能套件是一个全堆栈的云原生平台,能够理解三层到七层之间的连接需求,并使企业能够利用专为人工智能设计且具有云属性的连接性。普罗西莫的多云网络框架从头开始构建,专为在这些关键领域支持下一代人工智能工作负载而设计。

https://aithority.com/?p=565437

Ontotext 用最新版本 Metadata Studio 增强 LLM 和分析能力 📊

要点解析:

  • Ontotext推出Ontotext Metadata Studio 3.7,一款支持文本分析服务的全方位环境,可轻松创建、评估和改进文本分析服务。

  • 该版本提供开箱即用的快速自然语言处理 (NLP) 原型设计和开发,以便组织可以迭代创建最适合其领域知识的文本分析服务。

  • 该版本使用户能够使用通用英语实体链接 (CEEL) 对内容进行标记,从而识别大约 4000 万个 Wikidata 概念。

https://aithority.com/?p=565465

科技转型统计:2024 年 1.1 亿部 GenAI 智能手机、2028 年 6900 万台 AR/VR 头显出货,以及更多 📱

要点解析:

  • ABI Research发布2024年38项变革性技术统计数据,帮助企业做出明智的决策,把握市场变化,选择最佳技术和合作伙伴,实现快速获胜,满足严格的投资回报率要求,利用技术实现激进增长或防范地缘政治冲击。

  • 2024年,设备端生成式人工智能智能手机的市场渗透率将达到1.1亿部,谷歌已将其特性引入其平台,苹果可能在2024年推出自己的解决方案。“第一波生成式人工智能主要设计用于支持生产力应用程序,而不仅仅是改进体验。到2030年,智能手机各层级的设备端生成式人工智能的普及将得到更小、更精简的生成式人工智能模型的支持,市场渗透率将提升至90%。”

  • 苹果Vision Pro激发了人们对虚拟现实和混合现实的兴趣,到2028年,AR和VR头戴式显示器的总出货量将超过6,900万台。“经过验证的企业用例仍然有价值,尤其是在使用AR和VR设备进行培训和远程协助方面。消费者采用率一直很低,但在虚拟现实游戏中取得了一些进展。智能眼镜还没有准备好进入大众市场,但在企业中是可行的。苹果的Vision Pro暗示了未来可能出现一种具有空间计算能力的通用XR设备。价格是一个问题,但未来五年的持续更新和竞争有望实现可负担性。随着市场培育开发人员生态系统和确保内容合作伙伴关系,内容稀缺性不应成为问题。”

https://aithority.com/?p=565458

TaskUs 与亚马逊网络服务合作,打造 TaskGPT 💪

要点解析:

  • 任务服务提供商TaskUs宣布加强与亚马逊网络服务(AWS)的关系,利用AWS的最新生成人工智能(GenAI)服务。TaskUs正在使用Amazon Bedrock来帮助支持TaskGPT,使客户能够提供GenAI驱动的响应,以解决简单或面向流程的客户服务问题,从而使代表能够有时间处理更复杂的问题。

  • AWS Bedrock的完全托管统一API方法与TaskUs的模型不可知体系结构直接一致,该方法允许TaskGPT利用 Amazon 和第三方GenAI基础模型。TaskUs的愿景是通过TaskGPT和成功交付结果所需的云基础设施之间的无缝集成,为每个客户的特定用例使用最合适的Foundation模型,并满足速度、规模、安全级别和成本要求。

  • TaskGPT是一个由TaskUs开发的GenAI产品平台和套件,代表着客户体验技术向前迈出的重要一步。TaskGPT提供安全、GenAI驱动的多语言响应,全天候提高效率和客户满意度分数。一线员工可以根据正在进行的客户互动自定义响应,确保对话顺利进行。

https://aithority.com/?p=565447

斯坦福大学开创性研究:揭秘 AI 中的地理偏见 🌍

要点解析:

  • 斯坦福大学的研究首次量化了LLM中的地理偏见,并提出了一个评估地理偏见的综合指标。

  • 研究表明,LLM在回答与地理位置相关的问题时存在明显的地理偏见,其中对社会经济条件较差地区的预测准确度较低。

  • 人工智能必须以公平、公正的方式开发和评估,消除所有形式的偏差,包括地理偏见。

https://www.marktechpost.com/?p=52892

Gemini AI 图片生成器:让创意活起来 🎨

要点解析:

  • 杰米尼AI图像生成器是谷歌推出的一个将文字翻译成图像的工具,它可以根据输入的文字提示生成具有不同艺术风格和主题的图片。

  • 目前,杰米尼AI图像生成器已集成到巴德平台中,用户可以通过该平台访问并使用该工具创建图片。不过,目前该工具已暂停使用,谷歌正在进行改进,计划在不久的将来推出一个更强大的版本。

  • 在杰米尼AI图像生成器暂停使用之前,用户可以通过该工具输入文本描述或提示来生成图片。生成的图片基于用户的规格和人工智能对提示的理解。该工具还允许用户对生成的图片进行迭代,以探索不同的创意表达。

https://openaimaster.com/?p=35703

FineVoice 测评:多功能的 AI 配音工作室 🎙️

要点解析:

FineVoice 是一款多功能的 AI 语音工作室,可快速将文本或音频转换为您喜爱的角色的声音。它具有六个主要功能:AI 变声器、文本转语音、语音转文本、语音录音机、音频提取器和 AI 语音克隆。您可以使用它轻松地为内容创作、电子学习、播客等生成画外音。

FineVoice 的主要特点包括:

  1. 文本转语音:它可以提供自然听起来的高质量文本到语音的声音。您可以使用它创建画外音、配音、旁白和其他音频内容。

  2. AI 语音转换器:它允许您将您的声音转换成您最喜欢的角色。您可以从大量角色、电影明星或歌手中进行选择。变换后的声音听起来非常真实和逼真。

  3. 语音转文本:它可以轻松地将您的视频或音频文件转换成书面文本,准确率高,速度快。它支持多种语言和不同的格式,以最适合您的需求。

https://openaimaster.com/?p=35687

Stability AI 预览 Stable Diffusion 3 文本转图像模型 🎨

要点解析:

  • Stability AI发布了Stable Diffusion 3文本到图像模型,它能够生成高质量的图像,可以处理多主题图像生成,能够理解复杂的提示并生成更好的结果,图像质量和准确度也得到了提高。

  • Stability AI正在测试Stable Diffusion 3,并与专家合作,确保它不会被滥用,并减轻潜在的危害。

  • Stable Diffusion 3提供多种模型大小,从8亿到80亿不等,以满足不同用户对计算资源的需求。

https://www.artificialintelligence-news.com/?p=14443

Gemini for Google Workspace 耐心布局 ♟️

要点解析:

  • 谷歌宣布推出其新的生产力生成式人工智能解决方案——Gemini for Google Workspace,目前仅对企业用户开放,价格为每月 30 美元/用户,无限使用。对于不需要高使用量的企业,谷歌还推出了一个更便宜的套餐——Gemini for Google Workspace Business,每月 20 美元/用户,最多提供 1,000 次操作/用户/月。

  • Gemini的价值主张与微软的Microsoft 365的Microsoft Copilot类似。虽然细节和功能各不相同,但谷歌和微软都提供类似的生成式人工智能助手:它们直接集成到您的生产力和协作软件中;它们帮助您更快地完成工作;它们让您有时间去做更重要的工作。如果您已经使用谷歌平台,Gemini 可能是您获得经过公司批准并管理的生成式人工智能解决方案的最佳选择。

  • 不要以为 Gemini 和 Copilot 会止步不前。请记住,微软和谷歌在这款非常具有战略意义的新产品上都采用了快速的发布周期。对于这两款人工智能助手来说,需要进行大量的故障排除,才能使其真正兑现其承诺。但创新也在不远的将来:微软可能会将 Sora 带到 Copilot,而谷歌将引入多模态输入和输出。

https://www.forrester.com/?p=234236

认识谷歌 Deepmind 的 ReadAgent:缩小 AI 和人类阅读海量文档的差距 📚

要点解析:

  • 谷歌研究团队催生了ReadAgent,通过融合人类阅读策略显著提高AI对文档的理解力。

  • ReadAgent将长文本按自然停顿点分段,压缩成摘要,并在需要时通过摘要动态回忆详细内容。

  • 实验表明ReadAgent将有效背景长度最多扩展了20倍,对长文档的理解和处理能力优于现有方法。

https://www.marktechpost.com/?p=52886

Zeroscope AI 怎么用? 🤔

要点解析:

  • Zeroscope AI是一款开源的文本转视频生成模型,能够根据文本描述自动生成短视频,其能力和局限性均不断完善。

  • 使用Zeroscope AI可通过Hugging Face Spaces、Replicate平台或GitHub仓库直接获取,在所选平台输入文本提示即能生成视频。

  • Zeroscope AI虽允许自定义视频内容,但其生成视频长度较短,且受限于当前模型能力,生成的视频可能与文本描述不完全一致,且细节掌控有限。

https://openaimaster.com/?p=35700

微软向公众发布内部生成式 AI 红队工具 🤖

要点解析:

  • 微软推出了一款用于生成式人工智能的 Python 风险识别工具包(PyRIT),可以帮助识别生成式人工智能系统中的风险。

  • 该工具包经过了微软人工智能团队的实战检验,它向生成式人工智能系统发送恶意提示,一旦收到回应,其评分代理就会给系统打分,然后根据之前的评分反馈发送新的提示。

  • 微软表示,PyRIT 的最大优势在于它帮助微软红人团队提高了工作效率,大大缩短了任务所需的时间。

https://m.cnbeta.com.tw/view/1420375.htm

Zeroscope AI:用 AI 把文字变成视频 🎥

要点解析:

  • Zeroscope AI 是一项专注于文本到视频生成技术的开源项目,允许用户通过文本描述创建短视频,旨在让任何人都能轻松创建视频内容。

  • 目前,Zeroscope AI 提供两个主要模型:Zeroscope v2 和 Zeroscope v2 XL,可生成高达 3 秒的短视频,并提供多种实现选项,包括在线平台和本地运行。

  • Zeroscope AI 的主要特点是开源、支持文本到视频生成、提供多种版本和广泛的访问性,已在教育、营销、娱乐和个人表达等领域展现出巨大的潜力。

https://openaimaster.com/?p=35697

AI 代码助手 💻

要点解析:

  • 人工智能代码助手是专为帮助开发人员更有效地编写代码而设计的AI驱动工具。它们利用机器学习算法来理解您的编码风格,预测您的需求并提供智能建议。

  • AI代码助手不仅仅关乎代码完成和自动建议。它们提供许多功能,使编码更有效率、准确和愉快。我们接下来仔细看看其中的一些功能。

  • 最突出的功能之一是代码完成和自动建议。在键入时,这些工具为下一部分代码提供实时建议,让您不必费心记住复杂的语法或函数名称。此功能在您使用新语言或框架且尚未完全习惯其语法时特别有用。

http://www.i-programmer.info/programming/102-artificial-intelligence/16997-ai-code-assistants.html

AI 正迎来“1995 时刻” 📈

要点解析:

  • 人工智能迎来投资高峰,英伟达成为AI投资热潮的领导者,其研发的GPU芯片帮助企业构建基于ChatGPT的AI模型。

  • NVIDIA 的 AI 芯片广受 Salesforce、Adobe 和 Oracle 等领先软件供应商青睐,这种趋势与 90 年代中期互联网兴起时期的情况相似。

  • NVIDIA 总裁兼联合创始人黄仁勋表示,新的 AI 数据中心将“开启一个全新的应用程序世界,这是当今不可能实现的”。

https://www.businessinsider.com/ai-boom-nvidia-1995-moment-analyst-2024-2

使用 chatGPT 一年的感受 💬

要点解析:

  • 作者使用 ChatGPT 一年后,对 ChatGPT 的语言生成能力、专业配图能力、准确性等方面进行了总结,认为 ChatGPT 可以帮助用户提高写作效率,是一款好帮手。

  • ChatGPT 在专业知识的输出方面更加准确,可以帮助科研工作者和文章作者理解复杂的算法,并提供日常生活的例子来类比。

  • 作者建议科研工作者和文章作者升级到 GPT-4,以获得更好的写作体验和更高的写作效率。

https://juejin.cn/post/7338645701658984485

2024 年 11 大 AI 图片生成器 🎨

要点解析:

腾讯混元大模型升级对外开放「文生图」功能,可产生中文和英文的图片,不再受限于英文。代码能力大幅提升 20%,达到业界领先水平。腾讯推介了多个能力指标达到业界领先的AI模型。

https://towardsai.net/p/artificial-intelligence/top-11-ai-powered-image-generators-in-2024

沃达丰土耳其在国家授时网络中部署 Adtran 光铯解决方案 🌐

要点解析:

  • Vodafone Turkey使用Adtran Oscilloquartz铯原子钟技术升级其全国网络的时序,让网络具有更高的弹性。

  • Adtran的业界首款解决方案能够抵御对GNSS信号的干扰,使土耳其领先的服务提供商即使在为5G服务做好准备的情况下也能保持不间断、可靠的连接。

  • Vodafone Turkey结合其现有的Adtran Oscilloquartz核心授时时钟设备和新的铯原子钟技术,提供了一种ePRTC+™解决方案,确保在任何可能的GNSS不可用期间也能进行精确的网络同步。

https://aithority.com/?p=565453