Skip to content

Latest commit

 

History

History
377 lines (192 loc) · 36 KB

20231215.md

File metadata and controls

377 lines (192 loc) · 36 KB

目的

本系列文章主要是用于持续跟踪最新的AI产业情况,让你减少知识焦虑。

看点

原文共计99598 字,简读后为8107字,阅读时间为20分钟,为您提高阅读效率为1245%

  • 谷歌Gemini大杀器官宣免费用!暴打GPT-3.5,最强代码生成工具上线,支持20+语言! 💻🌐
  • 谷歌DeepMind最先进Imagen 2发布,这些AI图片你能辨别吗? 🖼️🤔
  • 谷歌文生图巅峰之作Imagen 2登场,实测暴打DALL·E 3和Midjourney! 🖼️🚀
  • 大模型推理效率提升3倍,EAGLE发布! 滑铁卢大学、北京大学等机构联合研发! 🚀💻
  • vivo S18 / Pro 系列手机正式发布,全系搭载自研AI蓝心大模型,2299元起! 📱🚀
  • 李开复:AI将成为最大最新的IT平台! 🌐💻
  • 谷歌发布音乐AI工具MusicFX,一句话创作一首音乐! 🎵✨
  • 加速算力基础设施建设,“数智说”算力新基建论坛即将启幕! 🚀💻
  • 实现量子化学精度,深度对比学习用于分子性质预测,规避几何弛豫瓶颈! 🧪🔬
  • 谷歌Gemini大杀器官宣免费用!暴打GPT-3.5,最强代码生成工具上线,支持20+语言! 💻🌐

产业资讯

李开复:AI将成为最大最新的IT平台! 🌐💻

要点解析:

  • 创新工场董事长兼CEO李开复在MEET2024智能未来大会上表示,AI将是最大最新的IT平台,标志着AI 2.0时代的到来。他将AI与过去的两个IT平台(Windows和安卓/iOS)相提并论,强调AI时代将创造巨大价值。李开复建议有梦想的开发者应采用AI-First、AI-Native的应用,认为这将是最伟大、最赚钱的应用方向。

  • 在他看来,AI 2.0的革命将使超级智能的AGI普及到每个APP中,带来前所未有的便利。他指出,这是PC时代和移动互联网时代之后的第三次革命,呼吁开发者要有野心,积极投身AI应用的开发,以抓住这一时代的机遇。

  • 李开复的观点中突显了AI在未来IT发展中的核心地位,强调了开发者在AI时代的重要性,并提出了面向未来最有前景的AI应用方向。

原文链接:http://www.fromgeek.com/internet/50-617863.html

2023人工智能年度评选揭晓!AI落地最佳参考来了! 🏆🌐

要点解析:

  • 量子位主办的MEET2024智能未来大会揭晓了2023人工智能年度评选结果,包括领航企业、创业公司、影响力人物、杰出产品和解决方案等五个维度。ChatGPT的出现推动生成式AI商业化应用,引领数字化转型浪潮。这一机遇让人们联想到互联网时代的规模,被认为是“比互联网时代还要大10倍”。

  • 通过深入调研和专家意见,量子位评选出了最具代表性和影响力的企业、创业公司、人物、产品和解决方案。涵盖基础大模型、AI计算、具身智能、空间计算、多模态交互等技术趋势,以及AIGC、自动驾驶、智能终端、金融、电商、物流、安防、内容社区等主流应用领域。

  • MEET2024大会现场有产学研行业专家如李开复博士和李培根院士,共同探讨科技进展,覆盖整个产业生态。此外,量子位创始人兼CEO孟鸿发布了《年度前沿科技报告》,总结2023年十大代表性科技进展,包括人工智能、生命科学、先进算力、可控核聚变、能源创新等领域。

原文链接:http://www.qbitai.com/?p=106375

日本游戏厂商揭秘AI工作流实例,智慧开窍! 🎮🤖

要点解析:

  • Level-5是一家日本游戏开发商,通过AI工作流在美术、3D建模、人物设计、配音和宣传等方面取得了显著成就。在美术方面,他们使用文生图功能生成布局参考,减轻了美术工作负担,并在背景美术提案中借助AI的奇思妙想启发创意。在3D建模领域,Level-5巧妙应用图生图功能,通过AI学习角色特征和生成不同质感的材质测试,提高了建模效果。此外,AI在人物/任务设计中发挥作用,ChatGPT辅助提案,为策划提供参考。在配音方面,借助VoiceVox的文本生成语音功能,实现了即时生成临时配音语音,提升了前期开发工作的参考环境。在宣传方面,Level-5利用AI进行官网设计、线下布展等,提高了工作效率。

  • Level-5通过AI工作流在美术、3D建模、人物设计、配音和宣传等方面取得了显著成就。在美术方面,他们使用文生图功能生成布局参考,减轻了美术工作负担,并在背景美术提案中借助AI的奇思妙想启发创意。在3D建模领域,Level-5巧妙应用图生图功能,通过AI学习角色特征和生成不同质感的材质测试,提高了建模效果。此外,AI在人物/任务设计中发挥作用,ChatGPT辅助提案,为策划提供参考。

  • 在配音方面,借助VoiceVox的文本生成语音功能,实现了即时生成临时配音语音,提升了前期开发工作的参考环境。在宣传方面,Level-5利用AI进行官网设计、线下布展等,提高了工作效率。总体而言,Level-5充分展示了AI在游戏开发中的多方面应用,为各个环节提供了创新和效率的提升。

原文链接:http://www.fromgeek.com/daily/1044-617959.html

AI制药很卷,科学家不用AI吃亏了! 💊😅

要点解析:

  • 全球AI制药备受关注,惠正奇医药创始人提出“跳跃性赶超”策略,紧盯前沿技术如细胞治疗、基因治疗、mRNA医学,力求技术上的飞跃超越。

  • 与靶点选择不同,回爱民强调从疾病出发,关注匹配疾病的靶点,不追求所谓新的靶点,而是注重技术创新,强调解决问题的关键。

  • AI在生物医药中发挥作用,但应注意其局限性。碳硅智慧创始人认为AI可助力发现新靶点,设计新颖结构,提供新的可能性,实现技术变革。

原文链接:https://www.chinaventure.com.cn/news/111-20231214-378776.html

加速算力基础设施建设,“数智说”算力新基建论坛即将启幕! 🚀💻

要点解析:

  • 数字时代赋能科技创新,算力成为产业转型引擎。上海数智峰会将于12月16日举办,重点探讨以算力为核心的数字信息基础设施建设,助推上海城市能级和竞争力提升。

  • [数智说]算力新基建论坛将聚集智算服务供应商、运营商、云计算服务商、AI芯片企业等代表,共同探讨大模型时代的智算能力建设,云网协同、算网融合、产业创新生态以及国产AI芯片的挑战和突围策略。

  • 嘉宾包括云赛智联、上海通服、中科曙光、燧原科技、科华云集团、UCloud等,分享各自在智算领域的经验与见解。

原文链接:https://www.jiqizhixin.com/articles/2023-12-14-4

谷歌Gemini大杀器官宣免费用!暴打GPT-3.5,最强代码生成工具上线,支持20+语言! 💻🌐

要点解析:

  • 谷歌Gemini Pro API上线,支持定制Gemini,免费体验,API收费标准与GPT-3.5一致。Gemini Pro在文本基准上优于GPT-3.5,支持全球38种语言,具有32K上下文窗口和多模态能力。

  • 谷歌推出Duet AI for Developers,代码补全工具,集成Gemini模型。与GitHub Copilot不同,谷歌利用25家公司数据集提供全面支持,包括Confluent、HashiCorp等。Duet AI for Developers将提供文档和知识源,帮助开发人员提高效率。

  • 谷歌关注整个Duet AI系列,发布Duet AI in Security Operations,强调工具提高开发效率,而非替代编码技能。Duet AI for Developers将免费开放,之后按月19美元收费。

原文链接:http://weixin.sogou.com/weixin?type=2&query=%E6%96%B0%E6%99%BA%E5%85%83+%E6%9A%B4%E6%89%93GPT-3.5%EF%BC%8C%E8%B0%B7%E6%AD%8CGemini%E5%A4%A7%E6%9D%80%E5%99%A8%E5%AE%98%E5%AE%A3%E5%85%8D%E8%B4%B9%E7%94%A8%EF%BC%81%E6%9C%80%E5%BC%BA%E4%BB%A3%E7%A0%81%E7%94%9F%E6%88%90%E5%B7%A5%E5%85%B7%E4%B8%8A%E7%BA%BF%E6%94%AF%E6%8C%8120%2B%E8%AF%AD%E8%A8%80

生成式AI与创造力交融:从X到Y的无限可能! 🚀🎨

要点解析:

  • 作为一个忙碌的项目从业者,我深陷年底的繁忙中,不仅投身于教育现状的调研和报告撰写,还在优化性能和框架,并为年终总结和新年计划做准备。在这样的状态下,生成式人工智能成为我不可或缺的工具,包括GPT、Gemini、星火和百度等。它们在起草报告、搜索信息等方面都发挥着重要作用,成为我工作中的得力助手。

  • 通过实验和训练小型生成模型,我更深刻地理解了生成式人工智能的本质。它们不仅是工具,更是一种将信息从一种形式转换成另一种形式的能力。这不仅在数学原理上体现,还为我们提供了全新的视角,帮助我们更好地利用和转换数字时代以及更早之前的所有数字资产。

  • 创造性工作的核心在于转换,每个创作者都是在利用这些工具将输入转化为新的创造。生成式人工智能为我们提供了改变现有事物、创造新事物的能力,成为艺术和创新的关键工具,塑造着数字时代的创作者与作品之间的互动关系。

原文链接:https://juejin.cn/post/7312272742078775322

戴尔科技CTO:2024年GenAI应用实践,需注意这3点! 🔍💡

要点解析:

  • 戴尔全球首席技术官John Roese分享了2024年科技趋势,强调生成式AI是未来关键话题,预言GenAI将从理论转向实践。企业需解决将GenAI应用于业务的挑战,包括构建推理基础架构和优先实施应用项目的决策。同时,2024年零信任将成为实际关注焦点,边缘平台的兴起和发展也备受期待。

  • Roese指出,GenAI转向实践将带来新趋势,重点从训练成本转向运营成本。他进一步预测,零信任将由热门话题发展为实际技术,政府机构在2024年初将在零信任方面发力。此外,企业认识到构建现代化边缘的未来发展方向是采用多云边缘平台。

  • 最后,Roese展望未来,认为量子计算与GenAI密不可分,量子计算将使GenAI更加高效。他预计混合量子系统将成为现代化AI的计算基础,实现AI在全球系统中的性能和效率扩展。

原文链接:http://www.fromgeek.com/ai/617998.html

智能助手搞定软件开发,设计到运维一应俱全! 💻🤖

要点解析:

  • DevOps-ChatBot是一款覆盖软件开发全生命周期的端到端AI智能助手,由蚂蚁Codefuse团队研发。它通过DevOps垂类知识库、知识图谱增强、沙盒执行环境等技术,保障生成内容的准确性和及时性。具有智能调度核心、代码整库分析、文档分析增强等五大核心模块,助力开发运维进入智能化时代。

  • 该助手解决了通用大模型在DevOps领域的不可靠性和信息不及时的问题。通过智能调度核心,支持多智能体框架,实现复杂多步骤任务。代码整库分析利用知识图谱、RAG检索等技术,使大模型感知上下文,实现仓库级代码理解和生成。文档分析增强通过知识库外挂和检索增强,保障专业领域知识问答的可靠性。

  • 除了在DevOps中应用,DevOps-ChatBot还支持文本知识库管理、知识图谱和代码知识库文件的上传与管理。其多智能体调度核心、文档分析增强、代码整库分析等功能为未来的发展提供了广阔空间,将开发运维模式转向大模型问答的智能化,标榜“天下没有难做的Coder”。

原文链接:http://www.qbitai.com/?p=106372

Karmada正式晋级CNCF孵化项目,华为云发起开源! 🚀🌐

要点解析:

  • 12月12日,云原生计算基金会(CNCF)宣布Karmada正式孵化项目。作为华为云捐赠的多云多集群容器编排技术,Karmada是业界首个跨云跨集群引擎,已成为分布式云原生技术领域的成熟力量。

  • Karmada的背后有八家企业的联合发起,包括华为云、工商银行、小红书等。自2021年4月开源以来,该项目在全球吸引了来自60多家组织的贡献者,已成为CNCF孵化级项目。其填补了Kubernetes多云和多集群环境中的编排空白,提供更好的性能和降低成本,受到全球企业用户的高度认可。

  • Karmada在多云环境中高效管理Kubernetes集群和分布式应用,为企业提供了平滑演进方案。其中立、厂商无关的设计让用户在微服务跨集群编排、跨集群弹性伸缩、多云化的访问、容灾等场景中获得便利。项目已在20多家企业落地应用,包括携程、vivo、有赞等,推动了云原生产业的发展。

原文链接:https://www.jiqizhixin.com/articles/2023-12-14-7

首个“创造式任务”基准发布!北大清华联手推出Creative Agents,专为想象力而生! 🎨🚀

要点解析:

  • 北京大学和清华大学等机构组成的团队提出了一类解决创造式任务的智能体——Creative Agents,并推出了首个创造式任务的测试基准。文章介绍了Creative Agents的框架,将智能体分解为想象模块和控制器,通过想象模块生成任务细节,控制器规划动作序列。实验证明,Creative Agents是首个能够创造复杂多样建筑的AI Agents。

  • 作者提到,当前AI Agents研究面临着解决开放式任务中创造性问题的挑战。为应对这一挑战,团队通过引入创造性任务概念,构建了一个测试基准,包含20个多样的语言指令,要求智能体在Minecraft游戏中用给定材料创造建筑。文章详细介绍了Creative Agents框架,包括想象模块和控制器的实现方式,以及评价指标的设定。

  • 实验结果显示,Creative Agents在创造式任务上表现出色,特别是基于图像想象的方法效果更佳。作者还通过GPT-4V提出了自动创造式任务评价指标,与人类评价一致性良好。然而,由于控制器性能限制,目前Creative Agents创造的建筑相对简单。

原文链接:http://weixin.sogou.com/weixin?type=2&query=%E6%96%B0%E6%99%BA%E5%85%83+%E9%A6%96%E4%B8%AA%E3%80%8C%E5%88%9B%E9%80%A0%E5%BC%8F%E4%BB%BB%E5%8A%A1%E3%80%8D%E5%9F%BA%E5%87%86%E6%9D%A5%E4%BA%86%EF%BC%81%E5%8C%97%E5%A4%A7%E6%B8%85%E5%8D%8E%E8%81%94%E6%89%8B%E5%8F%91%E5%B8%83Creative%20Agents%EF%BC%9A%E4%B8%93%E4%B8%BA%E6%83%B3%E8%B1%A1%E5%8A%9B%E8%80%8C%E7%94%9F%EF%BC%81

2023年AI展望:未来时间轴揭示! ⏳🤖

要点解析:

  • 2023年AI领域的创新呈现出与人类联系紧密的技术进步。一月份,MIT与Mass General Hospital合作开发了基于CT扫描的深度学习模型,用于评估患者肺癌风险。AI还融入盲杖,帮助视障者购物。OpenAI与Microsoft签订数十亿美元的协议,投资AI开发。

  • 二月份,OpenAI的ChatGPT通过美国医师资格考试,用户数达1亿。Google推出Bard A.I.,Microsoft发布集成ChatGPT的新Bing搜索引擎。五月,AI系统让机器人自主进行科学实验。Meta推出Phoenix Robot和Neuralink获FDA批准进行人体试验。

  • 六月份,苹果发布Vision Pro,重定义增强现实体验。OpenAI计划在伦敦设立首个非美国办事处,推出AI应用商店。欧盟AI法案进入最终阶段。McKinsey预测生成AI将为全球经济增加4.4万亿美元的价值。

原文链接:https://www.analyticsvidhya.com/blog/2023/12/ai-in-2023-the-timeline/

产品介绍

谷歌DeepMind最先进Imagen 2发布,这些AI图片你能辨别吗? 🖼️🤔

要点解析:

  • 谷歌发布了Imagen 2,一项文本到图像生成技术,通过优化训练数据集和引入图像描述,Imagen 2实现了更高质量、逼真和符合用户提示的图像生成。该技术不仅改进了手和人脸的逼真渲染,还提供了高度灵活性,使用户可以调节图像风格。同时,Imagen 2支持修补和扩图等图像编辑功能,为图像生成领域带来更多可能性。

  • 为提升图像质量,Google DeepMind在Imagen 2中加入了更详细的图像描述,促进模型对上下文和微妙差异的理解。通过专门的图像美学模型和美学评分,Imagen 2能够生成符合人类偏好的高质量图像。此外,技术提供了灵活性,用户可以通过参考图片和文本提示控制图像风格。

  • 为降低潜在风险,Imagen 2集成了SynthID,支持数字水印,帮助识别人工智能生成的内容。谷歌团队在设计、开发和产品部署中采取严格的防护措施,包括安全测试和对训练数据的保护,以确保Imagen 2的安全性和可靠性。

原文链接:https://www.jiqizhixin.com/articles/2023-12-14-3

谷歌文生图巅峰之作Imagen 2登场,实测暴打DALL·E 3和Midjourney! 🖼️🚀

要点解析:

  • 谷歌发布的Imagen 2是文本到图像领域的最新巅峰之作,通过强大的机器学习算法和复杂的神经网络架构,能以惊人的准确性将复杂抽象的概念转化为逼真的高分辨率图像。其在图像生成的细节、逼真度和多功能性方面都展现出无与伦比的性能。

  • Imagen 2的特色在于不仅能以简单自然语言生成图像,而且支持图像编辑功能,如修复和扩图。同时,它的训练数据集经过优化,加入更多描述,使模型更好地理解不同的标题风格,提高对上下文和细微差别的理解。这一技术突破对内容创作领域产生深远影响,为图像生成技术开辟新的可能性。

  • Imagen 2的应用场景广泛,包括高质量、逼真、高分辨率的图像生成、文本渲染、Logo设计、标注和问答等。谷歌将其下放到开发者平台Vertex AI,为用户提供直观的工具,支持自定义和部署,使其在企业级场景中更加全面实用。

原文链接:http://weixin.sogou.com/weixin?type=2&query=%E6%96%B0%E6%99%BA%E5%85%83+%E8%B0%B7%E6%AD%8C%E6%96%87%E7%94%9F%E5%9B%BE%E5%B7%85%E5%B3%B0%E4%B9%8B%E4%BD%9CImagen%202%E7%99%BB%E5%9C%BA%EF%BC%8C%E5%AE%9E%E6%B5%8B%E6%9A%B4%E6%89%93DALL%C2%B7E%203%E5%92%8CMidjourney%EF%BC%81

谷歌发布音乐AI工具MusicFX,一句话创作一首音乐! 🎵✨

要点解析:

  • Google推出AI音乐创作工具“MusicFX”,结合MusicLM模型和DeepMind的SynthID水印技术。用户可通过简短文本生成原创音乐,解决版权问题,标志着AI音乐创作进入新阶段。

  • MusicFX提供丰富音效,支持调整音调、节奏、音量,并添加混响等效果,为音乐创作者提供多样创作可能性。发布于Google的AI实验性产品网站,通过早期用户反馈改善技术,强调道德标准。

  • MusicFX可能降低音乐创作门槛,但引发争议,AI生成的音乐如何处理版权、原创性问题尚无定论。Google积极与用户合作,致力于塑造负责任的AI发展新时代。

原文链接:https://m.cnbeta.com.tw/view/1404443.htm

vivo S18 / Pro 系列手机正式发布,全系搭载自研AI蓝心大模型,2299元起! 📱🚀

要点解析:

  • vivo S18系列正式发布,包括S18e、S18和S18 Pro三款手机。S18将于12月22日开售,而S18 Pro和S18e分别于1月13日和12月22日正式开售。价格区间广泛,满足不同用户需求。

  • 外观设计上,S18e提供了霞光紫、云纱白和星夜黑三种配色,7.69mm厚,193g重。性能方面,搭载联发科天玑7200移动平台,配备LPDDR4X内存和UFS 2.2闪存。

  • S18和S18 Pro在外观、性能和摄影方面有所不同,分别搭载骁龙7 Gen 3和天玑9200处理器。S18系列在屏幕、摄像头和电池等方面均有亮点,展现了vivo在手机技术上的创新实力。

原文链接:https://www.ithome.com/0/739/298.htm

大模型推理效率提升3倍,EAGLE发布! 滑铁卢大学、北京大学等机构联合研发! 🚀💻

要点解析:

  • 大语言模型在各领域应用广泛,但自回归解码效率低下。EAGLE,由滑铁卢大学、向量研究院和北京大学等联合发布,旨在提高大语言模型的推理速度,保持文本分布一致。方法通过外推模型的第二顶层特征向量,显著提升生成效率。EAGLE的特色包括快速、保持分布一致、与其他平行技术结合使用等。

  • EAGLE相比传统自回归解码,如13B、Lookahead、Medusa,速度分别提高3倍、2倍、1.6倍,同时保持生成文本分布一致。方法通过投机采样,使用小型草稿模型猜测多个词,然后原始模型验证,加速生成过程。EAGLE利用原始模型上下文特征,通过轻量级自回归头和冻结分类头实现外推,确保高效生成。

  • 训练EAGLE的自回归头成本较低,使用ShareGPT数据集进行训练,参数数量少。方法动态使用词嵌入预测特征,处理抽样随机性。与Medusa等方法相比,EAGLE采用树状生成结构,避免无意义序列。多轮投机采样保持分布一致性,加速效果在不同任务中显著,尤其在编程任务中表现最佳。

原文链接:https://www.jiqizhixin.com/articles/2023-12-14-2

南京农业大学研发全国首个古籍AI大模型“荀子”,吟诗、高质量翻译样样行! 📜🤖

要点解析:

  • 南京农业大学信息管理学院王东波教授研究团队发布了“荀子”古籍大语言模型,包含《四库全书》等传世古籍,拥有超过20亿字的语料库。该模型在国家社科基金支持下由中华书局古联公司推出,成为古籍处理与研究的智能工具。

  • “荀子”大模型具备智能标引、信息抽取、诗歌生成、高质量翻译、阅读理解、词法分析和自动标点等功能。可帮助研究人员主题标引、抽取关键信息、生成古诗、进行现代文翻译、阐释古文文本等,提升研究效率和阅读体验。

  • 该模型分为基座模型XunziALLM和对话模型XunziChat两部分,支持本地训练语料微调。已作为开源公益研究成果发布在GitHub等网站。

原文链接:https://www.ithome.com/0/739/186.htm

技术教程

阿里巴巴AI一键试衣,轻松换装新风尚! 👗🤖

要点解析:

  • 阿里巴巴智能计算研究院最新发布了虚拟试穿技术「Outfit Anyone」,利用双流条件扩散模型解决传统试穿模型的问题,处理服装变形,实现更逼真的效果。该技术在不同场景中展现出色,已做好在现实世界中部署的准备。

  • Outfit Anyone核心采用Diffusion Model,以服装图像为控制因素,独立处理模特和服装数据,最终融合为一个特征表示。案例展示包括不同服装更换、奇异服装上身效果、不同体型模特同一衣服效果等,甚至可对服装进行精修,与Animate Anyone集合实现动态视频生成。

  • 虽然引起社交讨论,技术兴奋人们,但Outfit Anyone目前仅用于学术研究和效果演示,尚不能商业使用,存在版权等问题,对电商模特产业的影响还需时间观察。

原文链接:https://www.pingwest.com/a/291000

实现量子化学精度,深度对比学习用于分子性质预测,规避几何弛豫瓶颈! 🧪🔬

要点解析:

  • 深度学习算法在预测高级量子化学分子特性方面表现出色,但受限于训练数据几何弛豫水平,导致输入限制。韩国首尔大学的研究团队提出了基于深度对比学习的域适应方法,称为局部原子环境对比学习(LACL)。LACL通过比较不同构象生成方法,学习减轻分布差异,形成域无关的潜在空间,为量子化学精度提供新途径。

  • LACL以计算高效的几何松弛方法和DFT分子几何数据捕获分子数据相似性,充分利用量子化学数据潜力。该方法绕过从头开始几何弛豫的计算瓶颈,验证模型领域适应性能。通过降低计算成本和推理时间,LACL在低保真几何形状准确预测分子特性,可应用于逆向分子工程和大规模筛选。

  • LACL模型采用深度对比学习显式建模三体交互,捕捉几何域之间的微妙差异。通过端到端训练,最小化BGRL损失和目标属性预测损失,有效学习分子图表示。该方法展现了在提高构象预测能力的同时,实现了量子化学精度,为快速准确预测量子化学性质提供了新的机会。

原文链接:https://www.jiqizhixin.com/articles/2023-12-14

LLM生成3D场景,无限延伸!斯坦福华人提出3D动画生成框架,一句话一幅图创造无限3D世界! 🖼️🌐

要点解析:

  • 斯坦福研究人员提出全新视频生成框架WonderJourney,通过一句话或图片,可自动生成3D场景序列,展现出惊人的创意和多样性。框架利用LLM生成场景描述,文本驱动的点云生成器制作连贯的3D场景,最后通过VLM验证生成效果。用户可从不同起点开始,探索多样化而连贯的视觉旅程。

  • WonderJourney框架采用模块化设计,包括LLM生成场景描述、文本驱动的视觉生成和VLM验证。通过输入图像或文本,框架能够生成多样而连贯的3D场景序列。实验证明WonderJourney在人类偏好评估中表现优越,相较于基线方法更受欢迎,展现出更高的多样性、视觉质量、场景复杂性和整体趣味性。

  • WonderJourney的创新之处在于能够从任何位置开始生成3D场景,且通过文本描述控制场景发展。框架综合利用语义理解、视觉模型和几何理解,生成引人入胜的视觉旅程,为计算机视觉和人工智能领域注入了新的创造力和娱乐性。

原文链接:http://weixin.sogou.com/weixin?type=2&query=%E6%96%B0%E6%99%BA%E5%85%83+LLM%E7%94%9F%E6%88%903D%E5%9C%BA%E6%99%AF%EF%BC%8C%E6%97%A0%E9%99%90%E5%BB%B6%E4%BC%B8%EF%BC%81%E6%96%AF%E5%9D%A6%E7%A6%8F%E5%8D%8E%E4%BA%BA%E6%8F%90%E5%87%BA3D%E5%8A%A8%E7%94%BB%E7%94%9F%E6%88%90%E6%A1%86%E6%9E%B6%EF%BC%8C%E4%B8%80%E5%8F%A5%E8%AF%9D%E4%B8%80%E5%B9%85%E5%9B%BE%E5%88%9B%E9%80%A0%E6%97%A0%E9%99%903D%E4%B8%96%E7%95%8C

实时AI,躺平难度最高的战场! ⚔️😅

要点解析:

  • 2024年被预测为视频之年,今年已见端倪。Pika Labs 1.0和Meta推出的免费AI图像生成器受欢迎。谷歌的最新文生图模型Imagen 2成为焦点,实现了在谷歌搜索中直接生成图像。Krea AI Beta版推出,注重实时性,通过实时生成工具、增强工具等创意工具包备受关注。

  • Krea AI的实时生成工具提供多种方式,包括文本到图片、图生成图、屏幕生成图以及直接拍摄生成图。与文生图工具不同,图生成图更注重作品效果控制,可通过简单线条和色块工具涂鸦,实现更精准的表达。增强工具Upscale & Enhance通过提高分辨率和重新创建视觉内容,使作品更加完美。

  • Krea AI不仅具备速度和效果,还与常见设计工具兼容,如Photoshop、Illustrator等。引人注目的是其与iPad的无缝连接功能,使创作更加灵活。此外,Krea AI还推出了两个特定功能的小工具:AI pattern和Logo Illustration,丰富了用户体验。

原文链接:https://www.jiqizhixin.com/articles/2023-12-14-8

Excel研发俄罗斯方块,全国首例AI声音侵权案审理! 🎮⚖️

要点解析:

  • 北京互联网法院审理全国首例AI声音侵权案,原告职业配音,发现自己的声音被AI化在APP上出售,涉及侵权责任和损害后果。

  • 特斯拉发布第二代人形机器人Optimus,性能提升明显,能够完成复杂动作和轻松抓取鸡蛋,将于2023年12月发布。

  • 程序员为微软Excel开发俄罗斯方块游戏,使用VBA语言编写,支持多种功能,展示Excel在游戏开发中的潜力。

原文链接:https://juejin.cn/post/7312275586255421490

Google Vertex AI是什么? 🤔🌐

要点解析:

  • Google Vertex AI是一款统一的机器学习平台,集成了Google Cloud的数据转换、模型构建、模型训练和模型部署服务。其核心目标是通过将多个服务整合在一个平台上,简化将模型从构思到生产部署的过程,以实现人工智能应用的快速开发。

  • Vertex AI通过提供多项关键功能来实现其目标,包括AutoML用于自动模型构建,Managed Training用于定制模型,通过Model Garden提供的预训练模型,以及用于模型监控和管理的MLOps工具。这些功能使得开发者和数据科学家能够更轻松地参与到人工智能的开发中,从而实现人工智能的民主化。

  • Google Vertex AI的优势在于提高协作效率、降低运营开销、提升模型质量、促进创新,并具备灵活性和可扩展性。它整合了各种服务,允许数据工程师、数据分析师、数据科学家和DevOps工程师更好地协作,将模型从实验阶段顺利推进到生产环境,同时保持模型质量和公正性。

原文链接:https://openaimaster.com/?p=28698

智能助手搞定软件开发,设计到运维一应俱全! 💻🤖

要点解析:

  • DevOps-ChatBot是一款覆盖软件开发全生命周期的端到端AI智能助手,由蚂蚁Codefuse团队研发。它通过DevOps垂类知识库、知识图谱增强、沙盒执行环境等技术,保障生成内容的准确性和及时性。具有智能调度核心、代码整库分析、文档分析增强等五大核心模块,助力开发运维进入智能化时代。

  • 该助手解决了通用大模型在DevOps领域的不可靠性和信息不及时的问题。通过智能调度核心,支持多智能体框架,实现复杂多步骤任务。代码整库分析利用知识图谱、RAG检索等技术,使大模型感知上下文,实现仓库级代码理解和生成。文档分析增强通过知识库外挂和检索增强,保障专业领域知识问答的可靠性。

  • 除了在DevOps中应用,DevOps-ChatBot还支持文本知识库管理、知识图谱和代码知识库文件的上传与管理。其多智能体调度核心、文档分析增强、代码整库分析等功能为未来的发展提供了广阔空间,将开发运维模式转向大模型问答的智能化,标榜“天下没有难做的Coder”。

原文链接:http://www.qbitai.com/?p=106372

其他

OFweek 人工智能网,探索前沿科技! 🌐🔍

要点解析:

  • 美图公司近年业绩起伏,2020年亏损,2022年盈利。然而,美图秀秀月活跃用户下降,用户粘性降低。面临AI技术竞争,市场格局变化。

  • AI技术带来图像处理创新,美图秀秀传统功能相对简单。AI技术在市场前景广阔,全球图像处理市场增长迅猛,竞争愈发白热化。新兴企业如Facetune利用AI技术取得成功,美图秀秀需应对技术差距。

  • 美图秀秀采用“打不过就加入”策略,赋能产品线,推出多款AI应用。然而,技术壁垒存在,AI公司数据资源庞大,美图秀秀面临挑战。如何在AI激烈竞争中立足成为考验。

原文链接:https://www.ofweek.com/ai/2023-12/ART-201700-8500-30619830.html

ChatGPT成为Nature年度十大人物,首个非人类实体! 🤖👑

要点解析:

  • 2023年Nature's 10评选中,首次包含大型语言模型ChatGPT,标志着生成式AI在科学领域的深远影响。ChatGPT不仅与人类合作起草科学论文,还引发对生成式AI潜力和危险性的讨论。尽管它为科研提供助力,但也可能带来作弊、抄袭以及信息污染等问题。

  • 生成式AI的革命势不可挡,但伴随着潜在风险。ChatGPT的升级和应用催生了对大型语言模型黑匣子性质、AI局限性以及人工智能与人类智能互动的思考。科学家和观察者对未来生成式AI的潜力和限制仍存在不确定性,但这场AI浪潮已经掀起。

  • ChatGPT的创造者之一,OpenAI首席科学家Ilya Sutskever,成为Nature's 10入选者。他致力于开发通用人工智能,同时也引领对AI风险的讨论。生成式AI的影响不仅在ChatGPT上显著,还涉及其他领域,如医学、物理学等。

原文链接:https://www.jiqizhixin.com/articles/2023-12-14-5

不必争论“新闻女王”,AI将7x24小时播新闻! 📰🤖

要点解析:

  • AI主播系统旨在取代只会念稿子的主播,提供全天候不间断新闻报道。通过模拟真人形象和语音,具备多语言播报能力,同时保证新闻的真实性。

  • 该系统由复杂模型支持,类似于ChatGPT,赋予主播独特个性和灵活性。新闻来源包括独立记者、政府文件生成的AI新闻以及外部机构报道,以确保内容可信。制片人和编辑参与内容准确性的检查。

  • Channel 1与传统新闻不同,不提供标准化播报,而是让观众自由选择新闻。制作成本较低,预计在流媒体平台上线,通过广告支持的应用程序或视频平台播放,每天制作数百至数千个片段。

原文链接:https://www.jiqizhixin.com/articles/2023-12-14-6

ChatGPT当选《自然》十大人物,只是人类投影! 🤖👤

要点解析:

  • 《自然》年度11大人物中,ChatGPT作为唯一非人类上榜,挑战了传统评选规则。作为OpenAI的聊天机器人,ChatGPT在全球产生深远影响,成为人类社会的重要工具。尽管其知名度和影响力巨大,但也存在局限和弊病,需要谨慎对待。

  • ChatGPT是OpenAI推出的聊天机器人,通过数千亿参数的神经网络构建,以在线书籍和文档为基础进行训练。其升级版本具备图像生成功能,成为知识的百科全书式工具。然而,与自然人相比,ChatGPT在某些方面仍显不足,如缺乏分辨能力和逻辑推理能力。

  • 《自然》编辑将ChatGPT列为11大人物,承认其为科学发展带来的重大改变。然而,ChatGPT的广泛应用也引发了对人工智能伦理和法规的关注,欧盟通过《人工智能法案》初步协议,对通用目的AI系统进行全面监管,旨在平衡发展和保护人类基本权利。

原文链接:https://m.cnbeta.com.tw/view/1404387.htm