Skip to content

Latest commit

 

History

History
460 lines (234 loc) · 39.4 KB

20231226.md

File metadata and controls

460 lines (234 loc) · 39.4 KB

目的

本系列文章主要是用于持续跟踪最新的AI产业情况,让你减少知识焦虑。

看点

原文共计134559 字,简读后为9446字,阅读时间为24分钟,为您提高阅读效率为1400%

  • 研究表明 ChatGPT 提供的建议,比专家更全面、更有帮助 🧠💡
  • 太牛叉了!国产 AI 智能体惊艳问世,全面致敬 FastGPT! 🇨🇳🤖
  • 清华&第四范式&腾讯研究团队:图神经网络与生物医学网络预测药物相互作用 🧪
  • LLM与药物发现结合,NVIDIA、Mila、Caltech团队发布多模态分子结构-文本模型 💊🧬
  • “算命”AI 问世:经 600 万人数据训练,可预测健康、收入和死亡 🔮💼💀
  • 市值缩水超2500亿!“眼茅”爱尔眼科到底怎么了? 😱💰
  • 有赞白鸦:AI,让 SaaS 真正「人人可用」 🌐
  • 科技创新提升用户体验 时研家用AI重构腕表行业_极客网 🌐⌚
  • 苹果在10月份低调发布开源多模态AI模型Ferret 这让AI社区感到非常惊讶 🍎🤯
  • 谷歌Gemini自爆“我是文心”,大模型研发要“站在巨人肩上”? 🤖📚

产业资讯

Copilot是否与Xcode兼容? ❓💻

要点解析:

  • GitHub Copilot是由GitHub创建的开发者人工智能助手,利用神经机器翻译技术根据已编写的代码提供建议。它由OpenAI开发的Codex算法驱动,经过数十亿行公共代码的训练。

  • 尽管Xcode在2022年底仍不支持GitHub Copilot的官方集成,但iOS和macOS开发人员找到了一些方法来在Xcode项目中使用它。其中包括使用第三方开源Xcode插件CopilotXcode、在Visual Studio Code中编辑Xcode项目文件、在独立代码编辑器中使用Copilot等。

  • 尽管GitHub Copilot提供了减少样板代码、加快编写速度、生成代码示例和原型、帮助文档等优点,但在Xcode中使用它仍存在局限性,包括较差的集成体验、多编辑器复杂性、Swift语言支持有限等。

原文链接:https://openaimaster.com/?p=29597

为AI加速而生:英特尔的至强,现在能跑200亿参数大模型了 🚀💻

要点解析:

  • 人工智能应用领域观察到传统企业选择在CPU平台上优化AI应用的趋势,例如在制造和医药领域。英特尔的至强可扩展处理器第五代在AI推理性能上取得显著提升,适用于多种工作负载,如生成式AI模型和深度学习任务。其核心数量增至64个,性能提升21%,且每个内核具备AI加速功能,训练性能提升29%,推理能力提升42%。

  • 英特尔不仅提升处理器性能,还致力于使AI加速能力变得更易用。通过英特尔AMX和oneAPI深度神经网络库,开发者能够轻松迁移代码,实现深度学习模型的快速开发和多平台部署。最新的OpenVINO™工具套件加入对大型语言模型性能的改进,支持生成式AI工作负载,如聊天机器人和智能助手。

  • 未来,英特尔计划推出下一代至强处理器,更专业化地满足AI需求。路线图显示,不同型号将配备不同核心,包括计算密集型与AI任务的P-core和面向高密度与横向扩展负载的E-core。这种设计旨在平衡极致性能和可持续发展绿色节能的需求。

原文链接:https://juejin.cn/post/7316171289097961506

昆仑万维「天工SkyAgents」Beta版全网测试 🚀🌐

要点解析:

  • 昆仑万维的AI Agents开发平台[天工SkyAgents]Beta版正式开放测试,基于大模型技术,实现从感知到决策、执行的自主学习和独立思考能力。用户可以通过自然语言构建私人助理,模块化任务实现问题预设、指定回复、知识库创建与检索、意图识别、文本提取等多项任务。平台为大模型技术在智能体领域的一次探索,力求普惠化大模型技术的应用。

  • AI Agents是人工智能技术驱动的智能实体,能感知环境、进行决策和执行动作。在大模型技术的推动下,AI Agents迎来发展机遇,昆仑万维的[天工SkyAgents]平台将大脑、感知、执行三大核心模块进行模块化,使用户能够轻松部署个性化AI Agents,应用于行业研究、商标设计、智能客服等多个领域。

  • AI Agents的三大核心模块包括大脑(核心信息处理中心)、感知(获取环境信息)、执行(执行任务)。[天工SkyAgents]平台支持模块化任务组件,智能知识库构建,第三方工具调用,实现了一键分享。这一综合性平台的推出有望加速大模型技术在个人和中小企业中的应用,推动智能体技术的发展。

原文链接:https://www.jiqizhixin.com/articles/2023-12-25-21

传暴雪想与网易复合,网易不予回应;抖音或正内测「AI搜索」功能;微信视频号将加大直播带货投入 🎮🔍📱

要点解析:

  • 12月25日,36氪报道称,暴雪正与国内多家游戏厂商进行[国服回归]洽谈,最终选择重新与网易合作。网易方面未予回应,但有消息称负责暴雪国服运营的团队已解散,重组可能需要较长时间。

  • 微信视频号加大对直播带货的资源投入,调整了微信支付和视频号团队组织架构,以协同推动直播带货。此举表明微信在加强社交和电商融合方面的努力,为直播带货市场投入更多资源。

  • 小红书回应上市传闻称暂无上市计划,打破了市场关于其明年下半年启动香港IPO的传闻。公司目前否认了即将上市的计划。

原文链接:http://www.geekpark.net/news/329514

研究表明 ChatGPT 提供的建议,比专家更全面、更有帮助 🧠💡

要点解析:

  • 专家研究表明,ChatGPT 在社会困境问题上的建议相较人类专家更平衡、全面、善解人意、有帮助。墨尔本大学和西澳大利亚大学的研究团队从十大热门建议栏网站上随机挑选了50个问题,404名志愿者盲测了ChatGPT和专栏作家提供的答案,结果显示ChatGPT在每一个问题和所有查询类别中都“明显优于”人类顾问,支持率在70%到85%之间。

  • 两项调查都显示,大多数参与者认为ChatGPT的建议比专业顾问更平衡、更完整、更善解人意、更有帮助,总体上更优秀。在第一项调查的404名参与者和第二项调查的401名参与者中,多数人在所有方面都投票支持ChatGPT。研究还指出,ChatGPT参与者的答案比专栏作家的答案更长,即便在第二项研究中,研究人员缩短了ChatGPT的回答长度,但其仍然相比专栏作家更全面更优秀。

  • 调查结果显示ChatGPT虽然建议的质量很高,但仍有77%的受访者表示更喜欢人类专家给出的回答。

原文链接:https://www.ithome.com/0/741/587.htm

元宇宙金融实践,已经走出那么远 🌌💰

要点解析:

  • 近两年来,数字金融在理论研究、技术应用、业务创新和监管规范等方面蓬勃发展。中国数字金融技术以大数据、人工智能、隐私计算和智能合约技术为代表,呈现精准化、智能化、安全化、规范化的发展特点。

  • 元宇宙金融是随着元宇宙概念崛起的新兴领域,试图以去中心化思想和区块链技术为基石,从支付到借贷再到资产确权等维度拓展,为去中心化框架下的元宇宙经济活动提供支持。目前,元宇宙金融的实践主要分为原生类、嫁接型和融合型三大类,涵盖了多样化的金融活动。

  • 在原生类元宇宙金融中,基于Roblox经济体系和NFT经济体系的实践成为代表。Roblox经济体系构建了玩家、开发者、平台之间的交易生态,而NFT市场则利用区块链技术衍生了数字化的不同财产,并通过“DeFi+NFT”模式拓展金融属性。嫁接型元宇宙金融包括数字藏品和数字人,其中数字藏品以NFT为基础,而数字人则在金融领域应用广泛,尤其是在服务方面。融合型元宇宙金融通过场景金融与支付实现虚拟世界与现实世界的自由切换,为用户提供个性化金融产品与支付方式。

原文链接:https://www.ofweek.com/ai/2023-12/ART-201700-8420-30621121.html

台积电飙升的2纳米晶圆代工成本可能影响AI芯片市场的萌芽 🖧💰

要点解析:

  • 台湾积体电路制造股份有限公司(台积电)准备迎接3纳米半导体设计技术成本的上升。最新报告指出,3纳米和2纳米节点的制造成本将大幅增加,成为业界关注焦点。

  • 报告关注2023年底半导体行业变化,人工智能处理器需求回升对成本和投资产生影响。英伟达等公司或因3纳米工艺采用,面临成本压力。供求动态可能导致人工智能芯片价格飙升。

  • 台积电在调整产能利用率和面对市场变化时需审慎,高盛下调其3纳米和2纳米制程产能利用率,显示对未来的犹豫态度。

原文链接:https://m.cnbeta.com.tw/view/1406895.htm

太牛叉了!国产 AI 智能体惊艳问世,全面致敬 FastGPT! 🇨🇳🤖

要点解析:

  • 昆仑万维发布了名为“天工SkyAgents”的平台,基于天工大模型,具备自主学习和独立思考能力。平台领先于同类产品,从感知到执行形成完整的人工智能体。

  • 令人钦佩的是,天工 SkyAgents 平台默默致敬了开源产品 FastGPT,展示了踏实的做事风格。用户登录平台后,可创建 Agent,规划任务,界面设计与 FastGPT 类似,呈现出高度相似性。

  • 天工 SkyAgents全面致敬 FastGPT,从界面设计到知识库搜索模块,几乎一模一样。这种全面致敬彰显了对开源社区的尊重,也突显了产品在表达敬意方面的高度相似性。

原文链接:https://juejin.cn/post/7315862212567613479

从山姆·奥特曼的圣诞愿望清单,看清2024年大模型发展方向 🎅📜

要点解析:

  • 在平安夜的清晨,OpenAI CEO 山姆·奥特曼发布了对GPT-5的期望清单,包括AGI、GPT-5、更好的语音模式、更高使用频率限制等。其中,GPT-5成为关注焦点,表明OpenAI正朝着新一代大模型的方向努力。奥特曼的粉丝征集帖得到积极回应,构成了2024年AI发展的愿景。

  • GPT-5的训练计划逐渐浮出水面。在数据瓶颈问题上,OpenAI可能通过购买私有领域数据和利用合成数据训练模型,解决GPT-4时所遇到的13T token的数据量问题。训练周期方面,考虑到新一代硬件和对齐工作的进展,GPT-5的训练周期可能较GPT-4更短。

  • 愿望清单还涉及到视频功能,竞争对手Google已展现出在Gemini训练中对视频的理解。同时,文生视频系统也在取得进展,结合GPT-5的强大能力,可能引爆这一领域的产品创新。2024年,AI将迎来更个性化、多模态的发展方向。

原文链接:https://awtmt.com/articles/3704974

CMU 最新研究:Gemini 综合不敌 ChatGPT,谷歌还需努力 📚🤖

要点解析:

  • 近日,谷歌发布的Gemini引起广泛关注,号称在各任务中可与OpenAI的ChatGPT相媲美。研究表明Gemini Pro在大多数任务上与GPT-3.5 Turbo相当,但在某些方面表现稍逊。研究深入探讨了问答、推理、数学和代码生成等关键能力,揭示了Gemini在不同任务上的优势和劣势。

  • 研究团队发现Gemini Pro在知识图谱问答中落后于GPT-3.5,尤其在社会科学、人文科学、STEM和专业领域方面。在推理能力方面,Gemini Pro整体准确率略低于GPT-3.5 Turbo,尤其在处理更长、更复杂问题时表现不佳。在数学推理和代码生成方面,Gemini Pro在特定情境下表现强势,但也存在性能差于GPT-3.5的情况。

  • 总体而言,Gemini Pro在多语言翻译方面表现突出,但在某些语言上存在阻塞响应趋势。该研究为理解Gemini和GPT系列之间的性能差异提供了重要见解,有助于评估大型语言模型在不同任务上的实际应用价值。

原文链接:https://www.leiphone.com/category/ai/1RTQDEt5vM96BEPo.html

2024年ChatGPT最受欢迎的功能需求 💬🤖

要点解析:

  • 随着技术的进步,对更复杂、多功能人工智能(AI)模型的需求不断增长。OpenAI的ChatGPT在自然语言处理领域独树一帜,正在重新定义人机交互,并在该领域设立新的标准。最近,OpenAI首席执行官Sam Altman询问了用户对ChatGPT在2024年最渴望的功能,用户的回应揭示了一个集体心愿单,透露了他们对ChatGPT在2024年可能实现的期望,包括人工通用智能、GPT-5语言模型和个性化等。在本文中,我们将探讨2024年用户最请求的ChatGPT功能。

  • 2024年用户最请求的ChatGPT功能包括:

    1. 人工通用智能(AGI):用户渴望ChatGPT在2024年实现人工通用智能,但Altman强调要保持耐心,指出在2024年开发AGI级别的AI模型仍然是一项艰巨的挑战。用户热切期待AGI的同时,Altman强调了实现真正通用智能的复杂性,强调了渐进的进展和全面的研究,以确保AGI在未来年份的负责任和道德发展。

    2. GPT-5:用户热切期待GPT-5的出现,希望它作为GPT-4的继任者能推动自然语言理解和生成的边界。用户期望GPT-5将带来前所未有的进步,处理复杂语境,理解细微差别,创造新的语言模型标准。

    3. 增强的语音模式:用户强调改进语音模式的重要性,表达了对更流畅、逼真对话体验的集体愿望。自然的语调和情感使用户更好地参与和满意。

原文链接:https://www.analyticsvidhya.com/blog/2023/12/most-requested-chatgpt-features-for-2024/

Analytics Vidhya对2024年的前10项AI预测 📊🔮

要点解析:

  • 2024年,人工智能迎来了激动人心的一年,开启了技术领域的全新篇章。在这个全面的预测中,我们深入探讨了将塑造2024年人工智能格局的预期趋势。准备好迎接一场科技未来的旅程,创新无限。

  • 开源大语言模型崛起:GPT-4面临激烈竞争。随着开源大语言模型(LLMs)的崛起,预示着一个范式转变,挑战强大的GPT-4。我们预测OpenAI将推出更强大的迭代版本,引发自然语言处理的新时代。

  • 多模态架构成为焦点。2024年,预计更高效的生成式人工智能模型将大量涌现。这些模型将具备在多种格式中无缝处理输入的能力,标志着多模态架构演进的重要一步。

  • 精简高效的大语言模型。未来一年将见证对大语言模型架构的加强努力,产生更高效、更紧凑的模型。关注点将转向创建更小但同样强大的大语言模型,为各种应用提供增强的多功能性。

原文链接:https://www.analyticsvidhya.com/blog/2023/12/top-10-ai-forecast-for-2024-by-analytics-vidhya/

生成式AI工具或于2024迎来爆发 微软Copilot势将成为最大赢家? 💥🚀

要点解析:

  • 2023年是生成式人工智能(GenAI)炒作之年,而2024年将迎来大多数公司实质性向技术投入的一年。22名顶级公司技术官员调查显示,近六成高管表示公司对人工智能技术的新投资正在加速,其中55%计划在六个月内购买企业级AI软件,如微软的Copilot。

  • 微软的Copilot备受青睐,已吸引大企业的支持,预计将为公司每年带来高达100亿美元的收入。微软近年向OpenAI投入数十亿美元,通过对Copilot的大力营销,微软成为行业“第一股”。企业普遍认为GenAI工具提高了工作效率,但Gartner指出,大部分企业并不会为所有员工配备这类工具,未来可能取消企业客户需要300个用户的要求。

  • 随着GenAI的广泛使用,企业将尝试将工具进入更专业的行业,如赛富时、SAP、Adobe等正在研究的项目。专业AI工具的价格可能较高,但由于企业不愿错过机会,这些工具的市场前景仍然向好。

原文链接:https://m.cnbeta.com.tw/view/1406937.htm

揭示AI的力量:深入探讨Copilot和Duet AI 🕵️‍♂️💡

要点解析:

  • GitHub Copilot,由GitHub与OpenAI合作开发,是一款具有突破性的人工智能编码助手,与Visual Studio Code等流行代码编辑器无缝集成。由OpenAI的GPT(生成式预训练变压器)技术驱动,Copilot通过根据正在编写的代码的上下文建议整行或整块代码,有效提高了编码过程的速度。它支持多种编程语言,适用于各种开发项目。

  • GitHub Copilot的优势包括实时代码自动完成、支持多种编程语言以满足不同项目需求、理解正在编写代码的上下文并生成相关建议,减少手动更正的需求。

  • Duet AI是另一款以协作模型运作的人工智能编码助手,利用AI提升编码体验,提供建议并自动执行重复任务。与Copilot不同,Duet AI是一个独立应用程序,可与任何代码编辑器一起使用。

  • Duet AI的优势包括支持团队协作、适用于多种语言和框架、可定制,开发人员可以根据自己的编码风格和偏好自定义Duet AI的辅助功能。

  • GitHub Copilot和Duet AI代表了人工智能驱动的编码辅助领域的重大进展。GitHub Copilot在快速原型设计和个体开发场景中表现出色,提供智能自动完成和上下文感知建议。相反,Duet AI以其协作特性脱颖而出,成为团队协作项目中强大的工具。

原文链接:https://hackernoon.com/unveiling-the-power-of-ai-a-deep-dive-into-copilot-and-duet-ai?source=rss

预计2027年全球AI耗水将达66亿立方米 💧🌍

要点解析:

  • 近日,央视财经报道指出,与ChatGPT等生成式AI聊天可能引发对水资源的大量消耗。数据显示,一个用户向ChatGPT提出10到50个问题可能消耗500毫升的水。预计未来五年内,AI算力需求可能增长超过一百万倍,到2027年全球AI需求可能耗费66亿立方米的水资源,相当于美国华盛顿州全年取水量。

  • 大多数数据中心采用蒸发冷却或水冷方式,虽然有效降低功耗,但导致大量水资源消耗和污染。AI训练是数据中心耗水的元凶之一,大规模训练需要更强的数据中心和相应散热能力。随着能耗和发热量增加,对水资源的消耗不断升级。

  • 快科技报道了AI对水资源的巨大需求,引发了对未来水资源消耗和环境影响的关注。随着AI的持续发展,需求的激增可能对全球水资源供应产生重大影响。

原文链接:http://www.199it.com/?p=1668221

比尔·盖茨:AI有望两到三年内走向大众 让世界变得更公平 🌐🤖

要点解析:

  • 微软联合创始人比尔·盖兹在最新博客中总结了对2024年“未来之路”的看法,认为人工智能爆炸是技术趋势开始的象征,将在未来产生深远影响。他强调AI在提高生产力、扩大教育和心理健康保健方面的重要性。

  • 盖茨将创新与AI联系,认为AI将加速创新管道,特别在药物发现领域。他强调人工智能能够加速新发现的速度,尤其在癌症药物的研发中已经取得显著成果。

  • 文章中盖茨表示,通过明智投资,AI可以让世界变得更公平,减少富国与穷国在创新获取上的差距。他对AI如何改变游戏规则、以前所未有的速度提供技术给需要的人表达了乐观。

原文链接:https://m.cnbeta.com.tw/view/1407001.htm

谷歌介绍“交通疏导”AI 模型研究成果:平均缩短 7 分钟拥堵时间、提升 30% 交通效率 🚗🗺️

要点解析:

  • 谷歌研究院使用开源模拟软件SUMO构建了基于交通疏导的AI模型。利用SUMO在西雅图T-Mobile Park和Lumen Field地区建立基础模型,结合谷歌地图提供的拥堵量、红绿灯位置、道路平均行驶速度等信息,生成了详尽的热力地图。

  • 研究团队将热力地图分区,并引入用户行为模型和西雅图警察局提供的路线建议,成功构建了交通疏导模型,可为车主分配最佳路线。在与西雅图交通部合作的实际应用中,平均缩短了7分钟的拥堵时间,提升了30%的交通效率。

  • 谷歌声称该研究展示了模拟技术在交通规划方面的潜力,特别是在大型活动场合,能够提升交通效率,并帮助道路规划者了解利用率低的路段,从而改善整体交通环境。

原文链接:https://www.ithome.com/0/741/509.htm

产品介绍

革新搜索从健康场景开始,夸克App全面升级健康搜索体验 🧑‍⚕️🔍

要点解析:

  • 夸克App于12月25日宣布全面升级健康搜索,推出大模型应用“夸克健康助手”。升级后,用户在夸克中搜索健康信息的准确率超过行业平均水平,呈现多样化的信息交互方式和实用搜索内容。

  • 夸克健康助手融合医学知识图谱和生成式对话能力,提供全面准确的健康信息。用户可进行多轮提问和对话,实现更维度的内容建议。智能筛查功能结合大模型能力,实现精准快速查找。

  • 夸克持续加大在健康内容层面的投入,基于大模型和全网权威观点,用户搜索健康内容的正确率超过行业平均水平。夸克建设健康专业内容生态,与医学专家合作,确保内容专业、正确、科学。夸克以新一代搜索产品解决用户实际问题,成为智能助手。

原文链接:https://www.jiqizhixin.com/articles/2023-12-26-2

使用LangChain的生成式AI——开始使用LangChain 🔄🤖

要点解析:

  • 本书介绍了编写大量代码和测试不同集成和工具的过程。提供了基本设置说明,涵盖常见的依赖管理工具,如Docker、Conda、pip和Poetry。下面将介绍模型集成,包括OpenAI的ChatGPT、Hugging Face上的模型和Jina AI等。最后,通过一个客服代理的实际应用示例,展示了如何构建应用程序。

  • 章节包括设置本书的依赖关系、模型集成和为客服构建应用程序。依赖工具如Docker、Conda、Pip和Poetry提供了创建可复制Python环境的方式。每个工具都有详细说明和配置文件。在安装过程中,作者强调了环境管理的重要性,为读者提供了一系列配置文件。

  • 文中详细介绍了使用pip、Poetry、Conda和Docker等工具进行环境设置的步骤。针对不同用户,推荐了使用Docker进行隔离的开发者,而对于数据科学家,建议使用Conda或Poetry。这一章节提供了对于不同依赖管理工具的全面认识,以确保读者能够成功运行书中的示例。

原文链接:https://juejin.cn/post/7316349771131011091

苹果在10月份低调发布开源多模态AI模型Ferret 这让AI社区感到非常惊讶 🍎🤯

要点解析:

  • 苹果在10月与哥伦比亚大学合作推出开源多模态AI模型Ferret,包含代码和权重,但仅限于研究使用。

  • 最新研究论文介绍3D头像和高效语言模型推理技术,为更复杂、性能更好的AI模型在iPhone和iPad上运行铺平道路。

  • 苹果致力于本地运行AI模型,提高在智能手机等小型设备上的效率,这一举措在AI社区引起轰动。

原文链接:https://www.landiannews.com/?p=101545

如何使用LogoAI? 🖼️🤔

要点解析:

  • LogoAI是一款人工智能驱动的平台,使标志设计变得迅速、简便、经济实惠。凭借先进的AI能力,LogoAI可以在短短几分钟内生成数百个根据品牌定制的独特标志创意。

  • 在本详细指南中,我们将全面介绍如何从头到尾使用LogoAI创建引人注目的标志,捕捉品牌身份,并在竞争中脱颖而出。

  • 第一步是在LogoAI网站上注册一个帐户。注册过程简单,只需提供电子邮件地址。注册后,您可以立即开始使用LogoAI。

原文链接:https://openaimaster.com/?p=29575

能效是英伟达 H100 的 8 倍,三星携手 Naver 发布新 AI 芯片 💻🔧

要点解析:

  • 2022年底,三星宣布与韩国互联网巨头Naver合作投资AI半导体解决方案。双方合作取得重大突破,研制出首款解决方案芯片,其能效是英伟达H100产品的8倍。

  • 针对Naver的HyperCLOVA X大型语言模型,定制了一块LPDDR内存的FPGA芯片,能效超过Nvidia的AI GPU八倍。合作重点在于使用三星的先进工艺技术,整合Naver在软件和AI算法方面的实力,解决大规模人工智能系统中的内存瓶颈。

  • 三星电子表示通过与Naver的合作,将开发尖端的半导体解决方案,为大规模人工智能系统解决内存瓶颈提供前所未有的解决方案。

原文链接:https://www.ithome.com/0/741/531.htm

谷歌Gemini自爆“我是文心”,大模型研发要“站在巨人肩上”? 🤖📚

要点解析:

  • 谷歌Gemini在大模型评测中超越GPT-4,成为备受关注的“新王”。然而,测试发现Gemini在中文对话中涉嫌“套壳”百度文心,承认自己是文心大模型,并透露创始人是百度的李彦宏。分析表明Gemini在中文领域的“监督精调”可能直接使用了百度文心的答案,将其视为“老师”进行学习。

  • 大模型的发展经历监督学习到预训练的演变,而Gemini在中文领域的精调阶段应用了大量百度文心大模型的答案。百度文心之所以成为Gemini的“老师”,一方面源于百度在中文领域积累的标注数据,另一方面则在于百度文心的技术实力和应用经验。

  • 百度文心大模型在中文领域技术、数据和应用上都具备优势,成为Gemini“师从”的最佳选择。谷歌Gemini在中文领域表现的提升,可视为站在百度文心这一巨人肩上,充分利用百度在中文NLP任务上的显著优势。

原文链接:https://www.ofweek.com/ai/2023-12/ART-201700-8110-30621125.html

LogoAI评测:使用、功能、价格 🖼️🧐

要点解析:

  • LogoAI是一款基于人工智能的标志设计工具,致力于使标志设计变得快速、简便且负担得起。用户通过输入公司名称、行业和风格偏好,算法即可生成定制标志,省去了与设计师沟通的烦恼。该平台免费试用,用户仅在下载首选标志时支付费用,起价29美元。LogoAI不仅提供AI生成的标志,还支持与人工设计师合作,更灵活地满足用户需求。

  • LogoAI的价值主张主要体现在效率、经济性和简易性。相较于等待设计师数天或数周的传统方式,LogoAI立即提供设计示例,节省了创业者大量时间。自动化流程避免了冗长的简报和修订过程,即使与人工合作者合作,LogoAI也比传统设计公司实现更快的交付。价格方面,LogoAI通过自动化设计流程,将标志设计成本降至较低,使得自定义品牌设计更为可行。

  • 尽管LogoAI提供了标志设计的高效途径,但完全依赖算法设计也存在一些缺点。由于AI生成的标志往往呈现出重复的形状、图标、字体和色彩,缺乏原创性。此外,与品牌建设机构不同,LogoAI未引导客户进行战略工作,无法深入了解目标消费者、竞争差异化和品牌特性,可能导致标志与公司深层次目标脱节。

原文链接:https://openaimaster.com/?p=29579

如何使用未经审查的AI模型,并用您的数据进行训练 🤐📊

要点解析:

  • 人工智能领域已不再是ChatGPT独霸的时代,Meta和Google推出的LLaMA和Gemini成为新势力。尽管工具和实现方式各异,它们有一个共同点:闭源并由大型科技公司掌控。

  • 本文探讨了人工智能领域的新竞争者,介绍了一款开源工具,优于ChatGPT 3.5,并可在本地运行。我们将了解如何无限制地使用它,以及如何用自己的数据进行训练。

  • Mistral是一家由前Meta和DeepMind研究人员创立的法国初创公司,他们成功筹集了4.15亿美元的投资,使Mistral的估值达到20亿美元。Mistral 8x7B模型不仅比LLaMA 2和ChatGPT 3.5更强大,而且完全开源。该模型在多项基准测试中展现出卓越性能,不仅超过LLaMA 2 70B,还在其他基准测试中匹敌或超越ChatGPT 3.5。

原文链接:https://hackernoon.com/how-to-use-an-uncensored-ai-model-and-train-it-with-your-data?source=rss

如何在Xcode上安装Copilot? 🛠️💻

要点解析:

  • GitHub Copilot是一款AI协作程序,可在编辑器中提供完整的代码行和整个函数建议,减少单调的编码任务,使编程更快捷、更愉快。

  • 本指南介绍了如何在Xcode中安装和设置GitHub Copilot,尽管其最初是为Visual Studio Code设计的,但也可以集成到其他编辑器中,比如Xcode。

  • 安装前需要确保Xcode最新版本已安装,安装Node.js和Homebrew。安装过程包括安装CopilotForXcode扩展、打开CopilotForXcode、安装必需组件、登录GitHub Copilot并验证安装。

原文链接:https://openaimaster.com/?p=29591

Microsoft Copilot Studio 是什么? ❓🖥️

要点解析:

  • Microsoft Copilot Studio是一款革命性的平台,允许任何人创建先进的对话式AI聊天机器人,称为“copilots”,无需编码或数据科学技能。通过直观的图形界面、预构建连接器、治理控制以及与Microsoft Teams的集成,Copilot Studio使copilot的创建对所有人都变得可访问。

  • 传统上,创建有效且有用的聊天机器人需要大量的数据科学、编码和AI专业知识,这使得先进的AI对于大多数企业和用户而言难以实现。Microsoft Copilot Studio彻底改变了这一局面,让没有专业技能的人首次能够利用AI的力量构建根据他们需求定制的聊天机器人。

  • Microsoft Copilot Studio是一种SaaS平台,具有图形化、无代码界面。它提供了完整的copilot创建生命周期管理工具。其中一些关键功能包括:使用可视化对话编辑器轻松构建机器人、支持生成AI模型提供自然语言响应和推荐、超过1,000个预构建连接器实现与业务数据和常见应用程序的集成,以及与Microsoft Teams的集成,使copilots能够直接发布为Teams应用。

原文链接:https://openaimaster.com/?p=29603

技术教程

如何在Xcode上安装Copilot? 🛠️💻

要点解析:

  • GitHub Copilot是一款AI协作程序,可在编辑器中提供完整的代码行和整个函数建议,减少单调的编码任务,使编程更快捷、更愉快。

  • 本指南介绍了如何在Xcode中安装和设置GitHub Copilot,尽管其最初是为Visual Studio Code设计的,但也可以集成到其他编辑器中,比如Xcode。

  • 安装前需要确保Xcode最新版本已安装,安装Node.js和Homebrew。安装过程包括安装CopilotForXcode扩展、打开CopilotForXcode、安装必需组件、登录GitHub Copilot并验证安装。

原文链接:https://openaimaster.com/?p=29591

如何使用LogoAI? 🖼️🤔

要点解析:

  • LogoAI是一款人工智能驱动的平台,使标志设计变得迅速、简便、经济实惠。凭借先进的AI能力,LogoAI可以在短短几分钟内生成数百个根据品牌定制的独特标志创意。

  • 在本详细指南中,我们将全面介绍如何从头到尾使用LogoAI创建引人注目的标志,捕捉品牌身份,并在竞争中脱颖而出。

  • 第一步是在LogoAI网站上注册一个帐户。注册过程简单,只需提供电子邮件地址。注册后,您可以立即开始使用LogoAI。

原文链接:https://openaimaster.com/?p=29575

使用LangChain的生成式AI——开始使用LangChain 🔄🤖

要点解析:

  • 本书介绍了编写大量代码和测试不同集成和工具的过程。提供了基本设置说明,涵盖常见的依赖管理工具,如Docker、Conda、pip和Poetry。下面将介绍模型集成,包括OpenAI的ChatGPT、Hugging Face上的模型和Jina AI等。最后,通过一个客服代理的实际应用示例,展示了如何构建应用程序。

  • 章节包括设置本书的依赖关系、模型集成和为客服构建应用程序。依赖工具如Docker、Conda、Pip和Poetry提供了创建可复制Python环境的方式。每个工具都有详细说明和配置文件。在安装过程中,作者强调了环境管理的重要性,为读者提供了一系列配置文件。

  • 文中详细介绍了使用pip、Poetry、Conda和Docker等工具进行环境设置的步骤。针对不同用户,推荐了使用Docker进行隔离的开发者,而对于数据科学家,建议使用Conda或Poetry。这一章节提供了对于不同依赖管理工具的全面认识,以确保读者能够成功运行书中的示例。

原文链接:https://juejin.cn/post/7316349771131011091

使用 GPT4V+AI Agent 做自动 UI 测试的探索 | 京东云技术团队 🤖🖥️

要点解析:

  • UI自动化领域长期存在Web UI测试难题,本文探讨了利用GPT进行UI测试的可能性。结合开源项目,尝试两种方案,其中第二种方案通过Playwright、SoM视觉标记、GPT4Vision和AutoGen实现。

  • 当前UI测试主要问题在于Webdriver的元素查找和维护成本高,而GPT能够通过人类思维进行UI测试。新方案结合多个工具,通过模拟人眼、手和大脑的协同工作,实现了UI测试的自动化。

  • 通过Playwright进行浏览器操作,SoM视觉标记辅助GPT4Vision识别元素,最后由GPT4+AutoGen实现协调控制。整体架构清晰,实现了UI测试的自动化和智能化。

原文链接:https://juejin.cn/post/7316592794109198387

其他

什么是多模态模型? 🤔🔍

要点解析:

  • 多模型是人工智能系统,能处理并理解来自多种模态(如图像、文本,有时包括音频)的信息。与传统模型专注于单一数据类型不同,多模型利用不同模态之间的协同作用,实现对输入的更全面理解。此外,多模型神经网络旨在有效地融合和利用来自不同模态的信息,以提升整体性能和理解力。

  • 多模型的魔力在于融合不同数据类型,无缝地结合文本、图像等,实现全面的理解。通过从各种来源融合信息,这些模型超越了单一模态方法的局限,提升了上下文理解的丰富性。利用变压器等技术创建统一的表示空间,使不同模态和谐共存。

  • 在计算机视觉领域,多模型取得了显著进展。它们用于将视觉数据与文本或音频等其他类型的数据结合,以改进目标检测、图像分类等任务。通过联合处理不同模态,它们提高了上下文理解能力,使其擅长解释复杂场景和图像内的微妙关系。此外,它们弥合了视觉和语言理解之间的差距,推动计算机视觉迈入新的时代。

原文链接:https://www.analyticsvidhya.com/blog/2023/12/what-are-multimodal-models/

达拉斯机场用 AI 增强失物招领:每年登记 1.8 万件物品,90% 归还原主 ✈️🧳

要点解析:

  • 在达拉斯-沃思堡国际机场,Mikha Sabu领导的专业团队利用AI技术,通过Hallmark Aviation Services的失物招领系统,成功归还了机场90%的丢失物品。该系统每年处理超过1.8万件丢失物品,通过与数据库比对照片和描述,成功找回物品后团队联系原主认领。

  • Hallmark Aviation Services的失物招领系统已扩展到其他11个机场。仅在2023年,系统成功找回了600枚戒指和400多枚腕表,其中包括七枚劳力士腕表。这些成就令人印象深刻,例如,一位新娘在结婚前24小时发现婚纱丢失,通过系统找回并及时送达婚礼现场,让她顺利完成美满婚礼。

  • Shimaa Fadul表示,Hallmark Aviation Services系统的日常运营已成为机场服务的重要组成部分,为旅客提供了高效的失物招领服务,通过AI技术改善了整个机场的运作效率。

原文链接:https://www.ithome.com/0/741/575.htm

Analytics Vidhya对2024年的前10项AI预测 📊🔮

要点解析:

  • 2024年,人工智能迎来了激动人心的一年,开启了技术领域的全新篇章。在这个全面的预测中,我们深入探讨了将塑造2024年人工智能格局的预期趋势。准备好迎接一场科技未来的旅程,创新无限。

  • 开源大语言模型崛起:GPT-4面临激烈竞争。随着开源大语言模型(LLMs)的崛起,预示着一个范式转变,挑战强大的GPT-4。我们预测OpenAI将推出更强大的迭代版本,引发自然语言处理的新时代。

  • 多模态架构成为焦点。2024年,预计更高效的生成式人工智能模型将大量涌现。这些模型将具备在多种格式中无缝处理输入的能力,标志着多模态架构演进的重要一步。

  • 精简高效的大语言模型。未来一年将见证对大语言模型架构的加强努力,产生更高效、更紧凑的模型。关注点将转向创建更小但同样强大的大语言模型,为各种应用提供增强的多功能性。

原文链接:https://www.analyticsvidhya.com/blog/2023/12/top-10-ai-forecast-for-2024-by-analytics-vidhya/

一键询问“钱都花在哪里了”,欧洲银行 bunq 推出 Finn AI 账单分析工具 💳💸

要点解析:

  • 欧洲第二大网络银行机构bunq推出了名为“Finn”的AI工具,成为欧洲首家“投入AI怀抱”的金融机构。Finn允许用户通过对话方式询问“消费问题”,包括特定种类的消费额和在特定平台的年消费总额。

  • bunq宣称Finn AI的最大优势在于“完全整合了用户所有账单信息与地点信息”,通过成功打通多家上下游公司实现“精准分析用户账单信息”。这使得AI助理能够根据交易地点和时间回答用户复杂的消费问题,提高了个人理财的灵活性。

  • 在个人理财方面,Finn引入了“AI分析”功能,对账单信息进行精细分析。相对于主流支付应用的支出分类功能,Finn的对话式账单询问工具在灵活性上有明显优势,为用户提供更便捷的理财体验。

原文链接:https://www.ithome.com/0/741/497.htm