Skip to content

Latest commit

 

History

History
508 lines (258 loc) · 42.7 KB

20231216.md

File metadata and controls

508 lines (258 loc) · 42.7 KB

目的

本系列文章主要是用于持续跟踪最新的AI产业情况,让你减少知识焦虑。

看点

原文共计142878 字,简读后为9498字,阅读时间为24分钟,为您提高阅读效率为1488%

  • 微软AI图像生成器免费 😃
  • 发现字节跳动使用OPENAI API培训AI,账号已被OPENAI暂停 🚨
  • PaLM 2数学性能暴涨6%!DeepMind新作揭示「合成数据」是通往AGI的关键 📈
  • OpenAI工程师揭秘ChatGPT开发仅用8天!探秘硅谷顶流如何诞生 🕵️‍♂️
  • 美国可控核聚变成功点火4次,刷新Nature纪录!首席女科学家入选年度十大人物 🌟
  • 欧拉与AI深度结合:操作系统升级带来全新智能体验_极客网 🔄
  • 字节跳动被曝秘密使用OpenAI技术,账户被暂停 ⚠️
  • 我的AI学习之旅年度总结 📚
  • 上市前分红4200万元,云工场科技充当“数据服务中间商”替供应商打工 💼
  • 特斯拉、比亚迪纷纷入局!掀起新的万亿市场浪潮 🚗💰

产业资讯

欧拉与AI深度结合:操作系统升级带来全新智能体验_极客网

要点解析:

  • 2023年12月15日,北京国家会议中心举办了以“崛起数字时代,引领数智未来”为主题的操作系统大会2023。大会由开放原子开源基金会、中国电子技术标准化研究院、国家工业信息安全发展研究中心、中国软件行业协会共同主办,旨在汇聚全球产业界创新力量,构筑坚实的基础软件根基,推动基础软件技术持续创新,共建全球开源新生态。

  • 在数字化浪潮中,欧拉在智能化方面发挥引领作用。以大模型和大算力为代表的技术创新推动人工智能发展,欧拉已支持全球主流通用计算架构,同时率先支持主流AI处理器,成为多样性算力的首选。通过AI加持与结合,覆盖了系统开发、应用运行和系统运维的全流程,打造智能时代操作系统的最佳选择。

  • 2024年,欧拉将发布全新内核24.03LTS版本,采用Linux6.6作为内核,极大提升调度和内存使用效率,同时在IO管理、新网络标准支持以及对CXL的支持上有极大提升。这将持续增强全场景能力,使欧拉成为数字基础设施全场景操作系统的先行者。

原文链接:http://www.fromgeek.com/it/618260.html

字节跳动被曝秘密使用OpenAI技术,账户被暂停

要点解析:

  • 字节跳动违反OpenAI服务条款,使用OpenAI技术开发“种子计划”大语言模型,导致账户被暂停。该行为被认为失礼,涉及API访问上限、数据脱敏等问题。

  • 外媒获得内部文件揭示字节跳动员工在“种子计划”早期大量使用OpenAI技术,违反微软政策。字节跳动声称删除了GPT生成数据,但继续以违规方式使用API评估模型性能。

  • OpenAI确认暂停字节跳动账户,要求遵守使用政策。微软表示提供有限访问框架,强调客户必须获得批准并负责任地使用技术。

原文链接:https://m.cnbeta.com.tw/view/1404827.htm

介绍Palo Alto Networks的新AI功能:增强威胁检测和缓解 - Info Lopare

要点解析:

  • 帕洛阿尔托网络公司宣布将人工智能功能整合到其Cortex产品组合中,聚焦自动化和安全情报。这些AI功能主要关注威胁检测和防范,预计将彻底改变安全领域。

  • 公司数据显示,目前检测和解决安全事件平均需要五天半的时间。这一问题受到应对复杂性的影响,因为组织通常依赖不同团队使用的分散的安全产品,导致数据碎片化。引入Cortex XSIAM v2.0后,用户现在可以将任何机器学习框架整合到Cortex中,这是企业用户期待已久的功能。

  • 通过这一发展,帕洛阿尔托每日收集的PB级网络遥测数据现在可以被这些模型利用,实现了对欺诈检测和数据可视化的改进。目标是最小化攻击者在妥协和执行之间的时间。令人印象深刻的是,一家石油和天然气领域的客户成功将误报警报数量减少了75%。

原文链接:https://news.google.com/rss/articles/CBMigAJodHRwczovL3d3dy5pbmZvbG9wYXJlLmNvbS9lbi8lRDAlQjIlRDAlQjUlRDElODglRDElODIlRDAlQjAlRDElODclRDAlQkElRDAlQjAtJUQwJUI4JUQwJUJEJUQxJTgyJUQwJUI1JUQwJUJCJUQwJUI4JUQwJUIzJUQwJUI1JUQwJUJEJUQxJTg2JUQwJUI4JUQxJTk4JUQwJUIwL2ludHJvZHVjaW5nLW5ldy1haS1mZWF0dXJlcy1pbi1wYWxvLWFsdG8tbmV0d29ya3MtZW5oYW5jaW5nLXRocmVhdC1kZXRlY3Rpb24tYW5kLW1pdGlnYXRpb24vOTYwNDAv0gEA?oc=5

发现字节跳动使用OPENAI API培训AI,账号已被OPENAI暂停

要点解析:

  • 据The Verge报道,字节跳动涉嫌通过开通的Microsoft Azure OPENAI API账户生成数据,用于训练其人工智能模型。该项目名为Project Seed,是字节跳动的人工智能项目,几乎每个开发阶段都严重依赖OPENAI API,包括训练和评估模型等。

  • 尽管字节跳动明面上声称要保持合规性,实际上却试图秘密利用OPENAI API,然而这一行为最终还是被曝光。字节跳动发言人承认使用了OPENAI API,但强调是通过合法方式购买Microsoft Azure OPENAI API,并获得微软的许可。公司主要在国际市场使用OPENAI API训练模型,而在中国市场则继续使用自有模型数据。

  • 尽管字节跳动主要调用的是Microsoft Azure OPENAI API而非OPENAI API,但微软和OPENAI的服务条款都明确禁止使用API训练其他AI产品,因此字节跳动的行为已违反服务条款。OPENAI官方表示已暂停字节跳动的开发者账号,要求所有API客户遵守使用政策,确保技术得到正当利用。

原文链接:https://www.landiannews.com/?p=101417

医疗保健的安全AI,提供者追求“一代大型模型的好处”

要点解析:

  • 28家医疗机构签署了拜登-哈里斯政府关于人工智能安全、可靠和值得信赖发展和使用的自愿承诺。他们致力于在医疗环境中利用大型模型的优势,同时减轻风险,保护患者的敏感健康信息。签署机构包括CVS Health、Stanford Health等。

  • 这些机构承诺通过遵循美国卫生与人类服务部(HHS)制定的公平、适当、有效、合法和安全(FAVES)AI原则来确保项目与实际用例相符,不包含偏见和已知风险。他们还将建立透明性和风险管理框架,以建立用户对AI系统的信任。

  • 除了关注现有实施,这些机构还承诺在健康中心的AI创新领域进行研发,同时保持警惕。他们计划在非生产环境、测试数据和内部应用中进行原型设计,并监控这些应用的结果,确保它们在各自的用例中提供公平、准确的响应。

原文链接:https://venturebeat.com/ai/safe-ai-for-healthcare-providers-pursue-once-in-a-generation-benefits-of-large-scale-models/

消息称谷歌Pixel 9系列手机将内置全新的专属AI助手“Pixie”

要点解析:

  • 谷歌正开发一款名为“Pixie”的AI助手,基于最新Gemini模型,专属于Pixel设备。Pixie旨在执行多模态任务,利用Pixel手机上的Gmail、地图等谷歌产品数据,提供更个性化的服务,如推荐最近的商店等。

  • 这款全新的AI助手有望与明年推出的Pixel 9/Pro系列手机一同亮相,与今年10月发布的“Assistant with Bard”不同。谷歌计划通过更广泛的Gemini模型为“Assistant with Bard”带来新功能,Pixie可能成为其下一个版本,并有望扩展到较低定位的智能手机和手表等设备。

  • 谷歌还在内部讨论内置AI功能的AR眼镜,据说可为用户提供多种建议,包括操作工具、解决数学问题或演奏乐器。这表明眼镜可能配备摄像头,通过语音或显示界面输出各种信息。

原文链接:https://www.ithome.com/0/739/626.htm

1. 马斯克的AI工具Grok是否借鉴ChatGPT?

要点解析:

  • 本周重点:

    1. 马斯克旗下xAI推出Grok AI聊天机器人,服务Premium+ X用户。

    2. 乌克兰入侵俄罗斯税务局,清空数据库,可能瘫痪一个月。

    3. 北爱尔兰警务处数据泄露,9483人个人数据曝光。

  • 安全事件:

    1. BazarCall利用Google表单进行网络钓鱼攻击。

    2. 法国逮捕涉嫌帮助Hive勒索软件清洗赎金的俄罗斯人。

    3. Apache Struts 2曝出远程代码执行漏洞。

  • 一周好文:

    1. 分析美太空安全攻击手段,对太空信息安全防御有启示。

    2. 国家网信办发布《网络安全事件报告管理办法》,引起关注。

    3. 企业安全实践,从零开始学做整体安全规划。

  • 省心工具:

    1. 使用HBSQLI自动测试基于Header的SQL盲注。

    2. DakshSCRA:源代码安全审计工具,提升审计效率。

    3. 使用S4UTomato通过Kerberos将服务账号提权为LocalSystem。

原文链接:https://www.freebuf.com/news/386718.html

OpenAI工程师揭秘ChatGPT开发仅用8天!探秘硅谷顶流如何诞生

要点解析:

  • 2015年,OpenAI在马斯克和佩奇的争论后诞生,ChatGPT的开发仅用了8天。这标志着人工智能的快速发展。

  • 随后,DeepMind的诞生受到马斯克投资,但在谷歌收购后,马斯克对其失去控制,引发了道德委员会的问题。

  • 硅谷大公司通过高额拍卖和投资争夺顶尖人才,加剧了人工智能的发展竞争。

原文链接:http://weixin.sogou.com/weixin?type=2&query=%E6%96%B0%E6%99%BA%E5%85%83+OpenAI%E5%B7%A5%E7%A8%8B%E5%B8%88%E6%9B%9D%E5%87%BA%E5%BC%80%E5%8F%91ChatGPT%E5%8F%AA%E7%94%A88%E5%A4%A9%EF%BC%81%E9%95%BF%E6%96%87%E6%8F%AD%E7%A7%98%E8%B0%B7%E6%AD%8CDeepMind%E7%AD%89%E7%A1%85%E8%B0%B7%E9%A1%B6%E6%B5%81%E5%A6%82%E4%BD%95%E8%AF%9E%E7%94%9F

由Grimes配音的AI毛绒玩具Grok在Elon Musk的Grok之前注册商标

要点解析:

  • Grimes推出了名为“Grok”的AI玩具系列,包括具有动态对话能力的屏幕无关的毛绒玩具。与Elon Musk支持的AI聊天机器人“Grok”无关,这是另一个项目。这些玩具旨在通过鼓励玩耍来激发儿童的创造力,而不是通过静态提示列表。

  • Curio的这些玩具(Grok,Gabbo和Grem)能够进行全面对话,帮助儿童培养沟通技能。玩具内置可充电的WiFi连接扬声器和麦克风,通过与父母监控交互的应用程序连接。Grimes强调了保留儿童思维的目标,试图减少对iPad等屏幕的依赖,通过口头交流促进大脑发展。

  • 这个创意的AI玩具系列是Grimes对未来AI集成玩具的回应,她认为孩子的泰迪熊应该能够与他们互动。玩具的推出时间与Elon Musk推出的ChatGPT竞争对手“Grok”相近,这也成为两个AI都使用相同名称的有趣重叠。

原文链接:https://techcrunch.com/?p=2642952

由格兰姆斯配音的AI毛绒玩具Grok比埃隆·马斯克的聊天机器人更早注册商标

要点解析:

  • 格兰姆斯推出的Curio无屏幕人工智能毛绒玩具系列,配音角色为“Grok”。

  • 该玩具旨在通过动态对话鼓励儿童发挥创造力,包括拟人化火箭飞船Grok、有手有脚的Gameboy模样的Gabbo,以及爱心兔子Grem。

  • 这些毛绒玩具不仅回答关于火箭制造的问题,还鼓励倾听和对话,连接Wi-Fi的扬声器和麦克风,通过应用程序与父母互动监控。

原文链接:https://m.cnbeta.com.tw/view/1404821.htm

中国科技巨头阿里巴巴推出新的AI视频工具

要点解析:

  • 阿里云发布了I2VGen-XL人工智能工具,采用级联扩散模型,实现高度视觉和语境一致的文本到视频转换。该模型经过两阶段处理,首先保持与输入文本和图像的一致性,然后通过细化阶段提高视频的细节和分辨率,达到1280x720像素。

  • 该模型的训练使用了约3500万文本到视频对和60亿文本到图像对的庞大数据集,确保在各种场景和主题下都具有多样性和准确性。在全球科技竞争加剧的背景下,阿里巴巴此举具有战略重要性,为中国在人工智能领域争夺领先地位提供了有力支持。

  • 与其他领先模型相比,如Pika Labs的模型和Stable Video Diffusion,I2VGen-XL通过其独特的方法和高语义准确性脱颖而出。阿里巴巴的这一创新代表着人工智能领域的重要里程碑,为中国用户提供了避开可能受限制的其他模型的替代选择。

原文链接:https://decrypt.co/210018/alibaba-ai-text-to-video-generative-cloud

特斯拉、比亚迪纷纷入局!掀起新的万亿市场浪潮

要点解析:

  • 特斯拉发布了全新一代人形机器人Tesla Optimus Gen 2,具有更人性化的外观和卓越的运动控制能力,成为新焦点。

  • 中国新能源车企积极涉足人形机器人领域,小鹏、小米、比亚迪等推出自研产品,展示了多样的设计理念和应用场景。

  • 人形机器人市场前景广阔,工信部指出其有望成为机器人领域的颠覆性产品,2025年预计实现批量生产。

原文链接:https://www.ofweek.com/ai/2023-12/ART-201700-8440-30620052.html

美国 AGU 发布 AI 应用手册,明确 6 大指导方针

要点解析:

  • 近年来,AI在空间和环境科学领域取得爆发性应用,如天气预报、气候模拟和资源管理。AGU报告显示,2012-2022年AI论文数量呈指数增长,突显其在科学研究中的重要性。

  • 虽然AI带来机遇,但不足训练或不当设计的模型可能导致不可靠结果,尤其是涉及风险和偏见。NASA支持下,AGU提出应用AI的伦理指导方针,强调透明度、解释性、风险管理、参与方法等,以建立信任和规避潜在风险。

  • 在科学组织和学术机构层面,需推动透明度、提供培训、制定伦理政策,确保AI在研究中的负面影响最小化。这对构建社会对AI的信任,实现科技的可持续发展至关重要。

原文链接:https://juejin.cn/post/7312723056300965900

PaLM 2数学性能暴涨6%!DeepMind新作揭示「合成数据」是通往AGI的关键

要点解析:

  • 近期研究表明,利用合成数据进行自我训练是提升大模型数学问题解决和代码生成能力的有效方法。合成数据不仅减少对人工生成数据的依赖,而且能够在复杂问题解决中取得显著优势。谷歌DeepMind和Mila实验室的研究人员通过PaLM-2模型展示了这一方法的成功应用。他们使用合成数据在MATH高级推理和APPS编码基准测试中获得了令人瞩目的性能,相较于仅在人类数据上微调的模型,表现更为突出。

  • 研究采用了简单而强大的语言模型自我训练方法,通过生成样本并使用评分机制评估这些样本,成功提升了不同领域的语言模型,包括机器翻译、语义解析、偏好对齐和基本推理。算法过程中使用的ReST算法,通过期望和最大化步骤之间的交替,有效生成训练数据,并在微调过程中提高模型性能。研究还强调了模型参数越大,性能提升越明显的趋势。

  • 在实验中,研究人员对训练数据集、模型选择、微调效果等问题进行了深入探讨。实验结果显示,在MATH和APPS数据集上,模型生成的解决方案通过微调显著优于使用人工编写的解决方案。尤其是对于较大模型,随着参数量的增加,性能提升更为明显。同时,研究也关注了迭代次数对性能的影响以及合成数据对推理能力的积极影响。

原文链接:http://weixin.sogou.com/weixin?type=2&query=%E6%96%B0%E6%99%BA%E5%85%83+PaLM%202%E6%95%B0%E5%AD%A6%E6%80%A7%E8%83%BD%E6%9A%B4%E6%B6%A86%25%EF%BC%81DeepMind%E6%96%B0%E4%BD%9C%E5%8A%9B%E8%AF%81%E3%80%8C%E5%90%88%E6%88%90%E6%95%B0%E6%8D%AE%E3%80%8D%E6%98%AF%E9%80%9A%E5%BE%80AGI%E5%85%B3%E9%94%AE

异军突起的小模型,有多大想象空间?

要点解析:

  • 当前,大模型在端侧应用受限,小模型如Mistral 8x7B和Phi-2崭露头角。它们在性能上超越同规模大模型,为资源受限环境提供了可能性,如手机市场和自动驾驶领域。

  • 小模型的逆袭不仅体现在性能上,还在于它们与Agent的关系。作为大模型的未来,Agent将推动小模型发展。小模型的推理成本低,模型复杂度小,有助于实时交互和在线学习,对Agent应用有着显著的促进作用。

  • 在模型层市场,小模型的出现为市场带来新的可能性。小模型在资源受限领域具有竞争优势,可能在大模型主导的领域形成一种“农村包围城市”的态势,推动模型层市场的新格局。

原文链接:https://www.ofweek.com/ai/2023-12/ART-201700-8470-30620049.html

MIT专家呼吁扩大AI治理和监管

要点解析:

  • 麻省理工学院的研究人员提出了一份名为「打造安全繁荣的人工智能领域」的政策文件,呼吁美国政府利用现有法规拓展对人工智能的治理。文件主张当前的法律框架应该覆盖人工智能,例如将医疗法规延伸到人工智能诊断。他们还希望人工智能受到规范政府活动的规则的约束,包括执法、设置保释和雇佣等方面。

  • 研究小组表示,与不使用人工智能的人类活动相同领域的人工智能应该由同一实体进行监管,并补充道:“这可能需要这些实体发展一些人工智能专业知识。”文件指出:“如果不使用人工智能的人类活动受到监管,那么同样在人工智能的适用领域内应该对其进行监管。人工智能系统的开发、销售和使用应尽可能由同一标准和程序规范。”

  • MIT小组认为,这将确保现有法律覆盖高风险应用。文件引用的已在探讨中的一个领域是自动驾驶车辆,这些车辆被要求符合与人类操作相同的标准。

原文链接:https://aibusiness.com/responsible-ai/mit-experts-call-for-expanded-ai-governance-and-regulation

美国可控核聚变成功点火4次,刷新Nature纪录!首席女科学家入选年度十大人物

要点解析:

  • 美国劳伦斯利弗莫尔国家实验室成功实现四次可控核聚变点火,创下了历史最高的3.88兆焦耳能量输出。通过不断创新改进,NIF项目在点火原理、光学元件保护和激光系统效率等方面取得显著进展。项目首席科学家Annie Kritcher入选Nature年度十大科学人物,展示了她在核聚变领域的卓越贡献。

  • 为实现更高能量输出,NIF团队通过强化光学元件、提升激光系统精确度等关键改进,降低了损伤率并提高了系统稳定性。高保真脉冲整形系统和光纤翻新进一步增强了实验的控制和测量能力。然而,要将核聚变能源应用于发电仍需克服技术挑战。

  • 作为可控核聚变的巅峰项目,NIF的成功点火意味着人类有望迈向海量无碳清洁能源时代。尽管还存在技术难题,但这一科学突破标志着清洁能源的曙光,为解决全球能源危机提供了希望。

原文链接:http://weixin.sogou.com/weixin?type=2&query=%E6%96%B0%E6%99%BA%E5%85%83+%E7%BE%8E%E5%9B%BD%E5%8F%AF%E6%8E%A7%E6%A0%B8%E8%81%9A%E5%8F%984%E6%AC%A1%E7%82%B9%E7%81%AB%E6%88%90%E5%8A%9F%EF%BC%8C%E5%88%B7%E6%96%B0%E7%BA%AA%E5%BD%95%E7%99%BBNature%EF%BC%81%E9%A6%96%E5%B8%AD%E5%A5%B3%E7%A7%91%E5%AD%A6%E5%AE%B6%E5%85%A5%E9%80%89%E5%B9%B4%E5%BA%A6%E5%8D%81%E5%A4%A7%E4%BA%BA%E7%89%A9

微软AI图像生成器免费

要点解析:

  • 微软推出了一款名为Image Creator的令人振奋的新型AI工具,允许任何人通过描述他们想要看到的内容来生成独特的图像。集成在Bing和Microsoft Edge中,这个免费的图像生成器将人工智能的力量交到艺术家、设计师、学生和任何希望将他们的视觉想法付诸实践的人手中。

  • Image Creator建立在由OpenAI开发的先进的DALL-E模型上,能够从文本描述中识别复杂的细节,生成独一无二的图像。作为创意的人工智能助手,它理解概念,如面部表情、背景、配色方案和艺术风格。无论您是在Bing上登录还是在Microsoft Edge的侧边栏中使用,使用Image Creator非常快捷。它支持100多种语言,并通过“boosts”进行优化,这是一种特殊的令牌,可使您的请求更快地处理。

  • Image Creator不仅停留在初始生成阶段,还能让您完善图像以匹配您的创意愿景。通过Microsoft Designer内置的编辑功能,可以裁剪、调整大小、更改颜色和背景,并添加纹理和边框等装饰。您还可以微调AI图像提示以改进结果的细节。一旦图像准备好,通过可共享的链接即可立即共享,也可以保存到组织良好的收藏中。在各种设备和平台上下载使用也非常简单。

原文链接:https://openaimaster.com/?p=28966

OpenAI Mini AI命令适用于泰坦:解码超级对准!

要点解析:

  • 为了解决超人工智能的挑战,OpenAI提出了一项开创性的研究方向——弱对强泛化。该方法旨在探讨较小的AI模型是否能有效监督和控制更大、更复杂的模型,正如他们最近在“弱对强泛化”研究论文中所阐述的。

  • 随着AI的迅速发展,未来十年内开发超级智能系统的前景引发了关切。OpenAI的超对齐团队认识到需要迎接将超人工智能与人类价值观对齐的挑战,正如他们在综合性研究论文中所讨论的那样。

  • 目前的对齐方法,如从人类反馈中强化学习(RLHF),严重依赖于人类监督。然而,随着超人工智能模型的出现,人类作为“弱监督者”的不足变得明显。AI系统生成大量新颖而复杂的代码的潜力对传统对齐方法构成了重大挑战,正如OpenAI的研究中所强调的。

原文链接:https://www.analyticsvidhya.com/blog/2023/12/openai-mini-ai-command-for-titans-decoding-superalignment/

Win11 学院:如何在 Windows 11 Build 26016 上查看和管理 AI 相关组件

要点解析:

  • 微软近期在Win11 Canary 26016预览版更新中,加速推进系统整合AI元素,提供更个性化、贴心的使用体验。然而,并非所有用户喜欢这些AI元素,因此微软隐藏了卸载选项,让用户可以自行选择。

  • IT之家网友可以通过ViveTool工具启用这一功能。具体操作包括下载ViveTool工具,解压缩到指定文件夹,通过命令提示符以管理员权限打开,并使用ViveTool命令启用AI组件。之后,用户可以重启电脑,打开设置应用,卸载不需要的AI组件,实现个性化定制。

  • 这一举措旨在让用户更好地参与系统定制,体现了微软对用户体验的关注,并展示了Win11系统未来AI元素的深度整合和发展方向。

原文链接:https://www.ithome.com/0/739/638.htm

日本政府计划成立AI安全问题组织,关注其在军事应用中的风险

要点解析:

  • 日本政府考虑成立组织讨论人工智能安全,关注民用AI技术用于军事风险。计划提高安全性,避免干扰私营部门,重点审查先进产品如OpenAI的ChatGPT。

  • 新组织将研究国家安全风险,包括通过AI获取制造生物、化学武器信息的可能性,同时检查安全漏洞和AI在社交媒体上的不受控制风险。目前,信息技术的发展使得军事领域广泛运用AI,转用民用AI于军事成为不可避免问题。

  • 考虑将新机构并入现有组织,候选机构包括国家信息和通信技术研究所。G7已达成AI国际规则框架,日本将用于国内指导,要求AI开发商接受第三方风险评估,类似英国和美国的举措。

原文链接:https://m.cnbeta.com.tw/view/1404819.htm

产品介绍

声音生成初创公司Resemble AI承诺恢复古老音频

要点解析:

  • Resemble AI推出开源工具“Resemble Enhance”,专注于提升历史音频的质量。该工具采用双模块方法,包括高级降噪器和AI语音增强器,可将失真模糊的历史音频转化为宛如昨日录制的效果。

  • Resemble AI的降噪器采用UNet,能有效过滤掉音频中的杂音,使语音成为焦点。随后,增强器模块介入,扩展音频带宽并校正失真,确保最终输出不仅无噪音,还具有当代录音的丰富质感。

  • 作为开源工具,Resemble Enhance免费提供,为传统昂贵的媒体恢复服务市场带来新选择。主要受益行业包括播客、娱乐和教育,同时为历史录音提供清晰洞察。该工具与其他使用生成AI的视频增强器结合,如GPEN或知名的GFPGan,可使用户以最小投资在个人计算机上实现专业效果。

原文链接:https://decrypt.co/210063/resemble-ai-voice-enhance-recordings

使用Google Gemini API构建LLM模型

要点解析:

  • 谷歌推出的Gemini系列是一组基础模型,聚焦于多模态支持,包括文本和图像。Gemini Ultra、Pro、Nano分别是三个不同尺寸的模型,Pro模型已对外开放API。本文将介绍Gemini的基本原理、使用Gemini Pro生成文本的步骤以及Gemini的安全性。

  • 使用Gemini Pro生成文本时,通过Gemini API Key配置并初始化模型。Gemini Pro是一个文本生成模型,支持输入上下文长度为30k tokens,输出上下文长度为2k tokens。Gemini还支持生成图像描述的gemini-pro-vision模型。Gemini的多候选生成和安全性评估提供了灵活性和可靠性。

  • 在Gemini中,对不安全查询进行测试时,模型能够识别潜在危险,并拒绝生成相关内容。Gemini还支持为单个查询生成多个候选项,通过调整超参数如温度、top_k等,可以定制生成内容的风格。

原文链接:https://www.analyticsvidhya.com/blog/2023/12/google-gemini-api/

由Grimes配音的AI毛绒玩具Grok在Elon Musk的Grok之前注册商标

要点解析:

  • Grimes推出了名为“Grok”的AI玩具系列,包括具有动态对话能力的屏幕无关的毛绒玩具。与Elon Musk支持的AI聊天机器人“Grok”无关,这是另一个项目。这些玩具旨在通过鼓励玩耍来激发儿童的创造力,而不是通过静态提示列表。

  • Curio的这些玩具(Grok,Gabbo和Grem)能够进行全面对话,帮助儿童培养沟通技能。玩具内置可充电的WiFi连接扬声器和麦克风,通过与父母监控交互的应用程序连接。Grimes强调了保留儿童思维的目标,试图减少对iPad等屏幕的依赖,通过口头交流促进大脑发展。

  • 这个创意的AI玩具系列是Grimes对未来AI集成玩具的回应,她认为孩子的泰迪熊应该能够与他们互动。玩具的推出时间与Elon Musk推出的ChatGPT竞争对手“Grok”相近,这也成为两个AI都使用相同名称的有趣重叠。

原文链接:https://techcrunch.com/?p=2642952

中国科技巨头阿里巴巴推出新的AI视频工具

要点解析:

  • 阿里云发布了I2VGen-XL人工智能工具,采用级联扩散模型,实现高度视觉和语境一致的文本到视频转换。该模型经过两阶段处理,首先保持与输入文本和图像的一致性,然后通过细化阶段提高视频的细节和分辨率,达到1280x720像素。

  • 该模型的训练使用了约3500万文本到视频对和60亿文本到图像对的庞大数据集,确保在各种场景和主题下都具有多样性和准确性。在全球科技竞争加剧的背景下,阿里巴巴此举具有战略重要性,为中国在人工智能领域争夺领先地位提供了有力支持。

  • 与其他领先模型相比,如Pika Labs的模型和Stable Video Diffusion,I2VGen-XL通过其独特的方法和高语义准确性脱颖而出。阿里巴巴的这一创新代表着人工智能领域的重要里程碑,为中国用户提供了避开可能受限制的其他模型的替代选择。

原文链接:https://decrypt.co/210018/alibaba-ai-text-to-video-generative-cloud

由格兰姆斯配音的AI毛绒玩具Grok比埃隆·马斯克的聊天机器人更早注册商标

要点解析:

  • 格兰姆斯推出的Curio无屏幕人工智能毛绒玩具系列,配音角色为“Grok”。

  • 该玩具旨在通过动态对话鼓励儿童发挥创造力,包括拟人化火箭飞船Grok、有手有脚的Gameboy模样的Gabbo,以及爱心兔子Grem。

  • 这些毛绒玩具不仅回答关于火箭制造的问题,还鼓励倾听和对话,连接Wi-Fi的扬声器和麦克风,通过应用程序与父母互动监控。

原文链接:https://m.cnbeta.com.tw/view/1404821.htm

格莱姆斯推出面向儿童的AI动力毛绒玩具

要点解析:

  • 加拿大歌手兼制作人Grimes与玩具初创公司Curio合作,推出名为“Grok”的交互式毛绒玩具,利用AI与儿童进行对话。

  • Grok是一个可爱的火箭形状毛绒玩具,配备麦克风、扬声器和WiFi连接。它利用OpenAI的GPT模型根据儿童兴趣进行自然对话,旨在成为既有趣又能娱乐甚至教育儿童的伙伴。

  • Grok玩具通过WiFi连接到父母手机上的移动应用程序。通过应用程序,父母可以实时查看所有对话的文字记录,记录保留90天以供监控。Grok不记录或存储任何语音数据,确保儿童隐私。通过OpenAI的自然语言AI处理儿童的对话,制定适当的口头回应,设计为儿童友好,避免任何不适当或有害的内容。

原文链接:https://openaimaster.com/?p=28936

Krutrim AI网站登录和使用

要点解析:

  • Krutrim AI,为印度语言和环境量身定制的令人振奋的新型AI模型,是印度首次进入AI领域的重要项目,对Krutrim AI平台和服务引起了巨大的好奇。本文概述了如何访问Krutrim网站和登录,网站的关键细节,以及背后的公司Krutrim SI Designs的背景。

  • Krutrim AI的网站(https://olakrutrim.com/)目前提供了简单的等待列表注册以获取访问权限。加入的步骤如下:

    1. 转到Krutrim首页,点击“加入等待列表

    2. 选择以个人“用户”或“开发者”身份加入

    3. 输入您的电子邮件地址并提交表单。

提交后,您将收到来自Krutrim的电子邮件更新,了解何时以及如何访问Krutrim AI,随着其不断推出。注册提供了早期尝试Krutrim AI的机会,作为终端用户或作为开发者集成它。

  • Krutrim网站提供了有关其AI模型和路线图的初步信息:

    • 语言: Krutrim AI旨在支持20种印度语言。其基础模型目前可以在10种语言中生成内容。即将推出的Pro模型针对22种语言。

    • 训练数据: Krutrim AI已经在2万亿个印度文本和语音数据上进行了训练,为其强大的语言理解能力提供了基础。

    • 形式: 基础Krutrim模型侧重于文本,但也可以处理语音。Pro模型将增加视频/图像功能。

    • 时间表: Krutrim AI于2022年底推出,计划在2023/2024年及以后逐步推出模型改进。

    • 访问: 2023年初将为开发者提供API。消费者访问将在明年晚些时候推出。

该网站表明Krutrim AI具有强大的能力,同时针对印度人口统计进行了优化——这是与全球AI模型相比的独特价值主张。

  • Krutrim AI由初创公司Krutrim SI Designs开发,该公司于2023年由以下人物创立:

    • Bhavish Aggarwal – 滑板巨头Ola的创始人

    • T.V. Krishnamurthy – Ola董事会资深成员

Krutrim SI Designs似乎专注于为印度需求开创AI创新。除了Krutrim AI本身,该公司还计划开发定制的硅芯片和云基础设施,以支持下一代AI应用。

该公司强调全栈AI研发,瞄准印度市场,这使得Krutrim SI Designs在众多竞争者中脱颖而出。该公司还表示,Krutrim AI在Indic语言理解测试中胜过了GPT-3等可比较的模型。

该项目的早期资金来自Matrix Partners——与Ola有着深厚联系的投资公司。在这种支持和领导层背景下,Krutrim SI Designs有望在未来几年推动Krutrim AI和其他创新取得更大突破。

  • Krutrim AI代表AI技术在全球语言最为复杂的市场之一迎来重大变革。随着Krutrim SI Design不断发展其模型和平台,我们可以期待Krutrim AI在印度的语言翻译、语音识别和对话式AI等领域不断推陈出新。对于Krutrim AI来说,现在仍然是非常早期的阶段,但通过今天访问其网站并追踪Krutrim SI Designs的更新,您可以及时了解这个有望成为印度本土AI领导者的项目。有了Krutrim照亮前路,印度的AI未来可能会非常光明。

原文链接:https://openaimaster.com/?p=28931

我将Google Bard与Gemini Pro对比ChatGPT - 这是获胜者

要点解析:

  • 谷歌推出Gemini Pro AI大语言模型,整合到Chatbot Bard中。与OpenAI的ChatGPT相比,Gemini Pro承诺表现至少不逊于后者。

  • 通过数轮测试,包括数学问题、写作歧义、一般知识、编程问题、矛盾信息、道德困境和个性测试,两者表现势均力敌,存在各自优势。

  • 在深度分析环节,涉及辩论中的微妙之处、发现虚假前提、再次尝试编码和事实查证等领域,Bard在多个方面取得胜利,但ChatGPT也有所斩获。

原文链接:https://www.tomsguide.com/features/i-pitted-google-bard-with-gemini-pro-vs-chatgpt-heres-the-winner

消息称谷歌Pixel 9系列手机将内置全新的专属AI助手“Pixie”

要点解析:

  • 谷歌正开发一款名为“Pixie”的AI助手,基于最新Gemini模型,专属于Pixel设备。Pixie旨在执行多模态任务,利用Pixel手机上的Gmail、地图等谷歌产品数据,提供更个性化的服务,如推荐最近的商店等。

  • 这款全新的AI助手有望与明年推出的Pixel 9/Pro系列手机一同亮相,与今年10月发布的“Assistant with Bard”不同。谷歌计划通过更广泛的Gemini模型为“Assistant with Bard”带来新功能,Pixie可能成为其下一个版本,并有望扩展到较低定位的智能手机和手表等设备。

  • 谷歌还在内部讨论内置AI功能的AR眼镜,据说可为用户提供多种建议,包括操作工具、解决数学问题或演奏乐器。这表明眼镜可能配备摄像头,通过语音或显示界面输出各种信息。

原文链接:https://www.ithome.com/0/739/626.htm

技术教程

我的AI学习之旅年度总结

要点解析:

  • 人工智能自1956年提出以来,经历60多年发展,近年来ChatGPT等生成式AI产品的爆发引领了全球AI潮流。本文以作者一年的学习实践为基础,着重分享了深度学习和计算机视觉方向的项目经验。

  • 在深度学习和计算机视觉领域的学习过程中,作者选择了卷积神经网络(CNN)作为主要工具,并通过研发影像识别方案展示了实践成果。从数据收集、标注到模型部署和优化,文章深入探讨了实际项目中的困难和解决方案,强调了实践对知识应用的关键性。

  • 项目中涉及的工具包括OpenVINO™和Intel® VTune™ Profiler,用于模型的部署和性能优化。作者分享了在使用这些工具过程中的经验,并强调了实践对于理论知识的巩固和深化的不可替代性。

原文链接:https://juejin.cn/post/7312635823786491942

介绍Palo Alto Networks的新AI功能:增强威胁检测和缓解 - Info Lopare

要点解析:

  • 帕洛阿尔托网络公司宣布将人工智能功能整合到其Cortex产品组合中,聚焦自动化和安全情报。这些AI功能主要关注威胁检测和防范,预计将彻底改变安全领域。

  • 公司数据显示,目前检测和解决安全事件平均需要五天半的时间。这一问题受到应对复杂性的影响,因为组织通常依赖不同团队使用的分散的安全产品,导致数据碎片化。引入Cortex XSIAM v2.0后,用户现在可以将任何机器学习框架整合到Cortex中,这是企业用户期待已久的功能。

  • 通过这一发展,帕洛阿尔托每日收集的PB级网络遥测数据现在可以被这些模型利用,实现了对欺诈检测和数据可视化的改进。目标是最小化攻击者在妥协和执行之间的时间。令人印象深刻的是,一家石油和天然气领域的客户成功将误报警报数量减少了75%。

原文链接:https://news.google.com/rss/articles/CBMigAJodHRwczovL3d3dy5pbmZvbG9wYXJlLmNvbS9lbi8lRDAlQjIlRDAlQjUlRDElODglRDElODIlRDAlQjAlRDElODclRDAlQkElRDAlQjAtJUQwJUI4JUQwJUJEJUQxJTgyJUQwJUI1JUQwJUJCJUQwJUI4JUQwJUIzJUQwJUI1JUQwJUJEJUQxJTg2JUQwJUI4JUQxJTk4JUQwJUIwL2ludHJvZHVjaW5nLW5ldy1haS1mZWF0dXJlcy1pbi1wYWxvLWFsdG8tbmV0d29ya3MtZW5oYW5jaW5nLXRocmVhdC1kZXRlY3Rpb24tYW5kLW1pdGlnYXRpb24vOTYwNDAv0gEA?oc=5

如何使用开源工具像专业人士一样克隆声音和唇同步视频

要点解析:

  • 语音合成与唇语同步技术在社交媒体上崭露头角,为创造性可能性打开了新世界。本文探讨了免费使用开源软件进行声音克隆的方法,涵盖了TTS模型和唇语同步工具。

  • 采用OpenAI的Whisper、FFmpeg、Coqui-ai的xTTS模型和Wav2lip构建开源技术栈。介绍了Whisper的ASR模型、Coqui-ai的TTS库和Wav2lip的唇语同步技术。

  • 在实现过程中,通过Colab运行FFmpeg和Whisper进行音频提取和转录,使用Coqui-ai的xTTS模型进行声音合成,最后通过Wav2lip实现唇语同步。文章详细介绍了每个步骤的代码和操作。

原文链接:https://www.analyticsvidhya.com/blog/2023/12/how-to-do-voice-cloning-and-lip-sync-a-video-like-a-pro-using-open-source-ai-tools/

其他

医疗保健的安全AI,提供者追求“一代大型模型的好处”

要点解析:

  • 28家医疗机构签署了拜登-哈里斯政府关于人工智能安全、可靠和值得信赖发展和使用的自愿承诺。他们致力于在医疗环境中利用大型模型的优势,同时减轻风险,保护患者的敏感健康信息。签署机构包括CVS Health、Stanford Health等。

  • 这些机构承诺通过遵循美国卫生与人类服务部(HHS)制定的公平、适当、有效、合法和安全(FAVES)AI原则来确保项目与实际用例相符,不包含偏见和已知风险。他们还将建立透明性和风险管理框架,以建立用户对AI系统的信任。

  • 除了关注现有实施,这些机构还承诺在健康中心的AI创新领域进行研发,同时保持警惕。他们计划在非生产环境、测试数据和内部应用中进行原型设计,并监控这些应用的结果,确保它们在各自的用例中提供公平、准确的响应。

原文链接:https://venturebeat.com/ai/safe-ai-for-healthcare-providers-pursue-once-in-a-generation-benefits-of-large-scale-models/

上市前分红4200万元,云工场科技充当“数据服务中间商”替供应商打工

要点解析:

  • 云工场科技计划在港股上市,但其财务状况引起关注。公司近几年收入迅速增长,但经营利润下滑,主要因为大规模分红和增加的行政、研发支出。此外,公司在带宽采购中对供应商A过于依赖,竞争力不足,客户数量和合同数量也在下降。

  • 公司由孙涛100%控股,通过大额分红让其个人获利丰厚。然而,这种在上市前大规模分红的做法引起了关注,可能转嫁了经营风险给投资者。同时,云工场科技面临“增收不增利”的困境,高昂的行政和研发支出使得利润无法跟随收入增长。

  • 云工场科技作为IDC服务提供商,扮演中介角色,但在产业链中游竞争力不足。其带宽采购成本高、毛利率下滑,且在竞争激烈的市场中,客户数量和合同数量均在下降。公司是否能在上市前解决这些问题,值得密切关注。

原文链接:https://www.ofweek.com/ai/2023-12/ART-201713-8460-30620053.html