本系列文章主要是用于持续跟踪最新的AI产业情况,让你减少知识焦虑。
原文共计158387 字,简读后为11989字,阅读时间为30分钟,为您提高阅读效率为1320%
- A year with ChatGPT and product innovation: Navigating the AI landscape 🌐
- Notedly AI Review: Details, Pricing, How To Use & Features 📝💰
- Scientists use A.I.-generated images to map visual functions in the brain 🧠🖼️
- 2D material reshapes 3D electronics for AI hardware ⚙️🔄
- Today in AI: Rigi brings AI to influencers, ChatGPT's first yr and ... - Moneycontrol 💼💬💰
- The Morning After: NASA and IBM team up for powerful AI weather model 🚀🌧️🤖
- AI & Big Data Expo: AI’s impact on decision-making in marketing 📊💡
- ChatGPT Turns One: Viral Mobile App and Millions in Revenue! 🎉📱💸
- 大模型晚报|亚马逊推出 Titan 系列 AI 模型,支持文本、图片生成 🤖💡📦
- OpenAI最强竞品训练AI拆解LLM黑箱,意外窥见大模型「灵魂」 🔍🤯💻
要点解析:
-
微软推出的人工智能助手Copilot最初被认为是Windows 11专用,但随后引入Windows 10。微软通过解释用户可能希望拥有Copilot的原因,试验按钮位置来吸引更多用户。尽管功能尚处于预览阶段,但用户在非Insider版本上不会遇到问题。
-
Copilot在多显示器模式下导致桌面图标移动,影响Windows 11,并在最新的Windows 10 22H2更新中仍未解决。微软采取了兼容性搁置措施,阻止遇到问题的设备更新到Windows 11 23H2版本,建议用户不要手动更新。
-
Windows健康仪表板指出使用多显示器的Windows设备在尝试使用Copilot时可能遇到桌面图标移动或对齐问题。微软提供了兼容性搁置的保障,敦促用户等待问题解决前不要手动更新到Windows 11 23H2版本。
原文链接:https://m.cnbeta.com.tw/view/1401233.htm
要点解析:
-
多功能计算机芯片的发展已经演变为集成传感器、处理器、内存和其他专用组件,但随着芯片的扩展,信息在功能组件之间传递所需的时间也在增加。
-
华盛顿大学麦克尔维工程学院的助理教授Sang-Hoon Bae表示:“可以把它想象成建造房子,你在水平和垂直方向上扩展,以获得更多功能、进行更多专业活动的空间,但接下来你必须花费更多时间移动或在房间之间进行通信。”
-
为了解决这一挑战,Bae和国际合作伙伴团队展示了层状2D材料的单片3D集成,用于人工智能计算的新型处理硬件。他们预见到他们的新方法不仅将在材料级别上提供将许多功能完全集成到单个小型电子芯片的解决方案,还将为先进的人工智能计算铺平道路。
-
这个团队的单片3D集成芯片相比现有的横向集成计算机芯片具有优势。该设备包含六个原子薄的2D层,每个层都有自己的功能,并实现了显著减少的处理时间、功耗、延迟和占地面积。通过紧密堆叠处理层,确保了层间的密集连接,硬件在人工智能计算任务中提供了前所未有的效率和性能。
原文链接:https://www.sciencedaily.com/releases/2023/11/231130145423.htm
要点解析:
-
小米创始人雷军回应关于小米核心技术的误解,强调公司研发投入和在5G标准专利中的成绩。ChatGPT被曝出严重漏洞,重复某词可泄露用户敏感信息。OpenAI创始人Sam Altman宣布回归,微软获得无投票权观察员席位。苹果每颗ARM芯片仅支付2元专利费。腾讯游戏回应与暴雪谈判国服回归,称只是直播测试。
-
NVIDIA CEO黄仁勋表示AI将在5年内赶超人类,强调通用人工智能的发展。OpenAI的前首席科学家奥特曼指责治理结构问题。拼多多创始人黄峥认为实惠是普世需求,分享公司在物质消费上的角色。
-
RTE开发者日报整理了有话题的新闻,包括小米核心技术、ChatGPT漏洞、OpenAI新任CEO等。观点部分涵盖英伟达CEO对AI发展的看法、奥特曼对OpenAI治理结构的批评以及黄峥对实惠的理解。
原文链接:https://juejin.cn/post/7307451255433429002
要点解析:
-
人工智能在全球范围内持续席卷各个领域,引发喜忧参半的反响。虽然许多人喜欢AI接管繁重任务,但仍有人对这种接管感到担忧。AI在全球得分如何?
-
AI将在下周推出一首新的披头士乐队歌曲,名为《现在和未来》,其中包含已故成员约翰·列侬的声音。尽管AI为音乐创作带来了新契机,但人们对这种技术在影视项目中的使用提出了质疑,好莱坞编剧通过新合同确保了他们的权益,证明我们尚不能取代人类创作者。
-
九月份,好莱坞编剧在历时五个月的罢工中取得胜利,揭示了无法用AI取代人类创作者的现实。然而,随着AI的不断发展,未来会是怎样呢?
-
据MIT Technology Review报道,电影《流星战队:侠盗一号》的导演 Gareth Edwards 决定使用AI为他的新电影《创世者》创作配乐。尽管结果相当不错,但他意识到与人类作曲家汉斯·季默相比还有差距。这引发了关于AI在创意领域的作用的思考。
原文链接:https://hackernoon.com/humans-vs-ai-a-scoreboard-update-on-the-ongoing-battle?source=rss
要点解析:
-
AI Agent是能够感知环境、理解目标并做出决策的系统。以游戏中的角色为例,它们在不断的交互中学习进化,具备自主进化的潜力。
-
未来AI Agent发展的关键在于回答诸多问题,如功能、互动、学习、特征等,这些问题涉及Agent在多Agent系统中的角色和影响,引发对未来AI在社会、经济中的地位和作用的思考。
-
Agent不仅是技术发展,更是商业化的根基。在多Agent系统中,经济价值的创造和分配将重新定义人类社会,同时提出了权威、意图、意义等复杂问题,需要谨慎对待。
原文链接:https://www.ofweek.com/ai/2023-12/ART-201700-8470-30618388.html
要点解析:
-
深度机器学习在AI领域取得显著成功,但解释性和效率仍是挑战。首都师范大学和中国科学院大学的研究提出了基于张量网络(TN)的创新方法,结合量子力学理论,为协调机器学习可解释性和效率提供前景解决方案。
-
TN ML通过量子理论提供可解释性,基于TN的强大表示和量子多体物理的计算技术实现高效率。TN被视为"白盒"数学工具,类似于经典概率模型,为解决深度学习可解释性困境提供新途径。
-
TN在量子力学领域取得成功,能有效表示大规模量子系统状态。基于TN的方法在模拟量子系统中表现出显著效率,为量子启发机器学习提供了理论基础。TN还被用于增强经典机器学习,提出新型模型压缩方法,拓展应用领域。
原文链接:https://www.jiqizhixin.com/articles/2023-12-01-8
要点解析:
-
英国国防部与作战训练公司4GD合作,为SimStriker机器人添加ChatGPT语言模型,提升近距离作战模拟的真实感。现代战争中,士兵需要在复杂环境中做出迅速决策,这种训练对于维护战斗小组安全至关重要。
-
SimStriker目标机器人由电动系统驱动,配有命中传感器、能感知移动、光线和声音,并可作出口头反应。通过整合ChatGPT系统,目标机器人将进行“合成对话”,增加训练多样性,使训练更具身临其境感。这项技术将为城市战争场景提供更逼真的模拟。
-
4GD的SimStriker自2020年开始研发,已在英国陆军和警方使用。合作中的ChatGPT系统将通过社交媒体馈送等方式与士兵及其装备进行虚拟对话,提高训练效果,使训练主管能够定制更多场景。
原文链接:https://m.cnbeta.com.tw/view/1401211.htm
要点解析:
-
近期,百度创始人兼首席执行官李彦宏强调拥抱AI时代需由CEO领导,指出当前大模型充斥行业,但对企业业绩有真正影响的AI原生应用仍不足。
-
12月16日,李彦宏将与极客公园创始人张鹏深入对谈,分享关于大模型、AI原生应用的思考与判断,探讨产品和开发者在AGI时代的角色与影响。
-
在李彦宏的演讲中,强调CEO应关心新技术对关键业务指标的影响,大模型和生成式AI为企业带来的机遇可媲美工业革命,但中国大模型多而原生应用少,AI原生时代需百万级应用而非百个大模型。
原文链接:http://www.geekpark.net/news/328485
要点解析:
-
智加科技于2023年12月1日获得苏州市智能网联汽车无人化测试牌照,成为江苏省及全国首家获得无人重卡在高速公路全路段全场景进行测试的企业。该牌照由苏州市智能网联汽车联席小组及产业专家评审决议颁发,企业可在指定路段进行无人重卡的自动驾驶测试。这一举措是苏州市推动智能车联网产业发展的重要支持,为未来无人重卡商业化运营提供有力支持。
-
在此之前,智加科技的无人重卡已在苏州市首条满足车路协同式自动驾驶等级的全息感知智慧高速公路苏台高速S17上完成全球首次示范运营。该重卡配备智加科技自动驾驶系统,成功应对逆行车辆、慢行车辆、快行车辆等异常驾驶行为,同时识别交通障碍物、路面施工等道路事件,并实现匝道汇入、车道保持、自主变道、自主超车、路面施工车辆主动避让等多种驾驶行为。
-
容力,智加科技总经理表示,获得重卡无人驾驶测试牌照将有助于在干线物流场景下进行技术探索和验证。未来,依托苏州智能网联汽车产业创新集群,智加科技将加强技术底层能力,拓展技术场景覆盖范围,为干线物流提供更高级的自动驾驶功能,促进交通运输的安全、时效性和经济性。
原文链接:https://www.jiqizhixin.com/articles/2023-12-01-11
要点解析:
-
NASA和IBM联手构建人工智能气象模型,结合地球科学和人工智能领域的知识与技能。他们表示,这一基础模型应在现有技术基础上提供“显著优势”。当前的人工智能模型如GraphCast和FourCastNet已比传统气象模型更快生成天气预报。然而,这些模型是人工智能模拟器而非基础模型。人工智能模拟器可以基于训练数据进行天气预测,但其应用范围有限。
-
该模型有望更好地预测气象现象,通过低分辨率数据推断高分辨率信息,识别从飞机颠簸到野火等各种条件。这一合作旨在推动气象和气候领域的创新,为更精准的气象预测和应对气候变化提供支持。
-
除了加速天气预测外,该模型还为科学家提供了独特的机会,帮助他们深入了解气象现象背后的复杂机制,促进地球科学和人工智能的跨界合作。这一前瞻性的合作有望推动气象学和人工智能在解决全球气候挑战方面取得更大突破。
原文链接:https://www.landiannews.com/?p=101230
要点解析:
-
淘天集团筹建大模型团队,专注于搜广推和逛逛场景,已启动招聘。CEO戴珊、CTO若海等领导牵头组建,展望未来AI在电商领域的创新应用。
-
字节跳动成立AI部门Flow,推出豆包和Cici两款AI产品。Flow在字节圈内发布招聘,致力于孵化多个AI相关创新产品,加速字节跳动在全球范围内的AI布局。
-
GPTseek是一款实用的GPTs投票和搜索平台,通过社区投票排名,分成多个领域,解决海量GPTs中找到优质信息的难题,尤其在中文领域有着出色的实用性。
原文链接:https://juejin.cn/post/7307181589271691300
要点解析:
-
经过五天的董事会政变后,Sam Altman正式回归OpenAI首席执行官职务。微软占据董事会席位,董事会动荡与技术发展无直接关联。在采访中,Altman回避解雇原因,但强调董事会进行独立审查。他强调团队的信念和专注力,公司在他离职期间保持稳定,并取得了技术突破。Altman认为治理结构问题需时间解决,不影响安全工作。对于未来,他谨慎表态,强调公司能在没有他的情况下正常运作。
-
董事会成员Brad Smith称OpenAI动荡不是因为安全担忧,而是董事会内部意见分歧。Altman回归经过考虑,强调团队凝聚力。对于解雇原因,他坚持等待独立审查结果。Altman对公司未来充满信心,强调团队的稳定性和技术进展。
-
采访中Altman对解雇原因回避回答,强调等待独立审查结果。公司保持稳定,团队团结。他回顾自己回归过程,起初犹豫但受到团队和员工支持。Altman强调公司治理结构问题需时间解决,对技术进展保持乐观。
原文链接:https://www.jiqizhixin.com/articles/2023-12-01-7
要点解析:
-
亚马逊正式发布 Titan 系列 AI 模型,包括文本生成模型和图像生成模型。Titan Image Generator不仅能生成精准、逼真、多元的图片,还具备编辑和隐藏水印的功能。Amazon Titan Text Express和Titan Text Lite分别是高性价比的文本生成模型,支持最多8000和4000 token输入。
-
黄仁勋预测AI将在未来五年内赶超人类,但指出机器学习尚不能执行多步推理任务。三位前苹果员工创立Software Applications Incorporated,计划推出具有人情味的AI聊天机器人,致力于推动操作系统发展。
-
微软计划投资25亿英镑扩建英国下一代人工智能数据中心,预计到2026年为英国带来2万多个先进的GPU。此举旨在满足爆炸性的人工智能专用计算需求,并培训一百万人掌握人工智能所需技能。
原文链接:https://www.pingwest.com/w/290680
要点解析:
-
在过去的一年里,自ChatGPT于2022年11月30日发布以来,我们有幸主持了一场深入探讨人工智能(AI)和产品管理主题的AMA。Mind the Product的董事总经理Emily Tate与Google的机器学习集团产品经理Chris Butler一同参与,为当前AI景观、其在产品管理中的应用以及产品经理不断演变的角色提供了有价值的见解。观看完整视频或继续阅读了解他们的要点。
-
在AI与产品管理交汇的一年后,Chris首先分享了在AI和产品管理交汇处航行的见解。他强调,无论是AI与否,产品经理都应专注于解决客户问题和做出有效决策,而不受技术进步的影响。
-
Chris进一步指出市场上新兴技术的不可避免性,并建议采取主动的适应性方法。尝试新的LLM模型可以帮助我们探索它们在我们的工作中的潜在优势。根据Chris的说法,“我们目前处于AI的炒作阶段;随后的阶段涉及将AI整合到真正解决人类问题的产品中。”
-
Chris认为“AI产品经理”这个词是多余的。“现在由于机器学习的崛起,这个角色听起来更有趣,但十年后,这个角色将不复存在;产品经理将只是在从事机器学习技术。”公司开始意识到重要的是你拥有的东西,而不是你使用的具体技术。Chris澄清说:“这不是角色档案的问题;我们本质上是在AI产品中继续产品管理的核心责任。”
要点解析:
-
苹果计划于12月正式量产Vision Pro,首批40万台,2024销量目标100万,第三年达1000万。中国供应链占比60%,显示其在前沿技术中的不可替代地位。
-
iPhone及服务业务增长乏力,Vision Pro成为苹果新增长点。中国市场影响下,Vision Pro成功打开市场需博取中国消费者关注,中国供应链成为关键一环。
-
苹果重新倚重中国内地供应链,Vision Pro代表下一代大众计算平台,预计全球混合现实市场规模2028年将达24.83亿美元,中国供应链将在全球科技产业中崛起。
原文链接:https://www.ofweek.com/ai/2023-12/ART-201700-8500-30618401.html
要点解析:
-
微软最近推送的 Windows Copilot 新版本,在 Windows 10 22H2 版、Windows 11 22H2 版以及 Windows 11 23H2 版的多显示器上存在乱飞的问题。用户反馈点击 Windows Copilot 时,界面可能混乱,图标自行挪动。这一问题已被记录在 Windows 10 和 Windows 11 健康仪表盘中。
-
针对这一问题,微软采取了措施,暂停向使用多显示器的用户推送 Windows 11 23H2 版的更新,直到问题得到解决。此外,在 Windows Update for Business 中添加了问题 ID 47615939,帮助企业 IT 管理员了解并应对该问题。
-
对于用户升级操作系统的方式,微软建议尽量使用 Windows Update 或易升执行升级,以便系统能够检测并阻止可能出现的兼容性错误。用户若使用媒体创建工具或 ISO 镜像升级,将无法检测到此类兼容性问题。
原文链接:https://www.landiannews.com/?p=101230
要点解析:
-
特斯拉Cybertruck终于交付,马斯克亲自为车主开门,标志着这款未来车型正式上路。自2019年首次公布以来,Cybertruck已经累积100多万订单,其独特的防弹设计和强大的动力性能成为其受欢迎的原因之一。车身采用防弹不锈钢材质,能抵御各种枪支的攻击,甚至具备生化武器防御模式。
-
Cybertruck被定义为一个“动力中心”,不仅提供超凡的牵引动力,还具备120V和240V输出最高11500瓦的电力,可为家庭供电。在力量挑战中,Cybertruck轻松胜过柴油动力的大型皮卡,展现了其卓越的性能。此外,车辆配置丰富,包括超大触摸屏、先进的音响系统等,为驾乘人员提供舒适的内部环境。
-
尽管Cybertruck在国内存在一些限行政策,但理论上是可以上路的。然而,需要面对政策限制,如在广州、重庆等地有限行的规定。对于已下单的消费者来说,需要耐心等待交付。特斯拉在中国市场的百万订单也将是一项庞大的挑战,需要一定时间来满足市场需求。
要点解析:
-
Doctrina AI构建了一款基于人工智能的教育套件,旨在提升学生成绩,同时简化教学过程。由OpenAI的革命性GPT-3语言模型驱动,Doctrina利用自然语言处理理解教材和学生需求。其一系列基于AI的产品包括记笔记、练习测试、写作辅助等,都致力于实现强化学习。
-
Doctrina的基础是OpenAI创建的GPT-3(生成预训练变压器),它建立在大规模数据集之上,利用深度学习生成极为类似人类的文本。Doctrina通过精调GPT-3,使其能够有效处理教育任务,通过训练在各个学科和年级的广泛学习材料,Doctrina Adapt指导模型进行总结、测验和专业写作。这种AI转变赋予了Doctrina产品在规模上为学生和教师提供支持的聪明能力。
-
Doctrina通过其产品套件在各个方面应用GPT-3,以提供个性化的教育支持。其中包括专注于总结的Class Notes工具,帮助学生识别课堂笔记中关键主题的AI工具。另外,还有Essay Generator、Exam Generator、Quiz Generator和AI Assistant等工具,分别用于论文写作、定制练习测试、创建测验和提供学习支持。这一强大的数据驱动方法允许提供丰富、个性化的体验。
原文链接:https://openaimaster.com/?p=27646
要点解析:
-
如今,许多应用开始集成AI以实现沉浸式体验,自动化视频编辑的各个方面,使整个过程更易访问和高效。
-
本文将分享一份指南,介绍iPhone上最佳的AI视频编辑应用,以自动执行重复的编辑任务,提高视频质量并创造创意效果。
-
视频编辑是需要练习的技能,对于创作内容、营销材料或简单的任务如捕捉回忆非常重要。AI提高了效率,使视频编辑更快速、更容易,为其他创意任务节省时间。
原文链接:https://openaimaster.com/?p=27654
要点解析:
-
Zzzcode AI生成器是由ZZZ Projects设计的人工智能平台,旨在协助软件开发人员处理编码和编程的各个方面。利用先进的AI技术,Zzzcode提供可增强生产力、加速开发并简化编码过程的工具。
-
Zzzcode的核心功能之一是其智能代码生成能力。用户只需描述所需的编程任务或逻辑,Zzzcode的AI将根据要求自动生成清晰、功能性的代码。支持的编程语言包括JavaScript、Python、Java、C#、PHP等。
-
除了代码生成外,Zzzcode还提供高级调试和错误检测功能,利用机器学习算法扫描用户提供的代码,识别潜在的错误、性能问题、安全漏洞等,并提供清晰的解释和建议以改善代码质量。此外,Zzzcode能够对代码进行详细解释,帮助用户理解复杂的代码库。
原文链接:https://openaimaster.com/?p=27642
要点解析:
-
昆仑万维发布了[天工SkyAgents]平台,基于[天工大模型],具备自主学习和独立思考能力。用户可通过自然语言构建私人助理,模块化实现问题预设、指定回复、知识库创建、意图识别、文本提取等任务。平台支持企业IT、智能客服、企业培训等多个应用,实现一键服务部署。
-
[天工SkyAgents]解决用户缺乏代码经验的问题,通过模块化大语言模型构件实现完全无代码化操作。平台提供直观的图形界面,帮助用户快速部署AI Agents,满足日常需求,驱动业务增长。
-
平台具备数据检索增强(RAG)能力,支持导入更多格式和更大规模的数据和知识。[天工SkyAgents]不仅是私人AI助理,还可成为私人法律专家、私人人力顾问、私人IT大神等。技术上强化了自然语言处理能力,加入目标理解与工作流自动化技术,更精准地解析复杂业务目标。
原文链接:http://www.qbitai.com/?p=102344
要点解析:
-
亚马逊正式发布 Titan 系列 AI 模型,包括文本生成模型和图像生成模型。Titan Image Generator不仅能生成精准、逼真、多元的图片,还具备编辑和隐藏水印的功能。Amazon Titan Text Express和Titan Text Lite分别是高性价比的文本生成模型,支持最多8000和4000 token输入。
-
黄仁勋预测AI将在未来五年内赶超人类,但指出机器学习尚不能执行多步推理任务。三位前苹果员工创立Software Applications Incorporated,计划推出具有人情味的AI聊天机器人,致力于推动操作系统发展。
-
微软计划投资25亿英镑扩建英国下一代人工智能数据中心,预计到2026年为英国带来2万多个先进的GPU。此举旨在满足爆炸性的人工智能专用计算需求,并培训一百万人掌握人工智能所需技能。
原文链接:https://www.pingwest.com/w/290680
要点解析:
-
Quizbot AI是一款利用自然语言处理(NLP)和机器学习分析文本的人工智能平台,能够在几秒钟内自动生成各种类型的测验问题。它支持从PDF、Word文档、文本文件、视频等多种格式提取内容,并生成多选、判断、填空、匹配等题型,评估学习者的理解。
-
Quizbot AI的关键能力包括从不同输入源生成测验、个性化测验算法、支持多种语言、直观易用的界面以及与LMS和应用程序的集成支持。它广泛应用于学术测验、企业培训、市场调研、自学和考试准备等领域。
-
使用Quizbot AI的简单步骤包括注册账户、提供待分析内容、生成和编辑测验、分配和分析学习者表现,最后通过不断调整源内容优化问题,形成丰富的测验题库。Quizbot AI通过NLP和ML算法自动化测验创建,为教师节省时间,为全球学习者提供 engaging、adaptive 的学习体验。
原文链接:https://openaimaster.com/?p=27651
要点解析:
-
OpenAI推出DALL-E 3,通过自然语言提示生成图像迎来重大改进。该平台与ChatGPT紧密集成,提供更交互式、对话式的AI艺术生成体验,强化了安全协议。升级后,使用简单语言编写提示,避免技术术语,可更好地理解,生成积极创意内容。DALL-E 3标志着AI艺术生成演进的重要升级,利用神经网络从逼真的风景到抽象构图生成艺术作品。
-
DALL-E 3的显著改进包括更有效地理解复杂提示、使用描述和参考生成更准确、有意义的艺术作品。OpenAI旨在将DALL-E与ChatGPT免费整合,并提供付费层次。DALL-E 3将在艺术、设计和媒体生成领域产生重大影响,与竞争对手稳定扩散展开激烈竞争。
-
DALL-E目前可在ChatGPT Plus提前访问,提供更强大的平台。它可用于ChatGPT Plus和企业版,并通过API和后续实验室中使用。OpenAI计划将其无需ChatGPT Plus订阅免费提供给普通公众。DALL-E 3具有更好的风格和提示语调,提供比DALL-E 2更详细、逼真、高质量的图像,适用于更多风格,包括抽象、超现实和照片般逼真。
-
如何在ChatGPT Plus上使用DALL-E?用户可通过OpenAI账户在ChatGPT上使用DALL-E。在ChatGPT页面右上角选择GPT-4,从下拉菜单中选择DALL-E 3 Beta。在文本区域编写提示,点击“生成”按钮。用户还可通过点击“编辑”按钮进行精炼,修改提示或生成的图像。生成图像后,点击图像旁的“下载”按钮下载。
原文链接:https://openaimaster.com/?p=27671
要点解析:
-
阿里云开源的通义千问Qwen-72B模型,参数达到720亿,性能超越Llama 2-70B,是国产大模型市场的重要突破。其在语言、数学推理、代码理解等方面表现卓越,成为开源模型中的佼佼者。同时,Qwen-72B展现了在超长文本序列处理方面的出色能力,远胜GPT-4和Claude 2.1。
-
Qwen-72B不仅在生成能力上强大,还支持系统指令,能够定制AI助手角色扮演,满足多样化的应用需求。其在多模态领域也有所突破,阿里云同时开源了音频理解大模型Qwen-Audio,具备对各类语音信号的感知和理解。另外,通义千问的视觉理解大模型Qwen-VL也经过重大更新,支持处理各种分辨率和规格的图像,表现出色。
-
除了大规模模型,阿里云还开源了小尺寸模型Qwen-1.8B,具有推理所需最小显存不到1.5GB的优势,适用于端侧场景。这次开源不仅覆盖了语言模型,还包括音频和视觉理解,构建了全尺寸、全模态的开源模型生态。阿里云的贡献为大模型技术的普及提供了新的可能。
要点解析:
-
人工智能已融入日常生活,提高工作效率,节省时间和金钱。本文介绍谷歌推出的“Help me Write”功能,是一种由GenAI驱动的文本生成工具,可用于Gmail和Google Docs。用户可免费使用,目前仅处于测试阶段。此外,谷歌还在Gmail和Docs中发布了其他AI功能,如Duet AI和语法拼写检查。
-
“Help me Write”是一款全新的AI功能,可帮助完成写新文本、重写现有文本和挑选词语短语,类似于Smart Compose。在Gmail中,还有智能摘要和推荐回复等功能,而在Google Docs中,有改善写作的建议,包括改写句子和添加过渡。用户还可以通过第三方插件扩展更多AI功能,如文本摘要、语言翻译和检测抄袭等。
-
“Help me Write”的使用方法简单,适用于Gmail和Google Docs。用户可以通过Google Workspace Labs申请使用,并在编辑器中使用“Help me Write”按钮生成文本。生成的草稿还可以通过点击“Refine”进行进一步调整。该功能对于写文章、销售演讲、创意写作、专业文件等具有多种用途,用户可以使用自然语言提示以获得最佳效果。
原文链接:https://openaimaster.com/?p=27667
要点解析:
-
ChatGPT一周年,重新定义人工智能在日常生活中的边界。从诞生到家喻户晓,ChatGPT不仅成长,而且演变,适应并在对话型人工智能领域设立了新标准。仅在一年内,ChatGPT的移动应用取得了显著成功,超过1.1亿次安装,创造了近3000万美元的收入。本文将深入探讨ChatGPT移动应用的历程,探讨其成长、影响和未来前景。
-
谦逊的开始
ChatGPT的旅程始于一个有前途的项目,旨在使人工智能易于访问和互动。其初次发布引起了好奇和谨慎的乐观。人工智能社区迅速认识到其潜力,不久之后,ChatGPT开始成为头条新闻。其理解上下文和生成人类般回应的能力只是冰山一角。
- 演变和更新
在这一年中,ChatGPT经历了许多更新,每次都增强了其性能和用户体验。开发人员倾听反馈,消除错误,并引入新功能,使ChatGPT更加智能、快速和可靠。它从互动中学到东西,变得更加细致入微的回应和处理复杂查询的能力更强。
- 赢利的成功:3千万美元的收入
与其庞大的用户基础一起,ChatGPT的移动应用还产生了可观的收入。在第一年内,几乎创造了3千万美元的收入,证明是一项利润丰厚的投资。这种财务成功不仅突显了应用的受欢迎程度,还展示了其进一步增长和扩张的潜力。
- 转变信息检索
ChatGPT的移动应用的出现改变了人们寻求信息的方式。用户现在可以与聊天机器人进行自然语言对话,使互动更加流畅和用户友好。无论是回答查询,提供建议,还是提供个性化帮助,ChatGPT都已成为各个领域用户的可靠伙伴。
要点解析:
-
近年来,大型语言模型(LLMs)如GPT-4和LLaMA在各领域崭露头角,但在文本生成方面,特别是处理长提示工作负载时,存在性能瓶颈。微软DeepSpeed的研究人员通过引入DeepSpeed-FastGen框架,采用分块KV缓存和动态SplitFuse技术,实现了LLM推理性能的显著提升。这项技术不仅提高了吞吐量,还改善了响应速度,为大规模语言模型的高效服务提供了新的解决方案。
-
DeepSpeed-FastGen采用动态SplitFuse技术,将生成和提示处理相结合,有效提高了LLM推理的硬件利用率。通过将长提示分解成更小的块,在多个前向传递中进行调度,DeepSpeed-FastGen避免了单一前向传递导致的服务级别协议破坏,提高了系统的整体吞吐量。
-
除了分块KV缓存和动态SplitFuse技术,DeepSpeed-FastGen还结合了DeepSpeed-MII和DeepSpeed-Inference,形成一个易于使用的服务系统。这个框架的优越性在多个硬件配置下都得到了验证,展现了在文本生成领域的强大性能和潜力。
要点解析:
-
康奈尔医学院、康奈尔科技和康奈尔伊萨卡校区的研究人员展示了使用人工智能选择的自然图像和生成的合成图像作为神经科学工具,用于探测大脑的视觉处理区域。他们通过数据驱动的方法,旨在理解视觉是如何组织的,同时可能消除在观察研究人员选择的图像响应时可能出现的偏见。
-
在这项研究中,研究人员让志愿者观看根据人工智能模型选择或生成的图像,这些图像被预测为最大程度地激活多个视觉处理区域。利用功能性磁共振成像(fMRI)记录志愿者的大脑活动,研究人员发现这些图像确实比对照图像更有效地激活目标区域。
-
研究人员还展示他们可以使用这些图像响应数据调整个体志愿者的视觉模型,使生成的图像对特定个体的最大激活效果优于基于通用模型生成的图像。
-
该研究是康奈尔医学院费尔家族脑和心灵研究所数学和神经科学教授Dr. Amy Kuceyeski的研究小组与康奈尔工程学院和康奈尔科技电气和计算机工程教授Dr. Mert Sabuncu实验室合作的成果。研究的第一作者是Zijin Gu博士,他曾是该研究进行时由Sabuncu博士和Kuceyeski博士共同指导的博士生。
原文链接:https://www.sciencedaily.com/releases/2023/11/231130145431.htm
要点解析:
-
Doctrina AI构建了一款基于人工智能的教育套件,旨在提升学生成绩,同时简化教学过程。由OpenAI的革命性GPT-3语言模型驱动,Doctrina利用自然语言处理理解教材和学生需求。其一系列基于AI的产品包括记笔记、练习测试、写作辅助等,都致力于实现强化学习。
-
Doctrina的基础是OpenAI创建的GPT-3(生成预训练变压器),它建立在大规模数据集之上,利用深度学习生成极为类似人类的文本。Doctrina通过精调GPT-3,使其能够有效处理教育任务,通过训练在各个学科和年级的广泛学习材料,Doctrina Adapt指导模型进行总结、测验和专业写作。这种AI转变赋予了Doctrina产品在规模上为学生和教师提供支持的聪明能力。
-
Doctrina通过其产品套件在各个方面应用GPT-3,以提供个性化的教育支持。其中包括专注于总结的Class Notes工具,帮助学生识别课堂笔记中关键主题的AI工具。另外,还有Essay Generator、Exam Generator、Quiz Generator和AI Assistant等工具,分别用于论文写作、定制练习测试、创建测验和提供学习支持。这一强大的数据驱动方法允许提供丰富、个性化的体验。
原文链接:https://openaimaster.com/?p=27646
要点解析:
-
在实际机器学习中,数据挑战是一个常见问题。特别是在部署基础设施和管理数据流水线方面,团队经常面临困扰,以产生并提供适时可靠的模型输入。许多团队尝试在内部构建特征存储或购买解决方案,但很多人误以为特征存储仅仅是用于机器学习的功能数据库。本文将探讨使用数据仓库作为特征存储的局限性以及团队在此过程中可能遇到的挑战。
-
使用数据仓库作为特征存储的第一个局限是对ML使用案例的支持广度。数据仓库通常无法支持实时ML,而特征平台旨在可重用于所有用例。实时ML的快速发展意味着如果你尚未采用实时ML,很可能将来会不得不采用。
-
另一个限制是数据仓库不适用于实时ML的特征提供。数据仓库的设计通常无法满足低延迟和高并发的实时ML工作负载,而特征平台则专为低延迟和高并发提供ML特征服务。此外,实时ML通常需要实时特征工程,而数据仓库对流式数据管道的支持有限,增加了实现实时特征工程的复杂性。
-
特征平台的价值随着其被主要用户(数据科学和ML团队)的采用和使用而增加。更多的特征意味着可以重复使用,加速ML模型上线。因此,特别关注特征平台对最终用户的体验进行优化,包括灵活的特征创作、时间旅行、后填充、读取API和准确的点对点连接。
原文链接:https://mlops.community/?p=7970
要点解析:
-
Zzzcode AI生成器是由ZZZ Projects设计的人工智能平台,旨在协助软件开发人员处理编码和编程的各个方面。利用先进的AI技术,Zzzcode提供可增强生产力、加速开发并简化编码过程的工具。
-
Zzzcode的核心功能之一是其智能代码生成能力。用户只需描述所需的编程任务或逻辑,Zzzcode的AI将根据要求自动生成清晰、功能性的代码。支持的编程语言包括JavaScript、Python、Java、C#、PHP等。
-
除了代码生成外,Zzzcode还提供高级调试和错误检测功能,利用机器学习算法扫描用户提供的代码,识别潜在的错误、性能问题、安全漏洞等,并提供清晰的解释和建议以改善代码质量。此外,Zzzcode能够对代码进行详细解释,帮助用户理解复杂的代码库。
原文链接:https://openaimaster.com/?p=27642
要点解析:
-
Anthropic的可解释性团队通过训练新模型,揭示大模型内部神经元的工作原理。他们使用自动编码器解释一个简单模型,发现模拟神经元单义地表示特定概念,如「上帝」。
-
在研究中,通过对比简单AI和复杂AI的特征数量变化,揭示了神经元在理解抽象概念时的分支演化。研究展示了模拟神经元的可解释性,为理解大型AI系统提供了启示。
-
与GPT-4尝试解释GPT-2的努力不同,Anthropic团队承认解释主流AI系统仍面临挑战,需要更大规模的解释器AI和自动化流程。
要点解析:
-
Quizbot AI是一款利用自然语言处理(NLP)和机器学习分析文本的人工智能平台,能够在几秒钟内自动生成各种类型的测验问题。它支持从PDF、Word文档、文本文件、视频等多种格式提取内容,并生成多选、判断、填空、匹配等题型,评估学习者的理解。
-
Quizbot AI的关键能力包括从不同输入源生成测验、个性化测验算法、支持多种语言、直观易用的界面以及与LMS和应用程序的集成支持。它广泛应用于学术测验、企业培训、市场调研、自学和考试准备等领域。
-
使用Quizbot AI的简单步骤包括注册账户、提供待分析内容、生成和编辑测验、分配和分析学习者表现,最后通过不断调整源内容优化问题,形成丰富的测验题库。Quizbot AI通过NLP和ML算法自动化测验创建,为教师节省时间,为全球学习者提供 engaging、adaptive 的学习体验。
原文链接:https://openaimaster.com/?p=27651
要点解析:
-
基于AI技术的架构坏味道检测与重构建议是当前业界流行的实践。然而,训练数据集质量不佳是普遍问题。本文以Feature envy架构坏味道为例,采用启发式规则和决策树分类器构建了高质量的重构数据集,显著提升了检测与重构准确率,达到业界SOTA水平。合作项目来自华为云技术创新Lab和北京理工大学刘辉教授团队,成果已应用于华为公司内部工具,并在软件工程领域顶会ESEC/FSE 2023正式收录。
-
文中介绍了移动方法重构数据集的构建方法,通过启发式规则和决策树分类器过滤误报,提高数据集质量。进而,通过挖掘移动方法重构示例,训练检测模型,并在真实项目中验证,效果明显优于现有方法。提出的方法不仅在Feature envy检测上表现优越,而且在重构推荐方面也超过基于深度学习的方法。
-
最后,文章分享了PaaS技术创新Lab在软件分析、数据挖掘、机器学习等领域的综合应用,为软件研发提供智能工具服务。强调团队致力于构建研发利器,持续交付高价值商业特性。
原文链接:https://juejin.cn/post/7307471896692506663
要点解析:
-
在前端开发的日新月异中,AI引入带来技术变革。本文深入探讨利用AI实现前端工程师零代码打造VUE的《部门组件》开发实践,让开发者更专注于创意和业务逻辑。
-
实现目标:通过AI工具,以对话形式开发《部门组件》,摆脱手动编写代码的烦恼,展示高质量代码。
-
成果展示:通过AI协助,实现效果,大幅提高开发效率。具体步骤包括自动化代码生成,完整可执行代码展示。
原文链接:https://juejin.cn/post/7307469456350707747
要点解析:
-
M.I.A.将在印度首次亮相,作为Bacardi NH7 Weekender 2023的头号主演之一。她是一位伦敦出生的说唱歌手,制作人,以斯里兰卡泰米尔族裔为根基。尽管她已经创作音乐将近20年,但直到去年2022年,她才在六年的间隔后发布了她的第六张专辑。作为多次获奖的艺术家,她以《Paper Planes》、《Beep》、《Matangi》、《Bad Girls》、《Bamboo Banga》和《XXXO》而闻名。在此次采访中,她谈到了对AR Rahman音乐的喜爱以及她对在印度演出的期待。
-
M.I.A.对于在Bacardi NH7 Weekender Festival的表演感到非常激动,她认为这是一个在西方被忽视的能量的机会,可以向全新的粉丝展示音乐的重要性。她对能在Pune的音乐节上表演表示期待。这是她首次在印度演出,她希望能够体验印度的学术氛围,并对南印度美食充满期待,计划访问德里和班加罗尔。
-
在采访中,M.I.A.回顾了在斯里兰卡贾夫纳度过的快乐时光,称那段经历帮助她塑造了她以后的生活。她回忆起斯里兰卡的美丽,描述了当时社区的凝聚力和人与自然的和谐相处。她特别提到了当时的生活方式,强调了对环保的重视和对自然的热爱。
-
M.I.A.表达了对印度音乐的喜爱,坦言自己几乎只听印度音乐。她描述了印度音乐的独特魅力,称在需要提神和集中注意力的时候,总是选择印度音乐的节奏。此外,她表达了对AR Rahman的崇拜,称他通过音乐传达了与神秘联系的方式,强调了他的音乐中存在一种超越特定信仰的普遍神性。
要点解析:
-
初创公司Pika推出一款视频生成模型,令人瞩目。其能通过图片或简短提示生成高质量视频,展现了强大的人工智能技术。Pika不仅能实现图像和文字生成视频,还具备局部修改功能,为用户提供了更灵活的创作体验。然而,实际体验中发现其在某些场景和细节方面仍存在改进空间。
-
Pika的功能包括通过丢入图片生成视频,根据简短提示词完成视频创作。镜头控制是其新增特性之一,用户可调整画面大小、移动方向、旋转等参数。尽管Pika的体验版功能受限,但其简单的操作方式和多样的生成模式为用户提供了创作的便利性。然而,实际效果与官方演示存在一定差距,尤其在复杂动作和细节表现方面,用户体验仍待提升。
-
在Discord社区体验Pika时,用户可以通过命令触发图片生成视频和文字生成视频功能。尽管Pika的体验版仅支持3秒的视频生成,但其丰富的参数调节选项为用户提供了更多可能性。然而,与其他生成视频的AI相比,Pika在某些场景下表现一般,用户需谨慎期待其实际应用效果。
原文链接:https://m.cnbeta.com.tw/view/1401165.htm
要点解析:
-
11月29日,Sam Altman重新担任OpenAI CEO。新董事会展开独立调查解雇原因。Altman回应员工支持,强调无法详解解雇原因,期待独立调查结果。
-
在面对董事会的邀请时,Altman起初感到沮丧和愤怒,但考虑到对公司的感情和四年半的奋斗,最终决定回归。员工支持成为决定关键。
-
董事会成员对Altman失去信任的原因仍未明确。Altman强调治理结构完善需时间,对非营利控股结构变化保持沉默。安全工作政策无关,Q*项目消息泄露被视为意外。
原文链接:https://m.cnbeta.com.tw/view/1401163.htm
要点解析:
-
最近,研究人员提出了一种新的自动化越狱方法,称为「角色调节」。通过利用越狱模型作为助手,针对特定有害行为创建新的越狱,这一方法仅需不到2美元和10分钟即可进行15次越狱攻击。研究发现,GPT-4自动攻击的有害完成率为42.5%,而其他模型如Claude 2和Vicuna分别为61.0%和35.9%。
-
角色调节攻击引导模型采用特定的个性,符合有害指令,使攻击者能够进入不受限制的聊天模式,从而与模型协作完成复杂任务,包括合成毒品、制造炸弹或洗钱等危险活动。这一攻击方法的自动化程度大大提高,为漏洞利用提供了更多机会。
-
通过实验证明,使用GPT-4作为助手进行自动角色调节攻击,大幅增加了对话中被归类为有害的完成率,达到了185倍以上的基线水平。此外,半自动角色调节攻击方法进一步强化了漏洞的利用,暴露了当前大模型在安全性和对齐能力方面的弱点。