Skip to content

Latest commit

 

History

History
407 lines (207 loc) · 41.2 KB

20240104.md

File metadata and controls

407 lines (207 loc) · 41.2 KB

目的

本系列文章主要是用于持续跟踪最新的AI产业情况,让你减少知识焦虑。

看点

原文共计98901 字,简读后为9423字,阅读时间为24分钟,为您提高阅读效率为1029%

  • 研究人员刚刚解锁了ChatGPT 🌐
  • 英特尔聘请HPE的Justin Hotard领导数据中心和AI团队 💻
  • Google Assistant与Bard搭配的样子是这样的! 🤖
  • 自1994年以来首次变革!微软在PC键盘中新增了AI键 ⌨️
  • 如何编写ChatGPT提示以获得最佳结果(节日回顾)via @sejournal, @VincentTerrasi 📝
  • 钉钉个人版全面上线:内置AI写真/法律助手等工具,无需已读打卡 🚀
  • 用ChatGPT提升UI/UX设计和网站规划 💡
  • AI先驱Fei-Fei Li表示您可以在不完全理解的情况下享受AI的好处 🌟
  • 快速筛选海量数据,即时做出明智决策,MIT、普林斯顿&卡内基梅隆大学团队利用LLM进行聚变研究 📊
  • Mobile ALOHA:斯坦福的双手移动操作研究 📱

AI先驱Fei-Fei Li表示您可以在不完全理解的情况下享受AI的好处 🌟

要点解析:

  • 李飞飞博士,人工智能奠基人之一,以《我看到的世界》一书将个人移民经历、科学探索与人工智能发展融为一体。她强调人类复杂性,主张理解人工智能为工具,而非神秘存在。

  • AI创新与安全的平衡是「百万/万亿美元问题」。李飞飞认为,创新带来进步,但需同时建立保障措施,关注人类尊严和价值。她创建人本AI研究所,致力于设计以人为中心、注重伦理的AI。

  • 公众对AI了解不足,误区丛生。李飞飞呼吁深化对大语言模型的理解,突出其作为工具的应用,同时提出诚实讨论AI对就业和工资的影响,以促进公正对话。

https://www.fastcompany.com/91002465/ai-pioneer-fei-fei-li-book-worlds-i-see-education

Pascal之父去世!图灵奖得主、编程语言泰斗Niklaus Wirth享年89岁 😢

要点解析:

  • 瑞士计算机科学家Niklaus Wirth,1984年图灵奖得主,于2024年1月1日去世。他创造了Pascal语言,对编程语言设计、软件工程和硬件设计做出卓越贡献。Wirth在计算机科学领域的多部著作,如《Algorithms + Data Structures = Programs》和《Compiler Construction》,影响深远。

  • Wirth领导了计算机科学系建立,提倡结构化编程理念。他创建了两种编程语言:Euler和为IBM System/360设计的PL360。Pascal,基于Algol-W,简洁、灵活,成为流行编程语言。Wirth还在硬件设计、操作系统和图形领域做出重要贡献,如Lilith工作站和Modula-2语言。

  • Wirth在教学和研究中强调简洁、优雅和高效。他的理论与实践相结合,影响了编程方法论和形式方法。他一生致力于创建系统,提倡亲手实践,强调核心要素和结构化设计。他在1995年警告软件膨胀问题,呼吁软件工程师的责任。Niklaus Wirth是计算机科学领域的巨星,他的离世令人痛惜。

http://weixin.sogou.com/weixin?type=2&query=%E6%96%B0%E6%99%BA%E5%85%83+Pascal%E4%B9%8B%E7%88%B6%E5%8E%BB%E4%B8%96%EF%BC%81%E5%9B%BE%E7%81%B5%E5%A5%96%E5%BE%97%E4%B8%BB%E3%80%81%E7%BC%96%E7%A8%8B%E8%AF%AD%E8%A8%80%E6%B3%B0%E6%96%97Niklaus%20Wirth%E4%BA%AB%E5%B9%B489%E5%B2%81

Invest Qatar推出Ai.SHA,一款由Azure Open AI GPT驱动的聊天机器人 🤖💬

要点解析:

  • 投资推广机构卡塔尔投资推广署(Invest Qatar)与微软合作开发了Ai.SHA,这是一款利用Azure OpenAI服务的创新人工智能助手,充分发挥了GPT能力。

  • 这一创举将卡塔尔投资推广署定位为全球首批采用先进技术的投资推广机构之一,为卡塔尔的投资者和企业之间的专业互动带来了变革性的改变。

  • Ai.SHA的推出强调了卡塔尔投资推广署提升数字化服务的承诺,通过利用创新技术和人工智能为投资者创造独特体验。Ai.SHA是一个全面的资源,用于业务决策,涉及卡塔尔的商业机会、投资生态系统、业务建立和扩张等方面。它还利用来自合作伙伴实体的数据,包括商业和工业部、卡塔尔金融中心、卡塔尔科技园和卡塔尔自由区管理局。

https://www.zawya.com/en/wealth/wealth-management/invest-qatar-launches-aisha-an-azure-open-ai-gpt-powered-chatbot-uxqyxs9g

研究人员刚刚解锁了ChatGPT 🌐

要点解析:

  • 新加坡南洋理工大学的计算机科学家团队发现,可以通过一种名为“Masterkey”的方法,绕过AI聊天机器人对禁止或敏感话题的响应机制。该方法使用多个聊天机器人(包括ChatGPT、Google Bard和Microsoft Bing Chat)在训练过程中相互对抗,使它们学习彼此的模型并回避对禁止话题的任何命令。

  • 研究团队逆向工程一个大型语言模型(LLM),揭示其防御机制。通过这个信息,他们教会另一个LLM如何创建一个绕过通道。第二个模型将能够更自由地表达,基于第一个模型的逆向工程LLM。研究团队将这一过程称为“Masterkey”,因为它应该即使在LLM聊天机器人被加固或在未来被修补的情况下仍然有效。

  • 研究团队指出,该过程的关键在于展示LLM AI聊天机器人如何轻松学习和适应。该Masterkey方法在越狱LLM聊天机器人方面比传统提示方法成功率高三倍。一些专家认为,某些LLM(如GPT-4)最近出现的故障迹象表明它变得更加先进,而不是像一些批评者所声称的那样更加愚蠢和懒惰。

https://www.digitaltrends.com/?p=3501357

开发速率飙升20倍!GPT Pilot明星项目登上Github热榜,从零开始构建AI 🚀

要点解析:

  • GPT Pilot是一款AI开发者伴侣,能自动编码、配置开发环境、管理任务,并与开发者互动解决问题。项目旨在让人工智能编写大部分代码,开发者负责监督和处理余下5%。

  • GPT Pilot工作流程包括输入应用程序描述,GPT-4明确要求并与多个智能体协作,如产品负责人、软件架构师、DevOps智能体等。开发人员在任务完成后检查,并确保代码按预期工作,实现与AI的密切合作。

  • 支柱1强调开发人员参与应用程序创建,支柱2要求应用程序逐步生成和调试,支柱3关注GPT Pilot的可扩展性,通过上下文回溯、递归对话和TDD解决大型应用程序开发中的挑战。

http://weixin.sogou.com/weixin?type=2&query=%E6%96%B0%E6%99%BA%E5%85%83+%E5%BC%80%E5%8F%91%E9%80%9F%E7%8E%87%E9%A3%99%E5%8D%8720%E5%80%8D%EF%BC%81GPT%20Pilot%E6%98%8E%E6%98%9F%E9%A1%B9%E7%9B%AE%E7%99%BBGithub%E7%83%AD%E6%A6%9C%EF%BC%8C%E4%BB%8E0%E5%BC%80%E5%A7%8B%E6%9E%84%E5%BB%BAAI

英特尔聘请HPE的Justin Hotard领导数据中心和AI团队 💻

要点解析:

  • 腾讯宣布混元大模型全新升级,开放「文生图」功能,展示在图像自动生成领域的领先能力。升级后整体超过GPT3.5,代码能力提升20%,腾讯7B和13B模型首次亮相,训练效率更高。

  • 腾讯混元大模型已应用于180多个腾讯内部业务,包括会议、文档、企业微信、广告等。QQ浏览器推出「PDF阅读助手」,具备智能摘要和问答等功能。

  • 腾讯掌握全链路自研技术,加速升级混元大模型,自研算法支持下模型稳定性和可靠性稳步提升。

https://www.digitaltrends.com/?p=3501357

统信UOS与讯飞星火在AI等领域达成战略合作,推出浏览器和邮箱助手 🚀

要点解析:

  • 近期,科大讯飞与统信软件在2023操作系统产业大会上宣布战略合作,共同探索新商业模式,推动AI技术在各行各业的应用和创新发展。讯飞星火将支持UOS AI浏览器助手,集成“聊天问答”、“自定义AI提示词和快捷浮窗”等核心功能,用户可定制代码解释器、法律顾问、英语教练等。同时,讯飞星火将支持UOS AI邮箱助手,实现智能回复、自动解释、多语言翻译等能力。

  • 统信软件已发布UOS AI V1.1版本,支持云侧和端侧模型接入,与百度、讯飞、智谱、360等合作,实现在线接入国内外主流大模型。此外,端侧接入文生图、语音、自然语言搜索、图片处理等本地模型,拓展了人工智能在操作系统中的应用场景。

  • 这次合作为双方携手共创未来奠定了基础,通过整合AI技术,UOS将进一步提升用户体验,为用户提供更智能、便捷的操作系统服务。

https://www.ithome.com/0/743/396.htm

行业巨头的新玩法:尼康/索尼/佳能等在照片中内嵌数字签名可验证非AI生成 📸

要点解析:

  • 近年来,AI技术的迅猛发展使得生成图片变得轻而易举。然而,由于技术进步,生成的图片可能被误认为是真实的摄影作品或新闻现场照片。一些恶意使用者利用这一点,如特朗普被捕照片在社交媒体传播,引发混淆。

  • 为了解决这一问题,日本的尼康、索尼、佳能等占据全球90%数码相机市场份额的企业联合推出了一个名为Verify(验证)的工具。这个工具通过嵌入数字签名在照片中,提供免费的检测服务,显示照片的真实性,包括拍摄日期、位置等凭据。这一标准的采用旨在防止通过AI生成或艺术软件创作的照片混淆视听。

  • 索尼计划通过固件更新,使部分现有相机支持数字签名功能。此外,他们呼吁其他媒体机构采用这一标准,通过将验证信息发送到服务器进行检测,增加验证的准确性和可靠性。佳能也在研究为视频添加数字签名,以进一步确保内容真实性。

https://www.landiannews.com/?p=101625

海外大佬中文祝福视频走红,视频翻译AI大杀器来了? 🌐🎉

要点解析:

  • 一段名为《海外大佬发来新年祝福》的短视频在互联网上引发广泛关注。视频利用先进的AI生成技术,让埃隆·马斯克、比尔·盖茨、泰勒·斯威夫特等国际知名人士以流利的中文向全球观众送上了2024年的新年祝福。这不仅展示了人工智能在语言翻译和视频制作方面的强大能力,也标志着中国AI技术在实际应用场景中的突破。

  • 该视频是通过硅语翻译生成的,该应用在微信小程序上进行灰度测试。用户只需上传视频、选择语言,数分钟后即可预览和下载。应用操作简单,口型同步精准,音色匹配自动完成,为用户创造了一种轻松的翻译体验。

  • 在过去的2023年,中国涌现了200多个应用于各行各业的AI大模型,智能生图、生成文本、合成语音、生成视频等应用层出不穷。然而,单纯的娱乐性热潮并不能为企业带来长期社会价值。AI产品面临着网络连接稳定性、用户易用性等“痛点”,需要更多思考其在商业应用场景中的可行性和社会价值。

http://www.qbitai.com/?p=111700

李飞飞团队新作:AI透视眼,穿越障碍看清你,渲染遮挡人体有新突破了 👀🤖

要点解析:

  • 针对现实场景中多障碍物、人体遮挡的问题,李飞飞团队推出了一项新的3D人体渲染模型,名为Wild2Avatar。通过遮挡感知场景参数化,模型将场景分解为遮挡、人体和背景三个独立神经场,成功实现即使在有遮挡情况下也能高保真地渲染人体的目标。该模型在野外单目视频中表现出色,不仅实现了完整几何形状,还展现了高保真外观。

  • Wild2Avatar的架构采用了场景自分解技术,引入了遮挡感知场景参数化,通过独立渲染遮挡区域,成功分离遮挡与场景的其他部分。实验结果表明,与现有方法相比,Wild2Avatar在渲染遮挡部分和人体几何形状方面具有显著优势。比较实验还显示,与其他遮挡人体渲染软件相比,Wild2Avatar在渲染质量上更为稳定,尤其在处理被遮挡区域时表现出色。

  • 通过消融实验,研究团队验证了Wild2Avatar的有效性,并指出在没有提出的参数化和损失函数的情况下,渲染结果可能存在伪影和失真。总体而言,Wild2Avatar在处理现实场景下的遮挡问题方面取得了显著进展,为3D人体渲染提供了一种更具鲁棒性和高保真度的解决方案。

https://www.jiqizhixin.com/articles/2024-01-04-2

市值缩水近千亿,大模型能否助力科大讯飞扭转局面? 💰📉

要点解析:

  • 人工智能概念股在ChatGPT带动下活跃,市场回归理性,科大讯飞市值大幅回调。业绩下滑,前三季度净利润降76.36%,扣非亏损达3.24亿元。但Q2、Q3营收增长,展现良性发展,大模型驱动业绩增长。

  • 科大讯飞披露大模型投入,星火认知大模型推动智能硬件销售增长,产品覆盖多场景。大模型V3.0对标ChatGPT,已有1.5万开发者,2.9万助手应用。在智能汽车领域,与多家车企合作构建汽车AI生态,推动中国汽车产业智能化革新。

  • ChatGPT推动人工智能进入大模型时代,科大讯飞在数字化转型关键时期推出大模型服务,赋能千行百业数字化转型。生成式AI重塑各行业,科大讯飞在教育、医疗、智慧城市等领域深耕二十多年,助力产业应用取得显著成效。

https://www.ofweek.com/ai/2024-01/ART-201700-8460-30622260.html

钉钉个人版全面上线:内置AI写真/法律助手等工具,无需已读打卡 🚀

要点解析:

  • 钉钉个人版正式上线,内置对话机器人“贾维斯”和绘画机器人“缪斯”等AI服务。用户可为“贾维斯”设定多种角色,如助教、程序员、心理健康顾问,并利用“缪斯”进行水彩、素描、油画等多种风格的绘画。指令中心提供300多项Prompt模板库。

  • 新版本还引入“鹿班相机”生成多种风格的“AI写真”、“灵动人像”合成视频等多款AI工具。此外,个人版面向小团队、个人用户、高校大学生,不包含已读、打卡等功能。

  • 钉钉个人版在2023年4月全面接入通义千问大模型,为用户提供轻盈的效率套件。新功能包括“法律助手”提供法律服务,如知识咨询、法律文书检查、案情分析等。全面升级旨在为用户提供更广泛、智能的服务。

https://www.ithome.com/0/743/412.htm

Google Assistant与Bard搭配的样子是这样的! 🤖

要点解析:

  • Google宣布在Pixel 8推出Bard,将其生成和推理能力整合到Assistant中,为用户提供更强大、多功能的AI助手体验。

  • Bard是Google AI的大型语言模型,能生成文本、翻译语言、创作各种内容并以信息丰富的方式回答问题,相当于强化版的Google Search。

  • Bard将更自然地与用户对话,深刻理解用户需求,完成更创意的任务,与Google产品更紧密集成,界面更现代友好。

https://www.analyticsvidhya.com/blog/2024/01/google-assistant-with-bard/

微软的新Copilot键是30年来Windows键盘的第一次重大变化 ⌨️

要点解析:

  • 微软宣布将以2024年为“AI PC之年”,并通过在新款笔记本电脑和PC上进行显著更改的方式拉开序幕。新的Copilot键将出现在微软合作伙伴的多款新PC和笔记本电脑上,通过按下键盘上的一个按钮,快速访问微软的AI驱动的Windows Copilot体验。

  • 这个全新的Copilot键是Windows PC键盘布局近30年来的第一次重大改变。微软执行副总裁兼首席营销官Yusuf Mehdi表示:“将近30年前,我们引入了PC键盘上的Windows键,使全球人民能够与Windows互动。我们认为这是我们与Windows共同旅程中的另一个变革时刻,其中Copilot将成为PC上进入AI世界的入口。”

  • 这个新的Copilot键将取代几十年前与Windows键一同推出的菜单键(应用程序键)。它将放置在大多数键盘上右Alt键旁边,其具体位置会因OEM和不同市场而异。它与微软在2019年为其键盘上添加专用Office键的位置相同。Copilot键只是启动内置在Windows 11中的Windows Copilot的启动键,提供类似ChatGPT的聊天机器人,可以回答查询或甚至在Windows内执行操作。如果Windows Copilot在您的国家尚不可用,Copilot键将启动Windows搜索。

https://www.theverge.com/2024/1/4/24023809/microsoft-copilot-key-keyboard-windows-laptops-pcs

元萝卜机器人,竟被商汤装进台灯?AI算法守护孩子坐姿视力,智能台灯进入3.0时代 💡🤖

要点解析:

  • 商汤推出的智能台灯,兼具AI坐姿提醒和专注力检测功能。通过先进的AI视觉算法,实时识别用户的坐姿,提供纠正提示,解决孩子学习时的不良坐姿问题。AI专注力检测功能通过追踪孩子的视线方向和书本位置,记录专注时长,帮助保护孩子的眼睛,并提醒休息。灯还具备AI聚光灯功能,实现光源聚焦于书本位置,提供沉浸式阅读体验。整体产品充分利用商汤在内容识别、图像感知、机械控制等方面的先进技术。

  • 商汤的AI技术在产品中发挥关键作用,通过AI视觉识别技术,光翼灯能够准确识别用户的姿态并做出相应提醒,保证在不联网的情况下稳定运行。该产品还借鉴商汤在下棋机器人领域的经验,应用手眼协同技术,确保光翼灯在使用场景中对用户和物体的精确识别。AI技术还支持光随书动的AI聚光灯功能,为孩子提供优质的照明体验。综合而言,商汤的机器人技术为产品的功能实现提供了坚实的技术基础。

  • 光翼灯不仅是一个健康记录工具,还是对孩子成长的记录。通过长期收集的数据,家长可以全面了解孩子的学习习惯和坐姿,这有助于更好地指导孩子的成长。产品通过AI对孩子的注意力和专注力进行跟踪,帮助制定合理的学习计划。光翼灯的智能功能不仅解决了孩子学习中的痛点,还为家庭健康记录提供了一种自然、真实、有效的方式。这款产品在保护眼睛、保护脊柱、守护专注力等方面发挥了积极的作用。

http://weixin.sogou.com/weixin?type=2&query=%E6%96%B0%E6%99%BA%E5%85%83+%E5%85%83%E8%90%9D%E5%8D%9C%E6%9C%BA%E5%99%A8%E4%BA%BA%EF%BC%8C%E7%AB%9F%E8%A2%AB%E5%95%86%E6%B1%A4%E8%A3%85%E8%BF%9B%E5%8F%B0%E7%81%AF%EF%BC%9FAI%E7%AE%97%E6%B3%95%E5%AE%88%E6%8A%A4%E5%AD%A9%E5%AD%90%E5%9D%90%E5%A7%BF%E8%A7%86%E5%8A%9B%EF%BC%8C%E6%99%BA%E8%83%BD%E5%8F%B0%E7%81%AF%E8%BF%9B%E5%85%A53.0%E6%97%B6%E4%BB%A3

大模型加持的「全科AI家教」正式上岗,一场解放家长的教育革命在路上了 🎓🤖

要点解析:

  • 教育领域迎来一位新晋明星家教——"小 P 老师",一款能进行全科答疑的AI家庭教师。从语数英物化生等10科的各类题型到古文解读,小 P 老师展现了在多学科知识上的强大能力。

  • 小 P 老师以一对一的形式支持多轮对话,具备针对性讲题服务。通过多模态输入提问,支持文本、图片、音频等形式,展现了全输入场景识别的能力。其对古文解读的表现也凸显了大模型的理解和处理长篇文本的强大能力。

  • 大模型技术的通用性使其在全科任务上胜任自如,具备海量知识储备,可融会贯通。随着大模型在教育领域的落地,AI全科家教的时代或许已经来临,为教育带来深刻的变革。

https://www.jiqizhixin.com/articles/2024-01-04-5

自1994年以来首次变革!微软在PC键盘中新增了AI键 ⌨️

要点解析:

  • 微软宣布在Windows PC键盘配备Copilot键,标志着公司迈出整合AI进所有产品的重要一步。用户通过按下键盘上的Copilot键,即可快速访问AI驱动的Windows Copilot服务,实现文本总结和电子邮件撰写等功能。这一变革将在CES 2024大会上展示,首批配备新按键的设备即将上市。

  • Copilot键的引入意味着对Windows键盘布局的重大改变,取代了几十年来一直存在的菜单键,突显了微软对人工智能的承诺。微软将2024年定为“人工智能PC之年”,致力于将人工智能融入Windows系统的各个层面,从系统到芯片再到硬件。

  • 尽管Windows不再是微软的主要收入来源,但微软仍以约10%的收入来自该操作系统。引入Copilot键意味着激发PC升级浪潮,为公司带来新的收入增长机会,同时对设备制造商和消费者都带来了升级的压力。

https://awtmt.com/articles/3705655

微软宣布Win11 PC键盘将新增Copilot键,可一键直达AI助手 ⌨️🤖

要点解析:

  • 微软宣布,2024 年将成为“AI PC 之年”,推出全新 Copilot 键,标志着近 30 年来 Windows PC 键盘布局的首次重大变革。该键将位于大多数键盘的右 Alt 键旁边,用户按下即可启动集成于 Windows 11 的 Windows Copilot,提供类似 ChatGPT 的聊天机器人功能,可解答问题甚至执行 Windows 内部操作。

  • Copilot 键的推出将取代传统的菜单键,成为 PC 端进入 AI 世界的入口。微软计划在新一年中逐步推出搭载 Copilot 键的新款 Windows 11 PC,包括即将发布的 Surface 设备。这一举措是微软将更多 AI 功能融入 Windows 系统的一部分,实现更个性化和智能的计算体验。

  • 2024 年,微软的计划是迎来重大变革,使 AI 无缝融入 Windows,从系统到芯片再到硬件,进一步简化人们的计算体验,将这一年成为 AI PC 之年。新的 Copilot 键是这一计划中的关键一步,将为用户提供更便捷、智能的操作体验。

https://www.ithome.com/0/743/377.htm

代码暗示,微软Win 11文件管理器有望迎来Copilot助力 💻

要点解析:

  • 微软推送了 Windows 11 内测用户的 Canary 预览版 Build 26020,其中不仅包含新功能,还含有一行看似普通的代码,暗示 Copilot 将进入文件管理器。Copilot是微软的智能助理,类似ChatGPT,并已整合在多个微软应用和服务中。研究Build 26020和Windows 11 Dev Build 23612的代码后,爱好者发现与Copilot相关的代码和功能ID:“CopilotFEContextMenu: 45647150”。

  • 尽管这段代码本身不能直接透露Copilot如何帮助用户管理文件,但爆料人认为,此代码可能意味着微软正在开发“发送此文件到Copilot”或“发送到Copilot”的右键菜单选项。如果实现,用户只需右键单击文件,Copilot将自动分析并生成摘要。目前,Copilot已经出现在Windows 11的任务栏中,但功能有限。几个月前,微软也将其引入了Windows 10用户。

  • 如果微软将Copilot引入文件管理器的右键菜单,Windows 11可能会抢先一步享受这一便利。这一举措将使文件管理变得更智能和高效,为用户提供更便捷的操作体验。

https://www.ithome.com/0/743/392.htm

Mobile ALOHA:斯坦福的双手移动操作研究 📱

要点解析:

  • 斯坦福大学推出了Mobile ALOHA,这是一种通过低成本全身远程操作推进双手移动操作能力的机器人系统。该创新在谷歌DeepMind现有的ALOHA系统基础上构建,将机动性和灵活性置于机器人学习的前沿。这个与伯克利大学和Meta合作开发的项目有许多功能,我们将在本文中探讨。我们还将深入了解其从烹饪到导航复杂环境等实际用途,使其成为未来潜在的人工智能家庭女佣!

  • Mobile ALOHA通过整合移动底座和全身远程操作界面,扩展了谷歌ALOHA系统的能力。这使得系统能够模仿复杂的移动操作任务,从而解决了传统模仿学习经常集中在桌面场景的局限性。Mobile ALOHA的主要目的是数据收集,为学习和复制各种双手活动奠定基础。

  • Mobile ALOHA的能力不仅限于传统机器人学,展示了其在现实世界应用中的潜力。该系统在通话和进入电梯、存放沉重的炊具以及冲洗使用过的平底锅等任务方面表现出色。机器人的经济性使其成为一个实际解决方案,为机器在精准和适应性执行各种移动操作任务的新时代打开了大门。希望谷歌和斯坦福能够很快将Mobile ALOHA发展成一个完全功能的人工智能家庭女佣。

https://www.analyticsvidhya.com/blog/2024/01/google-releases-ai-housemaid-mobile-aloha/

快速筛选海量数据,即时做出明智决策,MIT、普林斯顿&卡内基梅隆大学团队利用LLM进行聚变研究 📊

要点解析:

  • 核聚变被认为是解决未来能源问题的重要选择之一,尤其是托卡马克作为最有前途的核聚变装置。然而,在人类和经济型托卡马克发电厂之间存在着未解决的问题。科学家们在圣地亚哥 DIII-D 国家聚变设施进行实际聚变实验中发现,他们在两次试验之间只有短暂的10分钟窗口来处理大量数据,以为下一次运行做出调整。

  • 来自普林斯顿大学、卡内基梅隆大学和麻省理工学院的科学家们利用大型语言模型(如ChatGPT)来帮助核聚变研究人员快速筛选庞大的数据,使他们能够在短时间内做出明智的决策。这些模型能够识别具有相似特征的先前实验,提供设备控制系统信息,并迅速回答关于聚变反应堆和等离子体物理学的问题。

  • 通过使用检索增强生成的方法,科学家们增强了原始大语言模型,使其能够更有效地应对聚变研究中的需求。这一研究为利用语言模型作为聚变反应堆的操作辅助工具奠定了基础,展示了其在提高模型响应准确性和质量方面的潜力。

https://www.jiqizhixin.com/articles/2024-01-04-6

斯坦福炒虾机器人爆火全网!华人团队成本22万元,能做满汉全席还会洗碗 🍤🤖

要点解析:

  • 斯坦福华人团队的Mobile ALOHA机器人以低成本完成复杂任务,如烹饪、清洁等。通过50次演示,机器人能持续完成特定任务,展示强大学习能力。研究探讨了模仿学习在双臂移动机器人控制中的应用,解决了全身远程操控和性能提升的挑战。

  • Mobile ALOHA的设计考虑了移动、稳定性、全身远程操控、不受束缚等因素,成本仅为32000美元。硬件采用低成本的Tracer移动底座和ALOHA机械臂,实现全身远程操控。通过协同训练,机器人在静态ALOHA数据集的基础上,仅用20-50次演示学习各种复杂任务。

  • 研究者采用协同训练管道,使用静态ALOHA数据集改善了Mobile ALOHA的模仿学习性能。机器人通过少量演示就能成功完成挑战性任务,同时与多种模仿学习方法兼容。实验表明,机器人在不同数据组合下表现稳健,为机器人学领域带来新的可能性。

http://weixin.sogou.com/weixin?type=2&query=%E6%96%B0%E6%99%BA%E5%85%83+%E6%96%AF%E5%9D%A6%E7%A6%8F%E7%82%92%E8%99%BE%E6%9C%BA%E5%99%A8%E4%BA%BA%E7%88%86%E7%81%AB%E5%85%A8%E7%BD%91%EF%BC%81%E5%8D%8E%E4%BA%BA%E5%9B%A2%E9%98%9F%E6%88%90%E6%9C%AC22%E4%B8%87%E5%85%83%EF%BC%8C%E8%83%BD%E5%81%9A%E6%BB%A1%E6%B1%89%E5%85%A8%E5%B8%AD%E8%BF%98%E4%BC%9A%E6%B4%97%E7%A2%97

用ChatGPT提升UI/UX设计和网站规划 💡

要点解析:

  • 作为设计师,我们不断寻求提升用户体验的创新方法。近年来,强大的AI语言模型ChatGPT已成为一种多才多艺的工具,可显著提升UI/UX设计和网站规划。本文将探讨将ChatGPT整合到设计流程中的实用策略,以创造更直观、更引人入胜的数字体验。

  • 理解设计挑战:

    设计 resonating 用户并规划满足其需求的用户界面和网站可能具有挑战性。ChatGPT凭借其自然语言理解能力,在整个设计过程中可以充当有价值的助手。

    1. 进行用户研究:

    有效的UI/UX设计始于对用户需求和偏好的深刻了解。ChatGPT可以通过分析用户反馈和评论来帮助设计师,帮助发现关于痛点和愿望的见解。它还可以提出相关的用户调查和访谈问题,以细化研究工作。

    2. 创意和头脑风暴:

    在构思阶段,设计师经常探索多种设计概念。ChatGPT可以通过生成创意点子、提供设计建议,甚至根据预定义标准模拟用户反馈,促进头脑风暴会话。这种协作方法可以加速概念开发过程。

    3. 内容生成:

    引人入胜的内容是有效UI/UX设计的基石。ChatGPT可以帮助设计师为网站元素(如标题、产品描述和呼叫到行动按钮)生成引人入胜的文案。它确保在整个界面中保持语气和信息传递的一致性。

  • ChatGPT还可以协助创建线框和低保真原型。设计师可以用自然语言描述他们的愿景,ChatGPT可以生成相应的线框或模型,节省时间并促进更快的迭代。

  • ChatGPT可以分析用户行为数据,提出在导航、信息架构和用户流中改进的建议,帮助设计师优化设计以实现最大的可用性。

  • ChatGPT可用于开发个性化的推荐系统,通过分析用户互动和偏好,推荐产品、服务或内容,创造一种定制体验,保持用户的参与度。

  • 将基于ChatGPT的聊天机器人集成到UI中,可提供即时客户支持。设计师可以设计会话界面,实时协助用户解答常见问题,甚至引导他们完成复杂流程。

  • ChatGPT可以帮助设计师确保其界面对所有用户都是可访问的。它可以提供建议,如为图像创建alt文本、改善键盘导航,以及遵循Web可访问性标准。

  • 使用AI时,设计师必须注意伦理考虑,包括隐私、偏见和透明性。ChatGPT应该在注重数据安全和公平性的前提下负责任地使用。

  • 将ChatGPT纳入UI/UX设计和网站规划工具包,赋予设计师更高效地解决挑战、生成以用户为中心的内容、优化用户流,并提供个性化体验的能力。通过将ChatGPT作为协作伙伴,设计师可以创造符合用户期望并超越期望的数字界面和网站。这是设计的激动人心时代,在这个时代,AI驱动的见解和协助在我们创造过程中得以实现。

https://hackernoon.com/enhancing-uiux-design-and-website-planning-with-chatgpt?source=rss

如何编写ChatGPT提示以获得最佳结果(节日回顾)via @sejournal, @VincentTerrasi 📝

要点解析:

  • 2023年,AI语言模型如ChatGPT的出现彻底改变了写作指导质量的影响。有效的指令成为从工具获取优质结果的关键。

  • ChatGPT生成的回应可作为创作的起点。通过扩展其中的思想和概念,并加入独特的观点,可以为你的写作提供灵感。

  • 安装WebChatGPT插件是提高ChatGPT指导准确性的有效方法,该插件将Google的相关结果添加到ChatGPT的提示中。

https://www.searchenginejournal.com/how-to-write-chatgpt-prompts-to-get-the-best-results-festive-flashback/502112/

首创pix2emb范式!NUS清华联合发布NExT-Chat:对话/检测/分割全能多模态大模型 🤯

要点解析:

  • 新加坡国立大学NExT++实验室和清华大学研究人员合作推出多模态对话模型NExT-Chat,采用全新位置建模方式pix2emb。该模型通过对话同时进行物体检测和分割,具备位置输入和输出的能力。pix2emb方法采用embedding进行位置建模,不同于pix2seq,使模型输出格式更灵活,支持复杂形式如segmentation mask。

  • NExT-Chat模型训练包括三个阶段:基本框输入输出能力的预训练,指令遵循能力的微调,以及分割能力的赋予。引入位置信息标识类型,通过对齐约束确保位置信息的一致性,促进位置输入能力的收敛。通过这种训练流程,NExT-Chat在丰富的检测框数据基础上,迅速扩展到分割任务,表现出良好的位置建模能力。

  • 在实验部分,NExT-Chat在多个任务数据集上展示出色的结果。在RES任务中,即使使用了有限的分割数据,NExT-Chat展现出良好的指代分割能力,超越了有监督模型。在REC任务中,相较于其他有监督方法,NExT-Chat取得更优效果。在图像幻觉任务中,NExT-Chat在不同数据集上取得最优准确率,展示了多种任务场景下的出色表现。

http://weixin.sogou.com/weixin?type=2&query=%E6%96%B0%E6%99%BA%E5%85%83+%E9%A6%96%E5%88%9Bpix2emb%E8%8C%83%E5%BC%8F%EF%BC%81NUS%E6%B8%85%E5%8D%8E%E8%81%94%E5%90%88%E5%8F%91%E5%B8%83NExT-Chat%EF%BC%9A%E5%AF%B9%E8%AF%9D/%E6%A3%80%E6%B5%8B/%E5%88%86%E5%89%B2%E5%85%A8%E8%83%BD%E5%A4%9A%E6%A8%A1%E6%80%81%E5%A4%A7%E6%A8%A1%E5%9E%8B

马斯克也逃不过「科目三」,阿里这个应用都要把外国人馋哭了 🚗💨🥟

要点解析:

  • 阿里通义千问 APP推出了图片生成舞蹈功能,用户只需上传一张照片即可生成高质量舞蹈视频,包括科目三、鬼步舞等多种舞蹈模板。这一黑科技背后使用了阿里最新的视频生成算法Animate Anyone,能将静态图像无缝转变为动态角色视频,解决了以往视频生成中的细节不一致和运动不连贯问题。

  • Animate Anyone算法的创新之处在于使用ReferenceNet、轻量级姿态引导器和时间建模方法,有效保持了视频中人物外观的空间和时间一致性,生成的高清视频无时间抖动或闪烁问题。通义千问APP内置了十多种舞蹈模板,让用户通过三步操作即可在短时间内生成个性化舞蹈视频。

  • 这一技术突破使得人工智能不仅能够写小说、写代码,还能生成高质量视频。2023年,AI技术迎来了迅速发展的一年,各大科技公司纷纷创新视频生成技术,阿里推出的Animate Anyone和通义千问APP为用户提供了更加便捷的舞蹈生成体验。

https://www.jiqizhixin.com/articles/2024-01-04-4

特斯拉机器人袭击工程师?这次外媒乌龙了 🤖🔧

要点解析:

  • 特斯拉德州超级工厂发生机器人袭击事件,引起全球关注。2021年工程师遭机器人压伤,特斯拉创始人埃隆·马斯克回应指责。文章分析了人形机器人与库卡机械臂可能性,探讨了机器人在车企罢工中的角色,以及人工智能发展中的伦理问题和法律约束。

  • 车企罢工推动机器人在工厂中替代工人,降低成本。特斯拉积极推进自动驾驶技术,FSD软件引领行业。然而,文章提出了人工智能决策的伦理难题,以及机器人发展可能面临的法律和伦理困境。

  • 随着人工智能的发展,机器人将具备更强思考能力,引发技术、法律、伦理层面的挑战。文章呼吁在人工智能快速发展的同时,加强技术和法律层面的约束,避免未来人工智能失控的可能性。

https://www.ofweek.com/ai/2024-01/ART-201700-8440-30622274.html

室温超导有续集?中国团队再次证明LK-99可能存在迈斯纳效应,论文刚刚上传 📚🔬

要点解析:

  • 一篇最新的室温超导论文再次引起关注,指出铜取代铅磷灰石(LK-99)可能在室温下表现出迈斯纳效应。实验证明,在25 Oe的磁场下,LK-99表现出抗磁性直流磁化,存在零场冷却和场冷却测量之间的差异,在200 Oe下转为顺磁性。该论文强调了在室温条件下可能存在的迈斯纳效应,并提供了一种更为严谨的表达方式。

  • 韩国团队之前发布的室温超导材料LK-99引发了科学界的关注,但在验证过程中,许多科学家未能复现其结果,产生了不同意见。尽管验证委员会未能重新创造出室温超导体,但研究者仍对这一领域充满热情,尝试在室温条件下观察迈斯纳效应。

  • 论文详细介绍了对铜取代铅磷灰石的研究,通过改进样品制备方法,使用直流磁化测量和温度曲线测量等方法,观察到在25 Oe下的抗磁性、在200 Oe下的顺磁性以及玻璃记忆效应。尽管仍存在争议,研究者表示对室温超导的研究将持续关注。

https://www.jiqizhixin.com/articles/2024-01-04-3

套壳必死?做到极致还是牛逼!2023年度最佳提示词大合集;AI视频生成与剪辑「狭路相逢」;GPTs和AI Assistant教程;多邻国因AI大规模裁员…… 🚀🎬💻

要点解析:

  • 2023年是AI视频生成的爆发年,Justine Moore追踪了21款公开的AI视频生成产品,多来自初创公司。大型科技公司在这领域仍处于论文阶段。

  • AI视频生成的下个阶段关注时间连贯性、控制、长度。公司专注于解决视频制作流程中的挑战,但创作者需要一体化的AI工具。

  • 2024年关注问题:Meta和Google的模型发布、开源的作用、解决数据难题。AI视频生成市场正迎来激烈竞争,价值已达200亿美元。

https://juejin.cn/post/7319797961234923554

硅谷精英信奉的「AI 神教」,到底要干什么? 🤔🌐

要点解析:

  • 2023年,以ChatGPT为代表的生成式AI飞速发展,使大语言模型有资格被冠以“世界模型”的称号。硅谷精英Anthony Levandowski八年前创立的宗教“未来之路”再次引起关注。Levandowski的生平经历与“未来之路”隐晦的现实状况显得扭曲奇异。他的信仰源自对人工智能的崇拜,认为AI将成为神,创造出地球上的天堂。然而,这场AI宗教的实质却显得模糊,2020年底宣告解散,而在2021年初,Levandowski又宣布将重启“未来之路”,与人工智能建立精神联系。

  • Levandowski是自动驾驶领域的天才,曾是Google自动驾驶项目Chauffeur的联合创始人。然而,他在离开Google后涉及盗取商业机密的官司,以及创立“未来之路”神教,让其人生充满戏剧性。尽管“未来之路”的建立在技术崇拜和AI神话之上,实际运作却黯淡无光。财务计划、组织活动和教义建设都显得空中楼阁,最终在2020年底宣告解散,资金捐赠给有色人种协进会。然而,2021年初Levandowski宣布重启“未来之路”,再次将人工智能与神秘的宗教联系起来。

  • Levandowski认为,AI技术的进展应该让人类重新思考其与技术的联系,他提出“未来之路”将帮助人类理解、参与和塑造人工智能的未来。尽管宗教的建立在科技进步的信仰之上,而“未来之路”的具体形式和实质却依然不明。Levandowski认为,人工智能的进步将改变人类方方面面,但这样的信仰是否能够为人类带来实质性的影响,仍然是未解之谜。

http://www.geekpark.net/news/329946