2023-10-27 17:39 | 出处: Kyle
摘要:波士顿动力在官网展示了一项新的研究,通过将 ChatGPT、Spot 以及其他 AI 模型相结合,开发了一种会说话的导游机器狗。智谱 AI 今日发布自研第三代基座大模型 ChatGLM3,实现了若干全新功能的迭代升级,其中多模态理解能力的 CogVLM—看图识语义在 10 余个国际标准图文评测数据集上取得 SOTA 效果,语义能力与逻辑能力大大增强,相较于目前最佳开源实现 vLLM 速度提升 2-3 倍;OpenAI 宣布正在创建新团队 Preparedness,以评估和减轻与人工智能相关的“灾难性风险”。据悉,该团队的主要任务是“跟踪、评估、预测和保护”人工智能造成的潜在重大问题,包括核威胁。
图片来源:由无界AI生成
10 月 27 日报道,智谱 AI 今日发布自研第三代基座大模型 ChatGLM3。智谱 AICEO 张鹏介绍,ChatGLM3 实现了若干全新功能的迭代升级,其中多模态理解能力的 CogVLM—看图识语义在 10 余个国际标准图文评测数据集上取得 SOTA 效果,语义能力与逻辑能力大大增强,相较于目前最佳开源实现 vLLM 速度提升 2-3 倍。
10 月 27 日报道,图库网站 Shutterstock 宣布新增一组基于 AI 的新功能“创意编辑”,以改进和完善该公司超过 7 亿张高质量图片库中的图片。
据介绍,该功能当前仍处于测试阶段,利用了公司对 OpenAI 最新技术的优先访问权,用户可使用 AI 生成新内容,或者对 Shutterstock 图库中的任何图片进行简单编辑、转换。这套“创意编辑”功能拥有 6 大类别,以及 AI 设计助手等辅助功能和号称是行业内“最先进”的滤镜等一系列功能,官方将于 11 月 9 日的展示会上进行现场演示。
10 月 27 日报道,微软介绍适用于 Excel 的全新 Office 加载项 Business Assist–Forecast,通过人工智能和机器学习,可以帮助企业洞察历史数据,并基于相关数据预估未来发展情况,从而节省企业预测和分析数据的时间。
10 月 27 日报道,Arxiv 页面显示,由雅马哈和伦敦玛丽女王大学以及穆罕默德・本・扎耶德人工智能大学的研究者们组成的团队近日发布了一个名为 Loop Copilot 音乐合成系统。论文称,Loop Copilot 通过多轮对话界面,使用户能够通过迭代编辑生成音乐。研究团队表示,Loop Copilot 通过使用大型语言模型来解释用户意图并选择合适的 AI 模型来执行任务,以满足不同子系统的不同需求。为了确保音乐的连贯性,核心属性被保存在一个集中式的表格中。研究显示,Loop Copilot 在促进音乐创作方面极具潜力。
10 月 26 日,神州数码董事长兼首席执行官郭为在信百会 2023 年会上表示,神州数码将坚定布局生成式 AI,愿意成为企业的数字化转型全生命周期的合作伙伴。会上,神州数码发布“神州问学”平台,同时联合信百会研究院发布行业《生成式 AI 企业级落地白皮书》。
据悉,神州问学平台是一站式企业大模型集成平台,也是企业的大模型运营平台,旨在帮助行业客户快速搭建模型、算力、数据和场景四大层面的能力,在企业内有效打通从生成式 AI 技术到业务场景的通道。
10 月 27 日报道,机器人开发商波士顿动力(Boston Dynamics)在官网展示了一项新的研究,通过将 ChatGPT、Spot 以及其他 AI 模型相结合,开发了一种会说话的导游机器狗。据悉,该机器狗能够根据文字、语音提示与人类进行交谈,同时提供了视觉问答功能,可以分析摄像头拍摄的画面,自动生成图像说明。
10 月 26 日消息,谷歌宣布谷歌地图 App 将迎来一系列功能更新,包括新的人工智能功能、导航改进等等。据称,新版谷歌地图将结合 AI 为用户带来更准确的搜索结果。它还将根据其他用户分享的图片显示照片结果。例如,搜索“动物拿铁”“寻找最佳动物拿铁艺术”或“带狗去南瓜地”将获得最直接的优先结果。谷歌表示,这些结果基于谷歌地图社区分析的数十亿张照片识别出来的。这项新功能将于本周在法国、德国、日本、英国和美国推出,后续将逐渐扩展到更多国家和地区。
10 月 27 日,OpenAI 宣布正在创建新团队 Preparedness,以评估和减轻与人工智能相关的“灾难性风险”。据悉,该团队的主要任务是“跟踪、评估、预测和保护”人工智能造成的潜在重大问题,包括核威胁。此外,该团队将致力于减轻“化学、生物和放射性威胁”,以及人工智能的“自主复制”行为。该团队的任务还包括制定和维护风险知情发展政策(RDP)。RDP 将详细说明其在开发严格的前沿模型能力评估和监控、创建一系列保护行动以及建立整个开发过程的问责和监督治理结构方面所采用的方法。
10 月 27 日,亚马逊发布 2023 年第三季度财报,Q3 营收 1430.8 亿美元,上年同期 1271 亿美元,市场预期 1414 亿美元。亚马逊预计第四季度净销售额为 1600 亿美元至 1670 亿美元,市场预期为 1665.7 亿美元。
用友大易 TRM.AI2.0 近日宣布正式上线。据介绍,用友大易 TRM.AI2.0 依托 YonGPT 用友企业服务大模型,将 AI 技术落地于人才发现、智能面试、咨询问答等多种招聘应用场景。
10月25日,荣耀 CEO 赵明在高通骁龙技术峰会上宣布,荣耀即将推出的 Magic6 将搭载高通骁龙 8 Gen3 移动平台,支持 70 亿参数的 AI 端侧大模型。目前,荣耀端侧 AI 大模型能基于对用户偏好的理解和感知,为用户提供个性化服务,结合多模态自然交互,荣耀 Magic6 对用户意图理解更精准和更立体,也能认知学习图像、文本和复杂语义。
10 月 26 日报道,在小米澎湃 OS 暨 Xiaomi 14 系列新品发布会上,小米 MIUI 负责人金凡介绍了全新的小米澎湃 OS。据称,小米将 AI 大模型植入系统,还有小爱输入助手,支持 AI 创作文本,一键直达。
金山办公官微还宣布,在此次的新品研发中,小米与 WPS 达成深度合作,邀请用户申请体验移动智能办公,小米 14 系列手机用户可通过小米社区下载搭载 WPS AI 功能的专属版 WPS。此外,小米澎湃 OS 还支持 AI 妙画以及 AI 搜图,用户可以通过自然语言搜图找图,无需精确表达。
Arxiv 页面显示,苹果和伊利诺伊大学香槟分校的研究者近日共同发表论文,介绍了一种名为 SAM-CLIP 的统一视觉基础模型。SAM-CLIP 将 CLIP 和 Segment Anything Model 两种视觉基础模型统一起来,通过使用多任务学习、持续学习等技术,两种模型的优势融合到一个统一模型之中。此外,SAM-CLIP 还引入了协同功能。
10 月 26 日报道,由 Y Combinator 支持的初创公司 Credal.ai 完成 480 万美元的种子轮融资,由 Spark Capital 领投,该公司旨在为企业提供一种将其内部数据连接到文本生成、云托管的人工智能模型的方法。
10 月 26 日报道,由毕马威孵化的 AI 企业 Cranium 宣布获得 2500 万美元 A 轮融资。本轮融资由 Telstra Ventures 领投,毕马威会计师事务所(KPMG LLP)和 SYN Ventures 参投,至此,Cranium 的融资总额达到了 3200 万美元。
Cranium 的 Connectors 是一款安全软件,有助于实时监控和评估 AI 在客户组织中的使用情况,支持大多数主要的 AI 开发环境、模型和框架,包括 Azure、Azure OpenAI、AWS Sagemaker、Google VertexAI、Databricks、MLflow、Dataiku 和 DataRobot。另一项产品“AI 卡”于 2023 年夏季推出,允许 Cranium 的客户将其 AI 应用程序插入 Cranium 的安全软件评估工具,并生成包含有关价值、目的、数据和治理信息的离散文件。
最近,OpenAI宣布DALL—E 3正式上线ChatGPT Plus和企业版,这意味着,AI绘画对于OpenAI不再只是个图新鲜的玩具,而是开始实打实地赚钱了。
从行业的角度来说,这似乎是一种必然。质量越高,性能越好的AI绘画,所具有的技术壁垒也就越高,而在此基础上构筑的”付费墙”,也就成了顺理成章的事。可问题是,目前的AI绘画赛道上,除了三巨头之外,仍存在着数量庞大的开源AI绘画。
在绝对实力相对较弱,且处于开源的状态下,这些种类各异的AI绘画,究竟是如何找到自身的差异化优势,并实现盈利的?
https://www.8btc.com/article/6836700
10月27日,全球顶级机器人开发商波士顿动力(Boston Dynamics)在官网展示了一项新的研究,通过将ChatGPT、Spot以及其他AI模型相结合,开发了一种会说话的导游机器狗。
据悉,该机器狗能够根据文字、语音提示与人类进行交谈,同时提供了视觉问答功能,可以分析摄像头拍摄的画面,自动生成图像说明。
https://www.8btc.com/article/6836678
AI绘画简单来说就是“文生图”,是指输入一些描述性语言,AI可以以此生成创意画作。AIGC 技术的飞速发展使得“文生图”模型不断实现更加良好的生成效果,得益于此,无论是百度、网易这样的互联网大厂,还是快手这样的新锐公司纷纷争相入局,试图借助“文生图”这一新事物,探索业务上的更多新可能。