2023-06-16 11:48 | 出处: 硅星人
来源:硅星人 (ID:guixingren123)
作者:Juny
编辑丨VickyXiao
图片来源:由无界 AI工具生成
最近几个月来,似乎每个人都在日常生活中跟ChatGPT、Bard等AI机器人聊得热火朝天,让它们来帮忙写邮件、写总结、做计划。但有个普遍的现象是,一旦当人们切换到工作模式时,这些生成式AI工具便很少出现在大家的工作流程中,甚至被一些公司明令禁止。
AI能力如此强大,为什么企业们不用?
这背后的核心原因其实很简单——每个企业的数据安全和隐私问题都太重要。没有企业敢把自己的“命脉”完完全全地交在还并未发展成熟、并由其他大型公司掌控的AI手上。
那么,是否有办法解决这个棘手的问题,进而在企业端最大化地发掘生成式AI的潜力呢?其实从2019年开始,就有一家名为Cohere的AI创业公司在密切关注这个问题并不断提出解决方案。
长期以来,企业级的生成式AI都是一个相对小众且壁垒较高的市场,但Cohere凭借着成熟的技术和敏锐的嗅觉得到了一众大佬和巨头的支持。目前Cohere的投资者不仅包括英伟达、甲骨文、Salesforce等巨头,同时还有图灵奖得主Geoffrey Hinton、斯坦福AI教授李飞飞等一众圈内大佬。不久前,YouTube 的前首席财务官 Martin Kon 也选择加入 Cohere担任总裁和首席运营官。
英伟达、甲骨文和Salesforce都在押注Cohere
图源:Crunchbase
乘着ChatGPT爆火的东风,今年以来,Cohere的潜力开始被越来越多的人的看到并进入了估值飙升的快车道,目前已成为全球AIGC赛道仅次于OpenAI和Antropic的第三大独角兽。
Cohere成立于加拿大多伦多,于2019年由Aidan Gomez、Ivan Zhang和Nick Frosst共同创立。三人本科都就读于多伦多大学计算机科学专业,按照入学时间推算,三人目前应该都未超过30岁。
Cohere的创始团队
图源:Cohere官网
其中,Aidan Gomez在2017年本科期间就参与了由谷歌大脑团队研究并作为署名者之一发表了名为《Attention is All You Need》的论文,而这篇论文就是日后大名鼎鼎的Transformer机器学习架构的开端,也是发展谷歌BERT、OpenAI的GPT 等未来革命性架构的基石。
在同一年,Aidan Gomez和同系的同学Ivan Zhang创立了一个非营利人工智能研究社区For.ai,用以支持和链接世界各地的人工智能独立研究者。
本科毕业后,Aidan Gomez前往牛津大学攻读计算机科学的博士学位,同时也加入了由“深度学习之父”、图灵奖获得者Geoffrey Hinton领导的谷歌AI团队,基于Transformer架构进行进一步研究。在谷歌大脑的Hinton团队之中,Aidan Gomez结识了一直从事机器学习和认知科学研究的Nick Frosst。
在之后两年中,通过研究的深入,大家了解到Transformer可以扩展为性能出色的大型神经网络,并在语言相关的任务上表现十分出色。包括Aidan Gomez在内的一些Transformer论文撰写者们都开始思考这背后所蕴藏的商业化机会,目前除了Llion Jones仍在谷歌工作,其他七位作者都纷纷“下海”创业。
其中,Aidan Comez则与Nick Frosst和Ivan Zhang共同创立了Cohere。跟谷歌、微软等实力雄厚公司去重金训练大模型不同,在2019年Cohere成立开始,他们就专注于企业用例,试图根据不同企业的专有数据去创建定制化的大语言模型。
简单来说,Cohere的目标是要成为各类开发人员的默认 NLP 工具包,让各类开发人员都可以使用大型神经网络和最先进AI来解决任何语言相关问题,但却不依托于任何公共云,让模型能在私有云或本地部署中运行。
目前,Cohere的主要产品主要围绕着企业日常运营中的三个关键领域:文本生成、文本分类和文本检索,几乎覆盖了企业生产中所有跟文字有关的领域。
文本生成部分主要有Summarize、Generate、Command Model三个产品。Summarize是一个由大型语言模型驱动的文本摘要生成器,能快速概述和总结文档的关键点,可以支持输入10万个字符和文本格式选项。Generate则是一个内容生成器,可以为各种目生成独特的内容,比如电子邮件和产品描述等。
下面,再重点介绍一下Command Model。Command是Cohere推出的一个能够接受用户个性化命令训练的文本生成模型。也就是说,企业用户在将自己的数据和Command结合之后,就可以产生一个自己独有的语言模型,能够在企业的实际业务中立即发挥作用。
Command Model
图源:Cohere
值得注意的是,作为一个只有520 亿个参数的模型,Command的准确性表现此前却超过了其他更大规模训练的模型,在不久前被斯坦福大学的语言模型全面评估(HELM)评为世界上最有能力的大型语言模型。
图源:斯坦福大学的语言模型全面评估(HELM)官网
文本检索部分,包括Embed、Semantic Search、Rerank三个产品。
对于希望构建自己的文本分析应用程序的机器学习团队,Embed可以帮助他们快速发现趋势,并支持100多种语言。Semantic Search是一个强大的搜索工具,用户只需要简单使用API,就可以使用该搜索功能,能够支持基于查询的含义而不仅仅是关键词来返回多种信息,并且不受语言的限制。Rerank可以基于语义相关性分析现有工具的搜索结果并进行排名,从而提供更丰富、更相关的结果,且对用户的干预或编程经验要求很小。
文本分类部分主要产品为Classify,该功能使用户能够个性化的组织信息来帮助内容审核、用户分析和进行聊天机器人体验。比如它能够通过快速标记不同类别的客户来进行高效的客户服务,也可以识别正面和负面的社交媒体评论来更好地了解客户的反馈等。
图源:Cohere
Cohere 的商业模式是先承担创建大型的Transformer神经网络的成本,然后再将有需求公司连接到这些网络,公司则按使用情况进行付费。Cohere的主要特点是为客户提供了包括私有云、本地部署、Cohere托管云和其他云伙伴AWS、谷歌等多种数据托管选项,让用户根据自身需要进行选择,让客户对数据拥有控制权。
对于希望学习原型设计并成为社区一部分的开发者,Cohere提供了免费的、限制使用率的使用。然而,如果希望进入生产、训练自定义模型、访问所有端点并接收增强的客户支持,将需要支付费用。目前Cohere的客户包括Spotify、Jasper、HyperWrite等。
从价格来看,嵌入功能下,默认模型每 100 万个Token 40 美分,企业自定义的模型80 美分,生成功能下,默认模型每 100 万个Token 15 美元,自定义模型30 美元,总结功能下,每100万个Token15美元等。
Cohere不同功能的价格情况
图源:Cohere
不过,此前Cohere的这个定价还算很有优势,但在昨天OpenAI大降价之后,预计也会给Cohere带来不小的冲击。比如OpenAI的嵌入模型价格直接跳水75%,每千token只需0.0001美金,也就是1美元一千万token,远远低于Cohere。
瞄准企业级AI数据安全痛点的Cohere,在当前的AI用户端厮杀中脱颖而出,包括VC、科技巨头和人工智能领域的大佬们都给它投去了支持票。2021年正式迈入商业化以来,Cohere的估值也节节攀升,目前已达到约22亿美元,在AIGC赛道仅次于微软支持的OpenAI和谷歌支持的Anthropic。
在Cohere成立之初,它的人工智能学术色彩似乎更为浓郁。在2021年和2022年的Cohere A轮和B轮融资中,当时的AIGC赛道的投资还在寒冬中,有谁给Cohere投去了支持资金呢?在这两轮的投资列表中,我们都看到了以下几位AI大佬的身影。
图源:Crunchbase
除了几个创始人在多伦多直接跟随学习过的“深度学习之父”、图灵奖得主Geoffrey Hinton之外,还包括斯坦福大学教授、视觉实验室负责人李飞飞,加州大学伯克利分校教授、伯克利人工智能实验室主任Pieter Abbeel,多伦多大学教授、前Uber人驾驶汽车技术研究中心主任Raquel Urtasun,个个都是人工智能领域的学术大咖。
而在本月初宣布的最新一轮融资中,在AIGC的热潮中,Cohere也得到了更多领域内科技公司的关注。其中包括人工智能最强“军火商”英伟达以及云巨头Salesforce和甲骨文。目前的融资总额已经达到4.39亿美元。
Cohere的迅速发展离不开深厚的技术背景和赛道选择。从大模型的角度来说,Cohere 目前可能并不是市场上最领先的,但他们敏锐地抓到了AIGC企业端应用的痛点,能够在首先满足企业安全性需求的前提下,再进一步的提供内容生成、摘要、搜索等领域的服务。
他们的商业模式使得大量公司能够在无需斥重金构建自己模型的情况下自定义地接入大型神经网络,并通过细分业务模块,让公司能根据使用情况来进行付费,从而达到一种双赢的状态。
从目前Cohere 越来越高的热度和OpenAI最近大规模的降价和API升级来看,AIGC的战火在用户端正在一路蔓延到企业战场。而届时,或许一场真正的AI生产力革命才会真正开始。