2023-12-19 16:29 | 出处: AI梦工厂
原文来源:甲子光年
作者|刘杨楠
编辑|栗子
图片来源:由无界 AI生成
回顾人类历史,我们会发现一个惊人的事实——人类一直在不断被技术替代。最典型的就是大型机械出现后,大量劳动力被替换。
只是,大模型出现后,人们终于开始意识到,技术正在替代人类的大脑。很多人开始恐惧、焦虑,甚至希望技术中止发展。但技术的长河不会倒流,奇点已来,尽早拥抱新浪潮无疑是最明智的选择。
问题在于,以什么样的姿势拥抱。
经过一年发酵,大模型已经逐渐深入商业世界。但投资人、创业者、企业家、学术界和普罗大众对于这项新技术的认知千差万别,各方不断交流最新信息、更新认知,这是蔓延在过去一整年的事情。
在这个过程中,各位玩家也逐渐在大模型的世界找到自己的跑道,找到埋在万般困难之下的“真机会”。
不过,热情拥抱新浪潮的同时,也要保持冷静,认清当前的不足。
新技术降临早期,很容易出现所谓的“泡沫”。但回归理性后,很多人便会发现,理想很丰满,但现实很骨感。颠覆性技术带来新机遇的同时,新的挑战也随之而来。
今时今日,数据、算法、算力这三大人工智能核心要素依然在限制着大模型的能力;所有人都在谈的Agent究竟该如何定义,如何落地,仍没有定论;每一家正走在商业化道路上的企业也都在摸着石头过河。
12月1日,在2023甲子引力年终盛典的AI与元宇宙专场中,「甲子光年」邀请了30余位人工智能领域自身从业者,共同探讨了过去一年他们对于大模型的所思所感以及付诸的行动。
“大模型会将所有行业重做一遍”的论断几乎在ChatGPT刚推出时就反复被提及。但“重做什么”“如何重做”等细分命题,是所有大模型相关从业者用一年时间全力解答的课题。
大模型最大的颠覆性在于对人机交互方式的改变。
ChatGPT出现前的十年,尽管AlphaGo、AlphaZero已经超出了人类的部分能力边界,但在语音交互方面,经不起人类的10次挑战便会“暴露”智商缺陷。
但ChatGPT开启了一个新纪元。“ChatGPT对人机交互真正的颠覆性变革在于,它能够让人与机器实现人与人之间最自然的交互。”飞书产品副总裁齐俊元曾对「甲子光年」表示。
尽管大模型尚存的幻觉问题屡遭诟病,但换一个角度便会发现,幻觉某种程度上也是大模型智能涌现的结果,而智能涌现是大模型最有魅力的能力所在。
生成式AI提供了一种开放式的搜索形式,也带来很多想象空间,并已深入影响各行各业。著名数学家陶哲轩就曾预测,如果使用得当,到2026年,AI将成为数学研究和许多其他领域值得信赖的合著者。
可以预见,人机交互方式的改变也将催生颠覆式的产品和商业模式。ChatGPT本身就是大模型时代的第一款bot类产品,而OpenAI推出的按API调用频次的收费模式也成为新一代商业模式的雏形。
大模型出现后,整个大数据的使用将更加规范化。如果把数据比作“电力”,大模型就是“发电厂”,能够将数据的能量释放到各行各业。
昆仑万维董事长、CEO方汉则认为,这波AI浪潮是“大潮将起,落地为王”。这波AI大潮与2000年的互联网和2010年的移动互联网一样,将是下一个十年里最主要的创业主题。
面对商业化这道必答题,各家都在“摸着石头过河”。
总体来看,目前的大模型商业化大致可划分出四条路径——
第一条,MaaS,模型及服务。用户可以直接调用API来调用大模型能力,根据自身的业务需求构建专属模型。云厂商则会提供从数据、模型到应用服务的全周期管理和工具。
目前,微软云Azure、阿里云、华为云、腾讯云、百度云等云计算大厂,都已推出了MaaS服务。而MaaS成立的基础是一个通用的大模型底座和充沛的算力资源,这也决定了MaaS注定是大厂的游戏。
第二条,打造行业模型,模型企业直接根据行业需求提供一套整体的解决方案。这是很多初创企业选择的路。
“开发行业模型要专注于解决行业中的细分场景问题,不能只做“人”,而是要做“数智人”、做人的大脑。光有一个人,没有应用、没有应用场景,就不能驱动骨骼,不能有任何数据的交互。通过创建数智人,为其提供任务清单,才能使其能够完成各种任务。”卓世科技联合创始人、COO李伟伟分享道。
第三条,让开源成为一种商业模式。
长久以来,国内开源生态始终难以繁荣。一个根本原因在于,很多人都有着“开源=免费”的刻板思维;加之国内商业环境影响,单个的开源应用很难变现。而大模型的出现,则有可能让开源真正成为一种商业模式。
目前,大模型落地最难的就是应用层和模型层脱节,而开源社区正在成为应用层与模型层之间的“桥梁”——将模型用户、工具、软件等资源整合至社区后,各方从业者便能够直接通过社区平台实现创新想法,从而探索可能的商业模式。
第四条,Agent重塑社会生产力。
“Agent不仅会改变每个人与计算机的交互方式,还将颠覆软件行业,引领我们从键入命令到点击图标以来计算机领域最大的革命。”这段比尔·盖茨对Agent的判断给了从业者一个指向标。
已经有一群创业公司投身Agent的世界,澜码科技便是其中一家。“Agent出现后,人机交互会发生变化,专家知识又是其落地的一个重要前提条件。专家的个人知识可以通过标注的方式不断丰富和完善,通过不断标注来为系统提供反馈,进而形成一个所谓的知识闭环。这样系统就能持续地从专家的反馈中学习并提升性能。”澜码科技创始人、CEO周健表示。
尽管Agent在技术和商业上仍处在早期,但未来一旦成功,所产生的影响不仅是提高生产效率,而是能够完全提供一种全新的生产力。
纵使大模型打开了全新的商业想象,但客观来看,现在的大模型显然还不够“完美”。数据、算法、算力、成本、能源等关键要素都限制着大模型的落地表现。
众所周知,数据是大模型的“养料”。
许多业内人士的观点认为,大模型时代最缺的就是数据。数据是数字化转型的基础,没有数据,就没有好的语料,更谈不上训练大模型。
当然,只有数据还不够。如何将零散的数据制作为标准化的高质量数据集,并用于模型训练,是训练大模型的一大挑战。
有观点认为,国内由于多种原因,许多行业数据很难获取,且不透明。但事实上,数据不透明的问题几乎是全球各国各企业都存在的问题,而这或许也将在不远的未来倒逼政府、企业、学界等各界人士重视数据安全及数据融合的问题,并共同给出解决方案。
除了数据要素外,在大模型落地时,微调模型等算法能力也影响着大模型在场景中的性能。例如,真正要在很多场景里把大模型用好,很多时候要限制大模型的通用能力,让大模型能够针对具体的问题生成相应能力,这便需要拆解内容和问题,让大模型聚焦在颗粒度更细的问题上,这便很考验企业的微调能力。
而数据和算法能力要想真正在大模型中落实,还需要有充足的算力资源作为支撑。如果说,数据是AI的养料,算法是AI的灵魂,那么算力就是AI的动力源。
ChatGPT出世后,英伟达一跃站上食物链顶端。上半年,国内外科技大厂抢夺GPU的消息层出不穷。
然而,GPU价格高昂,H100、A100等高性能GPU更甚,并不是所有企业都有能力购买所需的算力。有业内人士告诉「甲子光年」,过去一年见了100多家客户,只有一家自己拥有算力,其他人都没有。大模型所需的算力紧俏程度可见一斑。
即使能买到卡,能否充分发挥GPU的性能也会影响最终的模型训练效果。如果一家企业部署的GPU数量从1000张增加到10000张,训练部署大模型所需的代价可能相差十倍,但最终的训练速度和产品迭代速度能否同样增长十倍仍是个未知数。
因此,如果未来在万卡集群上能够把速度最大化,将对大模型公司及其产品有至关重要的作用。比如,若万卡的部署时间从3个月缩减为1个月,就能节省数千万美元,产品迭代速度也会加快。
长远来看,大模型的大量算力消耗也给能源供应成了难题。
360集团创始人周鸿祎就在2023甲子引力年终盛典的巅峰论坛上分享道,“大模型什么都好,最致命的问题是能源问题。如果全球都建超大规模的大数据中心,有可能全球的能源根本就不够用。我觉得不用担心硅基生物超越碳基生物那一天,因为能源如果不能够进步,可能就会造成人工智能产业的停滞”。
但在这一刻到来前,理性拥抱技术浪潮,是尽早拿到下一个时代话语权的最佳方式。
在近期的《甲小姐对话周鸿祎》直播中,周鸿祎提出了新的观点:“首先要有AI信仰,然后要 All in AI,不断地拿自己的含‘AI’量来看。如果含‘AI’量太低,那说明信仰还不够,All in还不够。”
可以看到,大模型点亮了奇点时刻,带来无限机遇的同时也有不可避免的挑战。以大模型为主题的新一轮商业竞争已经全面拉开,AI或将成为所有企业的基本核心竞争力。而现在,只是一切的起点。