ChatGPT大模型训练一次最多1200万美元但也不算太贵

玩机攻略 2023-02-21 10:27:53   点击量 : 14769  

作者 : 生活常识网

ChatGPT大模型训练一次最多1200万美元但也不算太贵

随着以ChatGPT为代表的生成式AI兴起,其背后以大模型为基础的人工智能成为业界投入的方向。

所谓“大模型”,通常是在无标注的大数据集上,采用自监督学习的方法进行训练。之后在其他场景的应用中,开发者只需要对模型进行微调,或采用少量数据进行二次训练,就可以满足新应用场景的需要。

据腾讯研究院,当前的人工智能大多是针对特定的场景应用进行训练,生成的模型难以迁移到其他应用,属于“小模型”的范畴。整个过程不仅需要大量的手工调参,还需要给机器喂养海量的标注数据,这拉低了人工智能的研发效率,且成本较高。

相比之下,大模型的改进可以使所有的下游小模型受益,大幅提升人工智能的使用场景和研发效率。

同时,在大模型的框架下,ChatGPT所使用的GPT模型,每一代参数量均高速扩张,预训练的数据量需求和成本亦快速提升。

国盛证券计算机分析师刘高畅、杨然在发表于2月12日的报告《Chatgpt 需要多少算力》中估算,GPT-3训练一次的成本约为140万美元,对于一些更大的LLM模型,训练成本介于200万美元至1200万美元之间。

这一成本于全球科技大企业而言并不便宜,但尚在可接受范围内。

初始投入近十亿美元,单日电费数万美元

国盛证券估算,今年1月平均每天约有1300万独立访客使用ChatGPT,对应芯片需求为3万多片英伟达A100GPU,初始投入成本约为8亿美元,每日电费在5万美元左右。

1)计算假设:

英伟达A100:

根据OneFlow报道,目前,NVIDIA A100是AWS最具成本效益的GPU选择。

英伟达DGXA100服务器:

单机搭载8片A100GPU,AI算力性能约为5PetaFLOP/s,单机最大功率约为6.5kw,售价约为19.9万美元/台。

标准机柜:

19英寸、42U。单个DGXA100服务器尺寸约为6U,则标准机柜可放下约7个DGXA100服务器。

则,单个标准机柜的成本为140万美元、56个A100GPU、算力性能为35PetaFLOP/s、最大功率45.5kw。

2)芯片需求量:

每日咨询量:

根据Similarweb数据,截至2023年1月底,chat.openai.com网站(即ChatGPT官网)在2023/1/27-2023/2/3这一周吸引的每日访客数量高达2500万。

假设以目前的稳定状态,每日每用户提问约10个问题,则每日约有2.5亿次咨询量。

A100运行小时:

假设每个问题平均30字,单个字在A100GPU上约消耗350ms,则一天共需消耗729,167个A100 GPU运行小时。

A100需求量:

对应每天需要729,167/24=30,382片A100 GPU同时计算,才可满足当前ChatGPT的访问量。

3)运行成本:

初始算力投入:

以前述英伟达DGXA100为基础,需要30,382/8=3,798台服务器,对应3,798/7=542个机柜。

则,为满足ChatGPT当前千万级用户的咨询量,初始算力投入成本约为542*140=7.59亿美元。

每月电费:

用电量而言,542*45.5kw*24h=591,864kwh/日。

参考HashrateIndex统计,我们假设美国平均工业电价约为0.08美元/kwh。则,每日电费约为2,369,640*0.08=4.7万美元。

训练成本:公有云下,单次百万至千万美元

国盛证券基于参数数量和token数量估算,GPT-3训练一次的成本约为140万美元;对于一些更大的LLM模型采用同样的计算公式,训练成本介于200万美元至1200万美元之间:

1)基于参数数量和token数量,根据OneFlow估算,GPT-3训练一次的成本约为139.8万美元:

每个token的训练成本通常约为6N(而推理成本约为2N),其中N是LLM的参数数量;假设在训练过程中,模型的FLOPS利用率为46.2%,与在TPUv4芯片上进行训练?的PaLM模型(拥有5400亿参数)一致。

2)对于一些更大的LLM模型(如拥有2800亿参数的Gopher和拥有5400亿参数的PaLM),采用同样的计算公式,可得出,训练成本介于200万美元至1200万美元之间。

国盛证券认为,在公有云上,对于以谷歌等全球科技大企业而言,百万至千万美元级别的训练成本并不便宜,但尚在可接受范围内、并非昂贵。

chatgat3不收费了吗

ChatGPT正式收费了!每月20美元(约134人民币)。
别慌,免费版的还在。
史上最强AI聊天机器人ChatGPT自推出以来,迅速刮起一场席卷整个科技行业的热潮。
微软忙不迭拿出100亿美元要和背后的OpenAI套近乎,并宣布将其整合在to B和To C的几乎全部产品线上,什么Office全家桶、Bing搜索、Azure云服务,只要能上的全上一遍。
微软老对手谷歌那边,也不断有高管出来表态,说要不采取行动,等ChatGPT越学越精,别说谷歌搜索了,整个谷歌恐怕就要无了。
连表面上和ChatGPT关系不大的英伟达都躺赢了一波。
因为ChatGPT爆火,投资者对AI计算的前景竞相追捧,黄仁勋2023年的财富增加了51亿美元,单月排名福布斯财富榜单第一。
当然最乐的还得是普通用户,拿它聊天解闷、冒充专家去答题都是小意思了,有人拿它「辅助」写论文,还给署了名。还有人拿去做作业,把老师唬得一愣一愣的。
这里姑且不谈用AI工具做这些事情的道德争议,它导致的一个直接结果就是:
ChatGPT卡爆了。新申请API的用户进入「等待名单」,而且高峰期用户登陆需要经常性排队,还时不时卡顿、停止响应。
怎么解决?面对摇钱树,OpenAI选择了最真实的办法:收费,每月20美元,起。
今天,OpenAI正式官宣了ChatGPT的「试点订阅计划」,这项付费服务被称为ChatGPT Plus。
ChatGPT Plus强在哪里?
OpenAI官网显示,与基础级别的ChatGPT相比,这个Plus版有不少好处,即使在高峰期也能普遍使用ChatGPT,不用排队,响应时间更快,并能优先获得新功能和改进。
快速通道是个很香的功能,毕竟在高峰期访问ChatGPT,必须等待几个小时才能进入。仅此一项功能就能吸引许多用户前来订阅。
至于官网提到的新功能和改进的想法也令人期待,不过期待的主要是没人知道这些新功能是什么。
鉴于声称提升巨大的ChatGPT-4会在今年推出。一种可能的猜测是,OpenAI可能只为付费用户提供该产品。
目前,ChatGPT Plus暂时只对美国地区的用户开放。OpenAI说,将在未来几个月内开始邀请等待名单上的人,预计很快就能将收费版服务范围扩展到其他国家和地区。
OpenAI在官博上是这么说的:
「我们推出ChatGPT作为研究预览,以便我们能够更多地了解该系统的优点和缺点,并收集用户反馈,帮助我们改进其局限。从那时起,数百万人给了我们反馈,我们做了几个重要的更新,我们看到用户在一系列专业用例中发现了价值,包括起草和编辑内容,集思广益,辅助编程和学习新课题。」
OpenAI暗示,ChatGPT Plus可能是未来几个计划中的第一个。该公司在博文中说,除了API之外,还在积极探索更多的低成本计划。
又是Pro又是Plus,你卖手机呢?
就在不到两周之前,有网友发现OpenAI似乎在内测付费版ChatGPT——「ChatGPT Pro」,每月42美元(约285人民币)。
虽然42美元的价格确实高,但优势也很明显。图中对这个Pro内测版的描述为:
全天的高可用性
更快的响应时间
优先使用新功能
从网友的截图中的描述上看,这个从未官宣的Pro内测版,和此次正式官宣的Plus版,不能说是一模一样,只能说是如出一辙。
此次OpenAI的官方公告中,对于Plus版的特性说明,照比Pro内测版本只做了一些措辞上的少许修改。
我们目前还并不清楚,这次的Plus和之前的Pro到底区别在哪儿。
当然,也不排除OpenAI被外国网友骂的太狠,决定换个名字降价了。
收费是为了更好地免费
好消息是,免费版ChatGPT将继续存在,不会取消。
OpenAI表示,推出收费版,是为了更多人能更顺利地访问免费版。
「我们热爱我们的免费用户,并将继续提供ChatGPT的免费版。通过提供这种订阅价格,我们将能够帮助支持尽可能多的人获得免费访问,并计划根据你们的反馈和需求,来完善和扩大这项服务。」
随着ChatGPT激增的用户量,OpenAI自己也表示免费服务是不可持续的,收费已是必然趋势。
那来算笔账,OpenAI到底要花多少钱呢?
据AI行业数据分析师Tom Goldstein说,OpenAI每月至少花费300万美元用于运行成本。
ChatGPT托管在微软的Azure云上,因此,OpenAI无需购买设置物理机房。
按照目前的费率,微软对单个A100 GPU每小时收费3美元,在ChatGPT上生成的每个单词收费0.0003美元。
ChatGPT的回复通常至少有30个单词,因此ChatGPT的单个回复至少要花费公司1美分。
算下来一个月至少得花300万美刀。
网友Yusuke说,当你注册ChatGPT账号后,根据选择的套餐每月有固定的请求数量。
如果超过固定份额则会产生额外费用到下个周期才能继续使用了。
要说这次收费,从动机上看是完全可以理解的事情。
从2019年OpenAI以10亿美元「卖身」微软开始,其作为非盈利机构的身份就遭遇了越来越多的质疑。最近要拿微软100亿美元,也是有条件的。
据此前报道,这100亿美元的交易只是一系列复杂交易的一部分,在微软收回投资的资金前,该公司将获得OpenAI营业利润的75%。收回投资金额后,微软将持有OpenAI 49%的股份。
面对盈利压力,顶着近300亿美元估值的OpenAI其实是很难捱的。目前OpenAI的主要收入模式是与AI厂商合作,提供算法、模型的服务,大概连「卖解决方案」的都算不上。
这回赶上了ChatGPT出圈爆火,无异于天上掉钱,抓紧时间收一波,也是正常。
在涉及公司盈利模式,甚至是发展战略的大事上,网友的意见嘛,可以参考,但也不能太当回事了。
不过话说回来,既然OpenAI计划过Pro,又推出了Plus,期待一个ChatGPT「青春版」不过分吧?一周前微软宣布了对OpenAI近几年来的投资情况,巩固了其作为这家初创公司独家云提供商的地位。微软的老板萨蒂亚纳德在一份声明中说:“我们与OpenAI简历了合作伙伴关系,我们的共同目标是负责推进尖端人工智能研究,并将人工智能民主化为一个新技术平台。”
据外媒报道,在OpenAI在下一个阶段的目标是各行各业的开发人员和组织能够使用Azure访问AI基础设施、模型、工具链,来构建它们的应用程序。
此次最新合作的财务和细节没有公开,但是据传价值高达100亿美元。由微软牵头的注入支持也带来了其他投资者的支持,这是微软第三次入股OpenAI。
OpenAI方面
在OpenAI精心打造的各种机器学习模型之后,微软已经通过谈判达成了一项新的协议,其中包括自动化结对程序员工具GitHub Copilot;文本转图像模型DALL·E2;及其最新的文本生成机器人 ChatGPT。微软还将会利用OpenAI的转悠技术在其Azure云平台上扩展人工智能产品。上周,两家企业的Azure OpenAI服务全面上市。
微软方面
作为OpenAI独家云提供商,微软将托管和部署该公司的研发模型,以及产品和API服务。最新的投资对于两家企业来说都是双赢的。
据悉OpenAI的最新猛兽GPT-将会很快就出现。

最近大火的chatGPT是什么?

】:
这是一个好问题,我来说说个人看法。

首先,当前国内很多高校确实设立了不少人工智能相关的专业,很多老师的实验室也输出了大量的前沿创新成果,但是要想做出ChatGPT不仅仅比拼人力,更是在比拼算力,这是当前很多团队都很无奈的事情。

人工智能当前的大量创新都是基于大模型开展的,而这种大模型对于数据和算力的消耗是非常巨大的,而绝大部分高校,包括国外的高校,都没有这样强大的资源支撑,所以即使了解ChatGPT的原理也无法开展相关的项目研究。

ChatGPT是一个工具,但是ChatGPT也是一个产品,这个产品的研发经过了多次迭代,这个过程需要耗费巨大的资金,目前国内能够承担这个资金规模的企业并不算多,即使一些头部大厂有能力开展前期的研发,但是由于人工智能产品的落地前景并不明朗,所以这种投资本身的风险也是巨大的。

实际上,在经历了多轮“烧钱”之后,ChatGPT也才刚刚开启商业化应用,之后能否取得成功还是一个未知数,而且目前在多个领域针对于ChatGPT的声音也非常杂,这给后续ChatGPT的发展也带来了诸多的不确定性。

对于资源本身就非常有限的高校团队来说,开展一些更务实的课题项目是绝大多数老师的选择,而对于处在产业领域的研发团队来说,ChatGPT的不确定性因素太多了。

好消息是目前一些国内大型团队已经开始在规划对标产品了,在这个春节期间跟我的学生探讨ChatGPT时,有两名同学告诉我他们所在的团队已经明确要开启对标ChatGPT产品的研发了。

国内互联网领域的创新热度一直是比较高的,但是创新不能脱离场景,在国内资源比较有限的情况下,极少有团队敢开启ChatGPT这样的项目,这需要巨大的勇气,因为在很多人的眼里,这是一种自杀行为。

实际上,国内很多创业者从来不缺乏想象力,大概在15年前,我就遇到过一名创业者,我参加了一场他的路演,他当时要做的事情跟ChatGPT就非常接近。

从我个人的角度来看,很多国内研发团队的创新格局之所以没有全面打开,很重要的一个原因就是大部分团队都不敢折腾,都很珍惜手里来之不易的那点资源。

本文来自网络,不代表生活常识网立场,转载请注明出处:http://sdsy56.com/wjgl/6762.html

上一篇:

下一篇:

声明: 我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理,本站部分文字与图片资源来自于网络,转载是出于传递更多信息之目的,若有来源标注错误或侵犯了您的合法权益,请立即通知我们(管理员邮箱:15053971836@139.com),情况属实,我们会第一时间予以删除,并同时向您表示歉意,谢谢!

Copyright © 2022-2024 生活常识网 版权所有
生活常识网所有文章及资料均为作者提供或网友推荐收集整理而来,仅供爱好者学习和研究使用,版权归原作者所有。
如本站内容有侵犯您的合法权益,请和我们取得联系,我们将立即改正或删除。客服邮箱:15053971836@139.com

备案号:鲁ICP备2022001955号-6 联系方式:15053971836@139.com

网站地图