莆田版GPT-3开源:同等复现预训练模型GPT Neo,可在Colab上完成微调 2024-07-30 20:58:02 新智元报道 来源:Eleuther AI编辑:小匀【新智元导读】 GPT-3开源了?Eleuther AI推出的名为GPT-Neo的开源项目:公开发布的GPT-3同等复现预训练模型(1.3B & 2.7B),可在Colab上完成微调。……当然此 GPT-3非彼 GPT-3。近日,Eleuther AI在GitHub上推出了一个名为GPT-Neo的开源项目:GPT-3同等复现预训练模型(1.3B & 2.7B),并可在Colab上完成微调。虽然GPT-Neo与真正的GPT-3比,参数量仍然很小(较大版本也只与GPT-3最小模型的参数量),但开源又免费,仍然得到了「同性好友们」的认可!项目目前在GitHub上已经得到了近3k的star。Eleuther AI也表示,未来会进一步开源10B版本和原始大小版本的GPT3模型参数。「莆田版」GPT-3在Eleuther AI官网上,他们对GPT-Neo的描述是,「一系列基于变换器的语言模型的代码名称,这些模型的风格松散地围绕着GPT架构,我们计划对其进行训练和开源。我们的主要目标是复制一个GPT-3大小的模型,并将其免费开源给公众。」在这一过程中,我们将对替代架构和注意力类型进行实验,发布任何中间模型,并在我们的博客上写出任何发现。GPT-Neo模型是在Tensorflow-mesh中构建的,这将使他们能够使用同步的模型和数据并行来扩展到GPT-3和更大的规模。据Eleuther AI称,他们已经建立了大部分的模型,训练了GPT-2大小的模型,并实施了几个实验性的架构。目前的代码库应该能够扩展到GPT-3规模的模型。而他们接下来的步骤,将是正在努力完成GPT-2规模的模型复制。「到目前为止,2 们得到的单步训练的最大模型是200B参数。」GPT3: 一般人玩不起6月,OpenAI发表了一篇论文,详细介绍了GPT-3,这是一个机器学习模型,在一些自然语言基准上取得了强大的效果。在1750亿个参数——模型从历史训练数据中学习的部分——它是同类模型中最大的模型之一,也是最复杂的模型之一,能够进行原始类比,以某种风格写作,甚至完成基本代码。与GPT-3的前身GPT-2和GPT-1相比,OpenAI选择不将模型或训练数据集开源,而是选择通过商业API提供前者。该公司选择将GPT-3独家授权给微软,进一步缩减了访问权限,而OpenAI与微软有业务关系。微软已经向OpenAI投资了10亿美元,并建立了一台Azure托管的超级计算机,旨在进一步推动OpenAI的研究。来看下OpenAI的定价策略。自由探索Explore版 (我等):可以免费使用3个月,或者10万token,哪个先到按哪个算,占着不用可不行。Create版(普通用户): 100美元一个月,200万token每月,超出的部分1k token按8美分计算;Build版(VIP): 400美元一个月,1000万token每月,超出的部分1k token按6美分计算;Scale版(尊享版):如果你是也就是生产级的大规模用户,联系官方就好,有专人服务。这个200万token,能有多少字呢?大约相当于3000页的文本。这样说可能还是不直接,举个例子,莎士比亚全集是大约有90万个单词,折算到token的话大概能有120万。贫穷使人进(fu)步(ke)。现在,一些人开始在开源中重新创建GPT-3,但可能目前最值得期待的就是GPT-Neo了。关于Eleuther AIEleuther AI是一个由研究人员组成的草根集合,致力于开源人工智能研究。Connor Leahy,Leo Gao和Sid Black三人联合创立,于去年11月宣布推出GPT-Neo的开源项目,该项目基于GPT系列的设计原理,旨在复现GPT系列的各种项目。其中Sid是目前世界上最牛的TPU黑客之一。不过,也有人也认为这伙人炒作太多!「据我所知,他们正在大肆宣传他们无法兑现的夸大其词。」「例如,他们在OpenAI宣布几天后就运出了一个DALL-E repo,这是坏的,而且由于他们的架构不能扩展,他们已经把他们的GPT-3复制宣称走回了复制1.5B。」项目地址:https://github.com/EleutherAI/gpt-neo 赞 (0) 相关推荐 华为 AI 写诗以假乱真!我有点方。。。 将「雷科技Lite」收藏为我的小程序,不再错过精彩内容 这两天,华为的 AI 诗人"乐府"引起不少热度,用户通过华为的这个 AI,可以生成不同风格的古诗,五言,七言.绝句,律诗,有 ... 像人类一样认识世界,AI需要哪些底层思维? 作者 | 琰琰 近几年,多模态已经成为自然语言处理(NLP)领域的热点研究方向之一.得益于深度学习的兴起,大数据+大模型的双轮模式推动人工智能实现了跨越式发展.但大量实验证明,仅依靠"炼大模 ... 程序员门槛再被“神器”降低:只要会英文,就能写代码! 近日,OpenAI带着他们最新.最神自动编码神器Codex霸榜各大科技媒体头条,我们知道OpenAI是微软投资的通用人工智能平台,而GitHub是微软旗下的代码托管平台,这样微软出算力.OpenAI出 ... 想要什么变一个出来?|GPT-3的生成能力 想要什么变一个出来?那先变一段 " 无界社区 "的介绍? Input = " 无界社区 " Output: 无界社区 , 也 就 是 这 个 山 头 .这 里 ... 无法访问GPT-3?强大的克隆版GPT-J带着60亿参数来了 编辑|核子可乐.钰莹 去年 9 月,微软宣布与 OpenAI 达成独家授权协议,称该公司将使用 GPT-3 来"创建新的解决方案,利用先进自然语言生成的惊人能力".这一安排不会阻止 ... 一文看尽2020全年AI技术突破 晓查 蕾师师 发自 凹非寺 量子位 报道 | 公众号 QbitAI 2020年在紧张的防疫工作中悄然过去.这一年,人工智能却从来没有停下前进的脚步. 这一年人工智能行业有哪些新进展?为全球疫情做了哪些 ... [首藏作品](5696)把文本变成画作,AI对艺术“下手”了 把文本变成画作,AI对艺术"下手"了图为人工智能系统 DALL·E根据文本"穿着芭蕾舞裙遛狗的小萝卜"绘制的图像图片来源:OpenAI官网自然语言处理与视觉处理 ... 机器人作家:生产语言的人工智能的发展和风险 Bard @ 2021.03.09 , 20:14 出色的AI可以像人类一样书写,但它对其中意思却一无所知. 2020年6月,硅谷新型而强大的人工智能(AI)已经开始让技术专家眼花缭乱.加利福尼亚州旧 ... OpenAI亲谈:我们眼中的GPT-3、大规模语言模型的局限性与出路在哪 2020年10月14日,来自OpenAI.斯坦福大学HAI研究所等机构的研究人员召集在一起,讨论围绕GPT-3的开放研究问题. 参与研讨会的学者有各种研究背景,包括计算机科学.语言学.哲学.政治学.通 ... GPT-2:OpenAI的NLP商业化野望 自然语言处理(NLP)技术正在生活的方方面面改变着我们的生活. 客厅的智能音箱在跟你每天的对话中飞速进步,甚至开始跟你"插科打诨"来适应你的爱好习惯. 电商客服总是能在第一时间回复 ... 被捧上天的GPT-3,商业化之路怎么走? 对于我个人来说,刚刚步入媒体圈,职业生涯就将遭遇一次非常严重的AI威胁. 因为GPT-3来了,而且在写文章.编故事的能力上面比上一代更能打了. 今年5月,已经得到微软Azure算力加持的OpenAI放 ... 吴恩达新年公开推荐这个设计师,上千人点赞 2021年一开始,OpenAI在GPT-3方向上的又一重要突破,让吴恩达等大佬激动了. 之前给GPT-3一段话,就能写出一段小说. 现在它成功跨界--可以按照文字描述.生成对应图片! 简直就是&quo ...