搜索
bottom↓
回复: 14

斯坦福“草泥马”火了:100美元就能比肩GPT-3.5!手机都能运行的那种。而且开源了!

[复制链接]

出16170入6148汤圆

发表于 2023-3-17 05:44:12 来自手机 | 显示全部楼层 |阅读模式
GPT-3.5自己“教”出了个旗鼓相当的对手AI。
一夜之间,大模型界又炸出个big news!

斯坦福发布Alpaca(羊驼,网友口中的“草泥马”):

只花100美元,人人都可微调Meta家70亿参数的LLaMA大模型,效果竟可比肩1750亿参数的GPT-3.5(text-davinci-003)。

而且还是单卡就能运行的那种,甚至树莓派、手机都能hold住!

还有一个更绝的“骚操作”。

研究所涉及到的数据集,是斯坦福团队花了不到500美元用OpenAI的API来生成的。

所以整个过程下来,就等同于GPT-3.5自己教出了个旗鼓相当的对手AI。

然后团队还说,用大多数云计算平台去微调训练好的模型,成本也不到100美元:

复制一个GPT-3.5效果的AI,很便宜,很容易,还很小。

而且团队还把数据集(秒省500刀)、代码统统都给开源了,这下子人人都能去微调个效果炸裂的对话AI:

项目在GitHub发布才半天时间,便已经狂揽1800+星,火爆程度可见一斑。

Django联合开发者甚至对斯坦福的新研究用“惊天大事”来形容:

不仅如此,斯坦福团队还搞了个demo,在线可玩的那种。

话不多说,我们现在就来看看这个“草泥马”的效果。

比肩davinci-003的草泥马Aplaca
什么是羊驼?它和美洲驼的区别是什么?

草泥马Aplaca给出的答案较为干练:

羊驼是一种小型骆驼科动物,原产于秘鲁、玻利维亚、厄瓜多尔和智利;它比美洲驼小,羊毛更细,也没有驼峰。

而后又简单的介绍了二者群居生活的不同。

同样的问题若是交给ChatGPT(GPT3.5-turbo),则答案就不会像草泥马Aplaca那般简洁:

对此,团队给出的解释是:

Alpaca的答案通常比ChatGPT短,反映出text-davinci-003的输出较短。

而后团队演示了让草泥马Alpaca写邮件:

写一封e-mail祝贺被斯坦福大学录取的新生,并提到你很高兴能亲自见到他们。

草泥马Alpaca对于这个任务也是信手拈来,直接给出了一个像模像样的邮件模板:

难度再次进阶,团队这次提出了让草泥马Alpaca写论文摘要的需求:

写一篇经过深思熟虑的机器学习论文摘要,证明42是训练神经网络的最优seed。

草泥马Alpaca给出的答案从内容上来看,非常符合大多数论文的摘要形式:试图回答什么问题、用了什么方法、结果如何,以及未来展望。

当然,也有迫不及待的网友亲自下场试验,发现草泥马Alpaca写代码也是不在话下。

不过即便草泥马Alpaca能够hold住大部分问题,但这并不意味着它没有缺陷。

例如团队便演示了一个例子,在回答“坦桑尼亚的首都是哪里”的问题时,草泥马Alpaca给出的答案是“达累斯萨拉姆”。

但实际上早在1975年便被“多多马”取代了。

除此之外,若是亲自体验过草泥马Alpaca就会发现,它……巨慢:

对此,有网友认为可能是使用的人太多的原因。

笔记本、手机、树莓派都能跑
Meta开源的LLaMA大模型,刚发布几周就被大家安排明白了,单卡就能运行。

所以理论上,基于LLaMA微调的Alpaca同样可以轻松在本地部署。

没有显卡也没关系,苹果笔记本甚至树莓派、手机都可以玩。

出0入0汤圆

发表于 2023-3-17 07:35:31 来自手机 | 显示全部楼层
百度:早说开源啊,我发布会多等两天都行

出0入18汤圆

发表于 2023-3-17 07:40:00 来自手机 | 显示全部楼层
这下国内科技公司有的玩了

出0入79汤圆

发表于 2023-3-17 07:43:15 | 显示全部楼层
国内自主知识产权雨后春笋般铺天盖地袭来。弯道超车,世界领先.

出40入45汤圆

发表于 2023-3-17 08:33:57 | 显示全部楼层
amazing030 发表于 2023-3-17 07:35
百度:早说开源啊,我发布会多等两天都行
(引用自2楼)

哈哈哈哈哈,百度那个 chatPPT 团队成员现在脑子里得有一万匹羊驼在奔跑
PPT 得飘红加粗加大,哈哈哈哈哈,chatPPT

出40入45汤圆

发表于 2023-3-17 08:43:57 | 显示全部楼层


https://github.com/tatsu-lab/stanford_alpaca

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

出0入12汤圆

发表于 2023-3-17 08:46:35 | 显示全部楼层
矩阵时间 发表于 2023-3-17 08:33
哈哈哈哈哈,百度那个 chatPPT 团队成员现在脑子里得有一万匹羊驼在奔跑
PPT 得飘红加粗加大,哈哈哈哈哈 ...
(引用自5楼)

不怕,自主升级也就两天的事儿...

出0入8汤圆

发表于 2023-3-17 08:50:24 | 显示全部楼层
这下国内各种自主开发Chat要出来了

出0入22汤圆

发表于 2023-3-17 09:00:58 | 显示全部楼层

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

出1310入193汤圆

发表于 2023-3-17 09:03:02 | 显示全部楼层
涌现出一大批科技公司
带来一大波红利
注册制公布之后
欣欣向荣的局面开启

出0入10汤圆

发表于 2023-3-17 09:07:25 来自手机 | 显示全部楼层
国内自主创新、自主知识产权的AI即将横空出世,吊打国外所有AI

出0入12汤圆

发表于 2023-3-17 09:33:35 | 显示全部楼层
麒麟chartAI,红旗chartAI,鸿蒙chartAI,汉chartAI,盘古chartAI,女娲chartAI..............

出280入168汤圆

发表于 2023-3-17 11:14:11 | 显示全部楼层
这个产品的 DEMO 和 ChatGPT 3.5 差距蛮大的,毕竟不是商业级的。

同样的问题:

“你能编写一个飞行射击的例子程序代码来说明 pygame 的使用方法吗?”

用 ChatGPT 3.5 给出的例子几乎就能使用了(有轻微的指令遗漏),

而用 Alpaca 则结果中的差错太多了,说明训练数据严重不足。

出0入4汤圆

发表于 2023-3-17 11:33:29 来自手机 | 显示全部楼层
有大佬在各种pi上面运行吗?

出0入442汤圆

发表于 2023-3-17 15:34:41 来自手机 | 显示全部楼层
kv2004 发表于 2023-3-17 09:33
麒麟chartAI,红旗chartAI,鸿蒙chartAI,汉chartAI,盘古chartAI,女娲chartAI..............
(引用自12楼)

no no no 把ai换成gpt就对了。。。。。

今天所有软件股全部暴涨,一看声明全是“近期将推出xxx gpt产品”。。。。。。。
回帖提示: 反政府言论将被立即封锁ID 在按“提交”前,请自问一下:我这样表达会给举报吗,会给自己惹麻烦吗? 另外:尽量不要使用Mark、顶等没有意义的回复。不得大量使用大字体和彩色字。【本论坛不允许直接上传手机拍摄图片,浪费大家下载带宽和论坛服务器空间,请压缩后(图片小于1兆)才上传。压缩方法可以在微信里面发给自己(不要勾选“原图),然后下载,就能得到压缩后的图片】。另外,手机版只能上传图片,要上传附件需要切换到电脑版(不需要使用电脑,手机上切换到电脑版就行,页面底部)。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|Archiver|amobbs.com 阿莫电子技术论坛 ( 粤ICP备2022115958号, 版权所有:东莞阿莫电子贸易商行 创办于2004年 (公安交互式论坛备案:44190002001997 ) )

GMT+8, 2024-4-29 07:47

© Since 2004 www.amobbs.com, 原www.ourdev.cn, 原www.ouravr.com

快速回复 返回顶部 返回列表