armok. 发表于 2023-3-17 05:44:12

斯坦福“草泥马”火了:100美元就能比肩GPT-3.5!手机都能运行的那种。而且开源了!

GPT-3.5自己“教”出了个旗鼓相当的对手AI。
一夜之间,大模型界又炸出个big news!

斯坦福发布Alpaca(羊驼,网友口中的“草泥马”):

只花100美元,人人都可微调Meta家70亿参数的LLaMA大模型,效果竟可比肩1750亿参数的GPT-3.5(text-davinci-003)。

而且还是单卡就能运行的那种,甚至树莓派、手机都能hold住!

还有一个更绝的“骚操作”。

研究所涉及到的数据集,是斯坦福团队花了不到500美元用OpenAI的API来生成的。

所以整个过程下来,就等同于GPT-3.5自己教出了个旗鼓相当的对手AI。

然后团队还说,用大多数云计算平台去微调训练好的模型,成本也不到100美元:

复制一个GPT-3.5效果的AI,很便宜,很容易,还很小。

而且团队还把数据集(秒省500刀)、代码统统都给开源了,这下子人人都能去微调个效果炸裂的对话AI:

项目在GitHub发布才半天时间,便已经狂揽1800+星,火爆程度可见一斑。

Django联合开发者甚至对斯坦福的新研究用“惊天大事”来形容:

不仅如此,斯坦福团队还搞了个demo,在线可玩的那种。

话不多说,我们现在就来看看这个“草泥马”的效果。

比肩davinci-003的草泥马Aplaca
什么是羊驼?它和美洲驼的区别是什么?

草泥马Aplaca给出的答案较为干练:

羊驼是一种小型骆驼科动物,原产于秘鲁、玻利维亚、厄瓜多尔和智利;它比美洲驼小,羊毛更细,也没有驼峰。

而后又简单的介绍了二者群居生活的不同。

同样的问题若是交给ChatGPT(GPT3.5-turbo),则答案就不会像草泥马Aplaca那般简洁:

对此,团队给出的解释是:

Alpaca的答案通常比ChatGPT短,反映出text-davinci-003的输出较短。

而后团队演示了让草泥马Alpaca写邮件:

写一封e-mail祝贺被斯坦福大学录取的新生,并提到你很高兴能亲自见到他们。

草泥马Alpaca对于这个任务也是信手拈来,直接给出了一个像模像样的邮件模板:

难度再次进阶,团队这次提出了让草泥马Alpaca写论文摘要的需求:

写一篇经过深思熟虑的机器学习论文摘要,证明42是训练神经网络的最优seed。

草泥马Alpaca给出的答案从内容上来看,非常符合大多数论文的摘要形式:试图回答什么问题、用了什么方法、结果如何,以及未来展望。

当然,也有迫不及待的网友亲自下场试验,发现草泥马Alpaca写代码也是不在话下。

不过即便草泥马Alpaca能够hold住大部分问题,但这并不意味着它没有缺陷。

例如团队便演示了一个例子,在回答“坦桑尼亚的首都是哪里”的问题时,草泥马Alpaca给出的答案是“达累斯萨拉姆”。

但实际上早在1975年便被“多多马”取代了。

除此之外,若是亲自体验过草泥马Alpaca就会发现,它……巨慢:

对此,有网友认为可能是使用的人太多的原因。

笔记本、手机、树莓派都能跑
Meta开源的LLaMA大模型,刚发布几周就被大家安排明白了,单卡就能运行。

所以理论上,基于LLaMA微调的Alpaca同样可以轻松在本地部署。

没有显卡也没关系,苹果笔记本甚至树莓派、手机都可以玩。

amazing030 发表于 2023-3-17 07:35:31

百度:早说开源啊,我发布会多等两天都行

tang_qianfeng 发表于 2023-3-17 07:40:00

这下国内科技公司有的玩了

BOERLBH 发表于 2023-3-17 07:43:15

国内自主知识产权雨后春笋般铺天盖地袭来。弯道超车,世界领先.

矩阵时间 发表于 2023-3-17 08:33:57

amazing030 发表于 2023-3-17 07:35
百度:早说开源啊,我发布会多等两天都行
(引用自2楼)

哈哈哈哈哈,百度那个 chatPPT 团队成员现在脑子里得有一万匹羊驼在奔跑
PPT 得飘红加粗加大,哈哈哈哈哈,chatPPT

矩阵时间 发表于 2023-3-17 08:43:57



https://github.com/tatsu-lab/stanford_alpaca

KirkY 发表于 2023-3-17 08:46:35

矩阵时间 发表于 2023-3-17 08:33
哈哈哈哈哈,百度那个 chatPPT 团队成员现在脑子里得有一万匹羊驼在奔跑
PPT 得飘红加粗加大,哈哈哈哈哈 ...
(引用自5楼)

不怕,自主升级也就两天的事儿...

了无 发表于 2023-3-17 08:50:24

这下国内各种自主开发Chat要出来了

G.ai 发表于 2023-3-17 09:00:58

lb0857 发表于 2023-3-17 09:03:02

涌现出一大批科技公司
带来一大波红利
注册制公布之后
欣欣向荣的局面开启

ylei12 发表于 2023-3-17 09:07:25

国内自主创新、自主知识产权的AI即将横空出世,吊打国外所有AI

kv2004 发表于 2023-3-17 09:33:35

麒麟chartAI,红旗chartAI,鸿蒙chartAI,汉chartAI,盘古chartAI,女娲chartAI..............

chunjiu 发表于 2023-3-17 11:14:11

这个产品的 DEMO 和 ChatGPT 3.5 差距蛮大的,毕竟不是商业级的。

同样的问题:

“你能编写一个飞行射击的例子程序代码来说明 pygame 的使用方法吗?”

用 ChatGPT 3.5 给出的例子几乎就能使用了(有轻微的指令遗漏),

而用 Alpaca 则结果中的差错太多了,说明训练数据严重不足。

chendaon 发表于 2023-3-17 11:33:29

有大佬在各种pi上面运行吗?

wye11083 发表于 2023-3-17 15:34:41

kv2004 发表于 2023-3-17 09:33
麒麟chartAI,红旗chartAI,鸿蒙chartAI,汉chartAI,盘古chartAI,女娲chartAI..............
(引用自12楼)

no no no 把ai换成gpt就对了。。。。。

今天所有软件股全部暴涨,一看声明全是“近期将推出xxx gpt产品”。。。。。。。
页: [1]
查看完整版本: 斯坦福“草泥马”火了:100美元就能比肩GPT-3.5!手机都能运行的那种。而且开源了!