1800亿参数,世界顶级开源大模型Falcon官宣!碾压LLaMA 2,性能直逼GPT-4

一夜之间,世界最强开源大模型Falcon 180B引爆全网!

1800亿参数,Falcon在3.5万亿token完成训练,直接登顶Hugging Face排行榜。

基准测试中,Falcon 180B在推理、编码、熟练度和知识测试各种任务中,一举击败Llama 2。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

1800亿参数,世界顶级开源大模型Falcon官宣!碾压LLaMA 2,性能直逼GPT-4

甚至,Falcon 180B能够与谷歌PaLM 2不差上下,性能直逼GPT-4。

不过,英伟达高级科学家Jim Fan对此表示质疑,

– Falcon-180B的训练数据中,代码只占5%。

而代码是迄今为止对提高推理能力、掌握工具使用和增强AI智能体最有用的数据。事实上,GPT-3.5是在Codex的基础上进行微调的。

– 没有编码基准数据。

没有代码能力,就不能声称「优于GPT-3.5」或「接近GPT-4」。它本应是预训练配方中不可或缺的一部分,而不是事后的微调。

– 对于参数大于30B的语言模型,是时候采用混合专家系统(MoE)了。到目前为止,我们只看到OSS MoE LLM

1800亿参数,世界顶级开源大模型Falcon官宣!碾压LLaMA 2,性能直逼GPT-4

一起来看看,Falcon 180B究竟是什么来头?

1800亿参数,世界顶级开源大模型Falcon官宣!碾压LLaMA 2,性能直逼GPT-4

世界最强开源大模型

此前,Falcon已经推出了三种模型大小,分别是1.3B、7.5B、40B。

官方介绍,Falcon 180B是40B的升级版本,由阿布扎比的全球领先技术研究中心TII推出,可免费商用。

1800亿参数,世界顶级开源大模型Falcon官宣!碾压LLaMA 2,性能直逼GPT-4

这次,研究人员在基底模型上技术上进行了创新,比如利用Multi-Query Attention等来提高模型的可扩展性。

1800亿参数,世界顶级开源大模型Falcon官宣!碾压LLaMA 2,性能直逼GPT-4

对于训练过程,Falcon 180B基于亚马逊云机器学习平台Amazon SageMaker,在多达4096个GPU上完成了对3.5万亿token的训练。

总GPU计算时,大约7,000,000个。

Falcon 180B的参数规模是Llama 2(70B)的2.5倍,而训练所需的计算量是Llama 2的4倍。

具体训练数据中,Falcon 180B主要是RefinedWe数据集(大约占85%) 。

此外,它还在对话、技术论文,以及一小部分代码等经过整理的混合数据的基础上进行了训练。

这个预训练数据集足够大,即使是3.5万亿个token也只占不到一个epoch。

1800亿参数,世界顶级开源大模型Falcon官宣!碾压LLaMA 2,性能直逼GPT-4

官方自称,Falcon 180B是当前「最好」的开源大模型,具体表现如下:

在MMLU基准上,Falcon 180B的性能超过了Llama 2 70B和GPT-3.5。

在HellaSwag、LAMBADA、WebQuestions、Winogrande、PIQA、ARC、BoolQ、CB、COPA、RTE、WiC、WSC 及ReCoRD上,与谷歌的PaLM 2-Large不相上下。

1800亿参数,世界顶级开源大模型Falcon官宣!碾压LLaMA 2,性能直逼GPT-4

另外,它在Hugging Face开源大模型榜单上,是当前评分最高(68.74分)的开放式大模型,超越了LlaMA 2(67.35)。

1800亿参数,世界顶级开源大模型Falcon官宣!碾压LLaMA 2,性能直逼GPT-4

Falcon 180B上手可用

与此同时,研究人员还发布了聊天对话模型Falcon-180B-Chat。该模型在对话和指令数据集上进行了微调,数据集涵盖了Open-Platypus、UltraChat和Airoboros。

1800亿参数,世界顶级开源大模型Falcon官宣!碾压LLaMA 2,性能直逼GPT-4

现在,每个人都可以进行demo体验。

1800亿参数,世界顶级开源大模型Falcon官宣!碾压LLaMA 2,性能直逼GPT-4

地址:https://huggingface.co/tiiuae/falcon-180B-chat

Prompt 格式

基础模型没有Prompt格式,因为它并不是一个对话型大模型,也不是通过指令进行的训练,所以它并不会以对话形式回应。

预训练模型是微调的绝佳平台,但或许你不该直接使用。其对话模型则设有一个简单的对话模式。

System: Add an optional system prompt hereUser: This is the user inputFalcon: This is what the model generatesUser: This might be a second turn inputFalcon: and so on

Transformers

从Transfomers 4.33开始,Falcon 180B可以在Hugging Face生态中使用和下载。

确保已经登录Hugging Face账号,并安装了最新版本的transformers:

pip install --upgrade transformershuggingface-cli login

bfloat16

以下是如何在 bfloat16 中使用基础模型的方法。Falcon 180B是一个大模型,所以请注意它的硬件要求。

对此,硬件要求如下:

可以看出,若想对Falcon 180B进行全面微调,至少需要8X8X A100 80G,如果仅是推理的话,也得需要8XA100 80G的GPU。

1800亿参数,世界顶级开源大模型Falcon官宣!碾压LLaMA 2,性能直逼GPT-4

from transformers import AutoTokenizer, AutoModelForCausalLMimport transformersimport torchmodel_id = "tiiuae/falcon-180B"tokenizer = AutoTokenizer.from_pretrained(model_id)model = AutoModelForCausalLM.from_pretrained(model_id,torch_dtype=torch.bfloat16,device_map="auto",)prompt = "My name is Pedro, I live in"inputs = tokenizer(prompt, return_tensors="pt").to("cuda")output = model.generate(input_ids=inputs["input_ids"],attention_mask=inputs["attention_mask"],do_sample=True,temperature=0.6,top_p=0.9,max_new_tokens=50,)output = output[0].to("cpu")print(tokenizer.decode(output)

可能会产生如下输出结果:

My name is Pedro, I live in Portugal and I am 25 years old. I am a graphic designer, but I am also passionate about photography and video.I love to travel and I am always looking for new adventures. I love to meet new people and explore new places.

使用8位和4位的bitsandbytes

此外,Falcon 180B的8位和4位量化版本在评估方面与bfloat16几乎没有差别!

这对推理来说是个好消息,因为用户可以放心地使用量化版本来降低硬件要求。

注意,在8位版本进行推理要比4位版本快得多。要使用量化,你需要安装「bitsandbytes」库,并在加载模型时启用相应的标志:

model = AutoModelForCausalLM.from_pretrained(model_id,torch_dtype=torch.bfloat16,**load_in_8bit=True,**device_map="auto",)

对话模型

如上所述,为跟踪对话而微调的模型版本,使用了非常直接的训练模板。我们必须遵循同样的模式才能运行聊天式推理。

作为参考,你可以看看聊天演示中的 [format_prompt] 函数:

def format_prompt(message, history, system_prompt):prompt = ""if system_prompt:prompt += f"System: {system_prompt}n"for user_prompt, bot_response in history:prompt += f"User: {user_prompt}n"prompt += f"Falcon: {bot_response}n"prompt += f"User: {message}nFalcon:"return prompt

从上可见,用户的交互和模型的回应前面都有 User: 和 Falcon: 分隔符。我们将它们连接在一起,形成一个包含整个对话历史的提示。这样,就可以提供一个系统提示来调整生成风格。

网友热评

对于Falcon 180B的真正实力,许多网友对此展开热议。

绝对难以置信。它击败了GPT-3.5,与谷歌的PaLM-2 Large不相上下。这简直改变游戏规则!

1800亿参数,世界顶级开源大模型Falcon官宣!碾压LLaMA 2,性能直逼GPT-4

一位创业公司的CEO表示,我测试了Falcon-180B对话机器人,它并不比Llama2-70B聊天系统好。HF OpenLLM排行榜也显示了好坏参半的结果。考虑到它的规模更大,训练集也更多,这种情况令人惊讶。

1800亿参数,世界顶级开源大模型Falcon官宣!碾压LLaMA 2,性能直逼GPT-4

举个栗子:

给出一些条目,让Falcon-180B和Llama2-70B分别回答,看看效果如何?

Falcon-180B误将马鞍算作动物。而Llama2-70B回答简洁,还给出了正确答案。

1800亿参数,世界顶级开源大模型Falcon官宣!碾压LLaMA 2,性能直逼GPT-4

1800亿参数,世界顶级开源大模型Falcon官宣!碾压LLaMA 2,性能直逼GPT-4

以上就是1800亿参数,世界顶级开源大模型Falcon官宣!碾压LLaMA 2,性能直逼GPT-4的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/499375.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月8日 19:33:47
下一篇 2025年11月8日 19:35:17

相关推荐

  • 加密货币交易所下单之后还能够取消吗?

    未成交订单可取消,已成交则不可;部分成交可撤销剩余部分。用户可随时取消未成交订单,资金立即返还,但频繁取消可能触发交易所限制,尤其在C2C交易中,新用户单日取消超5次或老用户超3次可能被限制交易。币币和合约交易中,频繁撤单虽无直接惩罚,但可能被视为异常行为。系统会在订单超时、交易对下架、系统维护或保…

    2025年12月9日
    000
  • 国内最常用的加密货币交易所有哪些?

    币安、欧易OKX、火币HTX是国内用户最常用且广受认可的加密货币交易所,凭借强大的流动性、安全性及中文服务优势,成为主流选择,而Bitget的跟单交易和Bybit的衍生品服务也各具特色,适合不同需求的投资者。 对于国内加密货币爱好者来说,选择一个常用且可靠的交易平台是踏入这个领域的第一步。尽管相关监…

    2025年12月9日
    000
  • 日元稳定币叫什么?什么时候发行?哪里可以买?

    日本首个日元稳定币JPYC将于2025年秋季完成注册后数周内正式发行,由JPYC Inc.发行并以1:1锚定日元,储备资产为日本国债和银行存款,目标三年内发行1万亿日元,初期仅面向日本国内用户通过合规交易所或直接申请购买。 目前市场上被广泛认可的日元稳定币名为**JPYC**,由日本金融科技公司JP…

    2025年12月9日
    000
  • Tokens 市场监管新规出台,行业走向何方

    全球数字资产监管趋严,2025年二季度美欧港推进稳定币立法,美国通过三项加密法案,比特币市值上涨,合规化推动市场成熟,技术创新与监管科技协同发展。 近期,全球金融市场迎来了一项重大变革——Tokens市场监管新规的正式出台。这一消息如同巨石投入平静的湖面,激起了千层浪花,让所有关注数字资产领域的投资…

    2025年12月9日
    000
  • Tokens 项目开发者如何吸引更多用户

    Tokens项目需通过提升产品吸引力、加强市场推广、构建活跃社区、利用中心化与去中心化%ignore_a_1%、实施用户激励、拓展跨链技术及NFT应用,并高效处理用户反馈,全方位吸引并留住用户,实现生态繁荣与长期发展。 在加密货币领域,一个优质的Tokens项目不仅需要创新的技术和明确的商业模式,更…

    2025年12月9日 好文分享
    000
  • 2025年十大最具潜力的数字货币交易平台推荐

    以下为2025年十大最具潜力的数字货币交易平台推荐 1. binance 全球领先的交易规模,提供丰富的现货、合约与理财工具。持续拓展BNB Chain生态,推动Web3应用落地。安全措施成熟,采用多重验证与冷钱 包储备。手续费优惠政策吸引了大量长期用户。 2. OKX 积极布局Web3,推出多链钱…

    2025年12月9日 好文分享
    000
  • 新 Tokens 项目上线,能否打破现有市场竞争格局?

    新Token项目可能重塑市场格局,通过技术创新、独特经济模型和新应用场景吸引用户与资金,改变竞争态势,同时面临市场认可、流动性、监管等挑战,其成功取决于团队、技术、社区及合规等关键因素。 在加密货币这个瞬息万变、竞争激烈的市场中,每一次新项目的出现都牵动着无数投资者的神经。尤其是当一个备受瞩目的新T…

    2025年12月9日 好文分享
    000
  • btc、eth是不是涨不动了?为啥8月没形成上涨趋势

    BTC、ETH未涨是因四重力量制衡:ETF买盘抵消早期抛售、DeFi去杠杆致刚性抛压、衍生品市场分裂、高稳定币收益吸走流动性,叠加PPI数据冲击引发清算,当前为牛市过渡期,需待宏观与技术突破。 BTC、ETH是不是涨不动了?为啥8月没形成上涨趋势 8月加密货币市场呈现显著的横盘震荡,比特币与以太坊未…

    2025年12月9日
    000
  • 8月底币圈超级大牛市可能爆发吗

    8月底前“超级大牛市”全面爆发概率约40%,市场处于蓄势阶段,短期受制于流动性压力与技术回调,但中长期格局向好,需关注比特币站稳12万美元、以太坊突破4868美元及美联储降息预期三大信号,当前更可能呈现ETH突破与山寨币轮动的结构性机会。 8月底币圈超级大牛市可能爆发吗? 综合市场动态与机构分析,8…

    2025年12月9日
    000
  • 币圈今年下半年特大牛市可能爆发吗

    今年下半年加密货币市场存在爆发特大牛市的可能性,机构资金涌入、宏观流动性宽松及比特币减半周期推动下,市场具备结构性上涨动力,但需警惕监管变化、情绪过热与短期回调风险,建议采取核心持仓与战术配置结合的策略应对不确定性。 今年下半年特大牛市可能爆发吗 今年下半年加密货币市场存在爆发特大牛市的可能性,但需…

    2025年12月9日
    000
  • 加密货币牛市爆发的核心驱动力有哪些?

    加密货币牛市核心驱动力为技术创新、机构入场、宏观经济变化与全球需求增长。区块链技术进步推动DeFi和NFT发展,2025年Q1全球DeFi锁仓量超1600亿美元;机构资金大规模流入,2025年5月数字资产基金单周流入达330亿美元,Grayscale管理规模达280亿美元;全球经济不确定性加剧,通胀…

    2025年12月9日
    000
  • 如何合法获取免费加密货币?2025年免费合法获得加密货币的指南

    想要进入加密世界,并不一定需要投入大量资金。本指南将为您介绍2025年几种完全合法且免费获取加密货币的途径,尤其适合刚刚起步、希望零成本体验数字资产的朋友们。 一、加密货币主流交易平台地址推荐 1、币安binance: 2、欧意OKX: 3、HTX火币:     4、Gate.io: 二、关注项目空…

    2025年12月9日
    000
  • 为啥币圈不同币种的K线相关性那么强?走势图都差不多

    加密货币K线高度相关源于比特币主导、投资者心理趋同及宏观因素影响,BTC作为市场指数通过定价锚定、资金轮动和衍生品机制带动全市场波动,叠加美联储政策与稳定币收益率等系统性风险,导致多数币种同涨同跌;尽管技术升级、监管差异或极端行情可能引发短期分化,但长期仍以BTC为核心驱动,市场正逐步向多极化发展。…

    2025年12月9日
    000
  • 代币是什么 一文搞懂!

    简单来说,代币(token)是建立在现有区块链网络之上的数字凭证。你可以把它想象成游乐园里的游戏币,这个本身不是货币,但它可以在游乐园这个特定的“网络”里用来玩游戏、买东西,代表着一种权利或价值。 2025年虚拟货币主流交易所: 币安:  欧易:  火币:  什么是代币? 代币与我们常说的比特币(B…

    2025年12月9日
    000
  • 如何看待币圈乱象以及有什么途径可以规避风险?

    币圈乱象源于信息不对称与监管滞后,表现为虚假项目、价格操纵和信息造假;规避风险需选择合规平台、深度研究项目、控制仓位、警惕高收益诱惑,并用技术工具验证信息,建立理性投资逻辑。 如何看待币圈乱象以及有什么途径可以规避风险? 币圈乱象的核心源于信息不对称、监管适配滞后与投机心态主导,常见表现为虚假项目、…

    2025年12月9日
    000
  • 怎么在币圈复制盈利?如何在加密货币圈赚大钱?

    币圈盈利复制需通过可量化的策略、历史回测与严格纪律实现,如趋势跟踪、套利和价值投资;赚大钱则依赖认知差、周期把握与复利,避免热点投机与高杠杆,核心是用规律和认知战胜市场随机性。 怎么在币圈复制盈利?如何在加密货币圈赚大钱? 币圈没有“一键复制”的盈利公式,但可通过“标准化策略+复盘优化”实现大概率盈…

    2025年12月9日
    000
  • 币安交易所中文版下载地址 币安binance官方app

    您可以通过访问币安官方网站来获取其应用程序。网站通常会提供适用于不同操作系统(如安卓和苹果ios)的下载选项。请务必通过官方渠道进行下载,以确保您的账户安全。对于安卓用户,通常是直接下载应用程序文件进行安装;对于ios用户,可能需要遵循网站提供的特定指引进行安装。 币安官网直达: 币安官方app: …

    2025年12月9日
    000
  • 一文搞懂!代币和比特币的区别

    简单来说,比特币是其自有独立区块链上的原生加密货币,就像是“高速公路”本身;而代币则是在现有的区块链(如以太坊)上创建的数字资产,更像是行驶在这条“高速公路”上的“汽车”。 2025年虚拟货币主流交易所: 币安:  欧易:  火币:  关于交易平台 无论是比特币还是各种代币,它们的主要流通和买卖场所…

    2025年12月9日
    000
  • 在币圈中“主力机构”“狗庄”到底是什么?

    主力机构是合规、专业的大型投资实体,通过量化交易和长期持仓影响市场;狗庄则是利用杠杆、对倒交易和虚假信息操纵价格的投机者,二者在资金性质、操作周期和市场影响上存在本质区别。 在币圈中“主力机构”“狗庄”到底是什么? 币圈中的“主力机构”和“狗庄”是两类对市场价格具有显著影响力的参与者。前者通常指具备…

    2025年12月9日
    000
  • 稳定币有哪几种?稳定币以太坊还有上涨空间吗?

    本文旨在厘清当前主流%ignore_a_1%的核心分类,并深入探讨在以太坊网络上发行的稳定币是否仍具备广阔的增长前景。通过了解不同稳定币的运作机制,可以更好地把握其在数字资产世界中的作用与潜力。 一、稳定币主流交易所推荐 1、币安binance: 2、欧意OK: 3、HTX火币:     4、Gat…

    2025年12月9日
    000

发表回复

登录后才能评论
关注微信