LowCode低码时代LowCode低码时代
  • 首页
  • 低代码/零代码动态
    低代码/零代码动态
    厂商融资信息、行业新闻、招投标、技术研究等动态
    Show More
    Top News
    AIGC点燃低/零代码市场
    3年 ago
    万字长文 | 低代码vs.传统开发:一个全面的比较
    2年 ago
    西门子Mendix低代码高级架构师卢春霖,将出席“低代码开发推动制造业数字化变革”线上研讨会
    2年 ago
    Latest News
    重磅!OpenAI开源首个Agent SDK,反击Manus
    1年 ago
    云计算巨头AI战略分化:谁将定义企业级AI的未来规则?
    1年 ago
    DeepSeek创造历史!登顶全球AI应用第2名,豆包排名第10
    1年 ago
    2025“赋能开发者”高峰论坛即将启幕,诚邀您报名参加!
    1年 ago
  • 市场研究
    市场研究Show More
    《Market Insight:中国低代码/零代码市场发展洞察 ( 2023 )》报告正式发布 | LowCode低码时代
    3年 ago
    国产大模型顶流「讯飞星火」:图片生成、代码生成,支持插件等重磅上线
    3年 ago
    报告 | 金现代:效能提升+内质跃迁,重塑电力IT领导者
    3年 ago
    Gartner:低代码的颠覆性力量
    3年 ago
    Gartner:什么是超级应用程序?
    3年 ago
  • 人物观点
    人物观点Show More
    原力CEO赵锐:ToDesk是国内唯一适合高精远程办公需求的解决方案
    2年 ago
    央视财经对话汪源:低代码最核心的是降低对写代码的人的要求
    3年 ago
    干货文章 | 低代码真的有价值吗?
    3年 ago
    壹沓科技融资近2亿元之后:以通用大语言模型赋能,构建数字机器人超级大脑
    3年 ago
    专访中银金科:数字营销成为新的增长引擎,未来业务转化是关键
    3年 ago
  • 活动
    活动
    最新活动,包含线上研讨会、技术预测峰会、线下峰会、…
    Show More
    Top News
    ISIG中国产业智能大会品牌介绍
    4年 ago
    炎黄盈动金融行业高级顾问张自刚,受邀出席“2022金融科技超自动化论坛”
    3年 ago
    超自动化·智启高效运营|艺赛旗2023年春季产品发布会成功举办
    3年 ago
    Latest News
    2024第五届ISIG产业智能大会,四大科技峰会共掀数字化创新浪潮
    1年 ago
    参赛者必看 | 拯救者杯OPENAIGC开发者大赛最全攻略指南来啦~
    2年 ago
    2024第四届ISIG产业智能大会(RPA超级自动化、AIGC大模型、低代码/零代码、流程挖掘)
    2年 ago
    超自动化·智启高效运营|艺赛旗2023年春季产品发布会成功举办
    3年 ago
  • 关于低码时代
    • LowCode原创研究
Reading: 1万亿训练数据,400亿参数!可商用的类ChatGPT开源模型
Share
Notification Show More
Latest News
30部佳作突围!2025 AI视听创作嘉年华晋级名单揭晓,总决赛11月25日启幕
未分类
《2025 AI 大模型开发生态白皮书》正式发布 | 算泥社区
未分类
“AI幻想·未来亦城”2025AI视听创作嘉年华作品征集来了!
未分类
120万奖池,寻找最具想象力的AI创意开发者!2025骁龙人工智能创新应用大赛正式启动!
未分类
2025-10-21
未分类
Aa
LowCode低码时代LowCode低码时代
Aa
  • 低代码/零代码动态
  • 最新市场研究
  • 活动
  • 人物观点
  • 首页
  • 低代码/零代码动态
  • 最新市场研究
  • 人物观点
  • 活动
  • 关于低码时代
Have an existing account? Sign In
  • LowCode低码时代
Copyright©2015-2022 北京企智未来科技有限公司 All Rights Reserved.
LowCode低码时代 > Blog > 低代码/零代码动态 > 1万亿训练数据,400亿参数!可商用的类ChatGPT开源模型
低代码/零代码动态

1万亿训练数据,400亿参数!可商用的类ChatGPT开源模型

LowCode低码时代
Last updated: 2023/05/30 at 12:21 下午
LowCode低码时代 3年 ago
Share
SHARE

近日,阿联酋阿布扎比技术创新研究所(Technology Innovation Institute,简称TII)发布了,阿联酋首个类ChatGPT开源大语言模型——Falcon-40B。(开源地址:https://huggingface.co/tiiuae/falcon-40b)

Falcon-40B拥有400亿参数,在1万亿tokens数据集上进行训练,可用于文本问答、总结摘要、自动生成代码、语言翻译等,支持特定业务场景微调。

在斯坦福大学的HELM LLM基准测试中,Falcon-40B比GPT-3、 Chinchilla AI、PaLM-62B等知名大语言模型的算力消耗低更低,性能却更出色。

目前,Falcon-40B在huggingface的开源大语言模型排行榜中位列第一名,击败了LLaMa 65b、GPT4-X-Alpasta-30b、StableLM、RedPajama、LLaMa 30b等一系列著名开源项目成为一匹黑马。

这主要是因为TII是国家级技术研究机构,在人才、资金、算力资源方面远超企业、个人开发者属于降维打击。例如,Falcon-40B是在384个A100 40GB GPU上进行训练,一般机构根本承担不起这么大的训练费用。

TII表示,Falcon-40B允许商业化,但通过该产品每年收入超过100万美元需要与TII签订商业协议缴纳版权费。所以,业务较大的企业在使用该模型时需要慎重考虑。

Falcon-40B官方介绍

1万亿tokens数据集

Falcon-40B是在开源数据集RefinedWeb上训练而成。RefinedWeb拥有1万亿tokens,基于Apache 2.0允许商业化。(RefinedWeb开源地址:https://huggingface.co/datasets/tiiuae/falcon-refinedweb)

其中,RefinedWeb的7500亿数据源是基于英语的网页抓取;700亿来自欧洲的数据爬取;600亿是书籍;500是对话,包括Reddit、StackOverflow等;500亿是代码;200亿是技术文档,包括arXiv、PubMed、UPSTO。

所以,Falcon-40B虽然参数不高,但经过庞大的数据池洗礼后,可以精准执行文本、代码生成、智能聊天机器人等与ChatGPT类似的功能。

此外,如果开发者需要数据集进行大语言模型训练的话,也可以尝试使用RefinedWeb,以节省时间和提升开发效率。

算力消耗低,性能更强

根据TII在官网公布的数据,Falcon仅使用了 GPT-3训练计算的75%、Chinchilla的 40% 和PaLM-62B的80%,在算力方面消耗更低,但表现出的性能更加强悍。

TII表示,在开发过程中对Falcon的架构进行了大量优化,将高质量数据集与算法进行了深度融合,Falcon 仅在训练预算的75%上就明显优于GPT-3,并且在推理时只需要五分之一的算力。

这也让Falcon-40B击败了LLaMa 65b、GPT4-X-Alpasta-30b、StableLM一系列知名大语言开源项目,成为huggingface开源大语言模型排行榜中的状元。

Falcon-40B的排行榜

参与者需要经过AI2 Reasoning Challenge,一组科学问题;HellaSwag,10次常识推理测试;MMLU,57项任务测试,包括初等数学、历史、法律等;TruthfulQA,衡量语言模型在生成问题答案时是否真实的基准。

严格考验才能入选huggingface开源大语言模型排行榜。因此,Falcon-40B的推理、计算、拟人化等能力相当优秀。

TII还开源了以下项目:

Falcon-40B- instruct指令版,地址:https://huggingface.co/tiiuae/falcon-40b-instruct

Falcon-7B,地址:https://huggingface.co/tiiuae/falcon-7b

Falcon-7B-instruct指令版,地址:https://huggingface.co/tiiuae/falcon-7b-instruct

不过TII建议开发者先从Falcon-40B开始使用,这是他们目前推出最实用的版本。

关于TII

TII 成立于2020年,是阿布扎比高等教育和科技部 (ADEK) 旗下的研究机构。TII 的目标是推动科学研究、开发前沿技术并将其商业化,以促进阿布扎比和阿联酋的经济发展。

TII 目前拥有来自 74个国家的800多名研究专家,发表了 700 多篇论文和 25 多项专利,是世界领先的科学研究机构之一。

本文素材来源TII官网,如有侵权请联系删除

– END –


 开发者大赛 


 报告下载 





大佬观点


西门子低代码-王炯 | 西门子低代码-阮铭 | 微软-李威 | 微软-徐玉涛 | 葡萄城-李佳佳 | 葡萄城-宁伟 | SAP-陈泽平 | 华为-周明旺 | 华为云-董鑫武 | 钉钉宜搭-邵磊 | 轻流-严琦东 | 腾讯云微搭-骆勤 | 网易数帆-陈谔、严跃杰 | 百特搭-姜楠
用友-刘鑫 |  数睿数据-张超 |  奥哲-朱鹏喜 | 炎黄盈动-汤武 | 普元信息-孟庆余 | 得帆-李健达 | 瀚码技术-钟惟渊 | iVX-孟智平
Treelab-何浚炫 | 阿里-汪凤震 | 明道云-薛晨 | 上海斯歌-傅正斌




公众号后台回复【加群】
可受邀进入【无代码&低代码技术应用研讨群】
欢迎各位从业者/应用者/关注者加入


You Might Also Like

云计算巨头AI战略分化:谁将定义企业级AI的未来规则?

重磅!OpenAI开源首个Agent SDK,反击Manus

DeepSeek创造历史!登顶全球AI应用第2名,豆包排名第10

2025“赋能开发者”高峰论坛即将启幕,诚邀您报名参加!

LowCode低码时代 2023-05-30
Previous Article 低代码没有存在感?看看这7个赛道战况!
Next Article 我用低代码结合ChatGPT开发,每天多出1小时摸鱼
Leave a comment

发表回复 取消回复

您的电子邮箱地址不会被公开。 必填项已用*标注

about us

关注中国低代码(LowCode)无代码/零代码领域,包括行业研究、市场报告、技术选型和媒体报道,推进低代码的技术普及、生态建设发展和产业应用,重塑IT开发和自动化的未来。

  • 最新市场研究
  • 人物观点
  • 低代码/零代码动态
  • 活动
  • 联系我们
  • RPA中国
  • 数字金融网
  • 信创中国
  • Xverse元宇宙

最新专家访谈

原力CEO赵锐:ToDesk是国内唯一适合高精远程办公需求的解决方案
央视财经对话汪源:低代码最核心的是降低对写代码的人的要求
干货文章 | 低代码真的有价值吗?
壹沓科技融资近2亿元之后:以通用大语言模型赋能,构建数字机器人超级大脑
专访中银金科:数字营销成为新的增长引擎,未来业务转化是关键
实现技术普惠 网易数帆轻舟低代码的差异化竞争之道
LowCode低码时代LowCode低码时代

Copyright©2015-2022 北京企智未来科技有限公司 All Rights Reserved.
京ICP备19023145号-8

  • LowCode低码时代
订阅最新动态!

订阅最新低代码/零代码市场报告、研究咨询、分析师趋势以及市场活动

Zero spam,可随时取消订阅.

Removed from reading list

Undo
欢迎回来!

登录你的账号

Lost your password?