“超强阵容”献计,国产大模型如何突围?
“一个国产大模型要如何才能成为市场主流?需要跨越哪些关键的挑战?”11月16日下午,在由科技部、深圳市人民政府共同主办的“2023西丽湖论坛”平行分论坛,一场以“AI大模型的开源创新与赋能应用”为主题的高峰对话正在进行,清华大学计算机系陈文广教授向百川智能创始人兼CEO王小川提出了一个所有大模型创业者都十分关心的问题,也引发了与会嘉宾的热议。
今年以来,人工智能大模型掀起了澎湃的科技创新与创业浪潮,许多科技巨头与创业公司都在研发自身的大模型,形成了“百模大战”的局面。在高峰对话当中,来自政府、企业、高校的领军人物围绕国产大模型的突围之道,进行了热烈的讨论。
除了目前市场普遍关心关注的可靠算力问题,记者梳理与会嘉宾的观点发现,国产大模型要在全球竞争当中实现突围,有三个重要的关键词:优质数据、繁荣生态、产研合作。
中国外文局副局长高岸明表示,根据研究,目前在国际信息流当中,英文的内容占到60%,而中文的信息流只占到大约2%,不仅远远低于英文,而且也低于很多非通用语种,高质量中文语料的缺失为国内大模型的训练带来挑战。“我们需要有海量、精准、可靠的中文语料数据来训练我们的大模型。”高岸明表示。
作为大模型创业公司中的佼佼者,百川智能发布的Baichuan-7B/13B两款开源大模型累计下载量已超过600万次。其背后的成功原因,离不开王小川“搜索”出身带来的数据优势。记者注意到,在ChatGPT推出不久之后,王小川就曾公开指出,搜狗输入法和搜狗搜索的数据制备和产品形态与ChatGPT接近,都是把互联网上的全部语言数据收集、清洗,压缩成数据并构建超级产品。
“我可以很自豪地说,在开源大模型里面,百川智能的水平在中文方面已经超越了LLaMA。”王小川说。目前,Meta公司的开源大模型ChatLLaMA是国际上最为主流的开源大模型之一。王小川表示,百川智能采用的是搜狗从搜索引擎时代开始就积累的万亿级数据,在其中选取最优质的数据,从而取得了良好的训练效果。
当前,国内外竞逐大模型都采取开源和闭源两条腿并行的模式。开源即开放源代码,允许开发者查看、修改和分发开源代码;而闭源则与之对应,用户只能对产品有使用的权利,没有修改的权利。业内普遍认为,闭源契合知识产权保护,顺应投资与获取利润的逻辑,而开源则有助于技术的快速迭代与创新,形成繁荣的生态。
“两种技术路线有各自的逻辑,不能简单判断哪一种更好,但是我认为事物的发展必须要有多样性。在大模型研发的生态环境中,既会有开源的做法,也会有闭源的做法。”中国工程院院士、鹏城实验室主任高文说。他进一步表示,鹏城实验室与百川智能在开源大模型方面开展了密切合作,并将模型提供给全社会使用,从而助力打造更加活跃与繁荣的生态。
大模型时代中,产研合作的作用变得更为突出。由于大模型研发需要投入巨额的算力,目前该领域的创新主要来自于资金实力更为雄厚的企业。北京邮电大学人工智能学院教授何召峰曾公开表示,在大模型领域,高校不太可能与大企业竞争,但二者之间有广阔的合作空间,紧密的产研合作能助力国产大模型实现更快的发展,二者应结合各自优势,进行针对性的合作。
据了解,鹏城实验室与百川智能合作研发了“鹏城-百川·脑海33B”长窗口大模型。这一大模型也在此次高峰对话后正式发布。据介绍,该大模型是国产算力平台的最长上下文窗口模型,实现了段落、句子粒度的自动化数据过滤、选择和配比,能支持128K的上下文窗口长度,即一次可容纳相当于300多页文本内容的提示词,后续还将升级至192K。值得注意的是,不久前ChatGPT发布了最新迭代版的GPT-4 Turbo产品,其中的一个变化便是上下文窗口长度由32K扩展至128K。
“在去年ChatGPT发布后,国内整体处于比较焦虑的状态,如今已经比年初好很多了。”王小川表示,目前无论是科技巨头还是获得资本加持的创业公司,都在加速向前迈进,他期待国内大模型的突围能够在明年到来。
责编:万健祎
校对:姚远
您可能感兴趣的文章
- 长安启源A07:“卷”非我本意,只想给年轻
从“看客”到“用户”,有时候或许只需要给消费者一点小小的震撼。 比如,当长安启源A07亮出15.59万元-17.69万元的价格,并且提供24期零息和60期低息贷款,以及最高8000元...
2023-11-18 18:37:37 - 五菱首款轿车即将上市,定位中型尺寸,能否“
五菱在国内市场的知名度以及影响力还是蛮高的,其作为一款民用汽车品牌,凭借着足够便宜实惠的价格,以及实用的产品力,赢得了不少老百姓的喜欢。与此同时,民间流传的“人们需要什么,五菱就造什么...
2023-11-18 17:08:25 - 汽车新时代:合资自主“同价”,电车油车“同
10月20日,两款上市新能源车值得关注:其一是别克E5先锋版,售价16.99万元;其二是长安启源A05,8.99万元起售。这标志着,无论合资还是自主都开始掀桌子了,“油电同价”已经成为...
2023-11-18 15:58:25 - 信托公司监管评级与分级分类监管暂行办法印发
11月16日,国家金融监督管理总局发布关于印发《信托公司监管评级与分级分类监管暂行办法》的通知。 《办法》指出,信托公司监管评级包括公司治理、资本要求、风险管理、行为管理、业务转...
2023-11-18 15:16:14 - 中配性价比更高哈弗猛龙让越野不再设限
国内汽车市场现在可以说是没有最卷只有更卷,哈弗猛龙前不久正式上市,其定位于一台紧凑级SUV,但售价只有16.58-18.38万元。除了价格卷哈弗猛龙配置也相当高,座椅通风加热、L2级自...
2023-11-18 14:34:39 - 重庆万州亮相长三角文博会,“披肩秀”惊艳全
11月16日,第四届长三角文博会正式开幕,作为首届上海对口地区文旅产业展的受邀参展单位,重庆万州在开幕式上带来了戏曲、歌舞等精彩丰富的节目展演,向参展观众展示万州传统文化艺术的魅力。万...
2023-11-18 11:52:12 - 可快可稳,全新伊兰特更运动
如果你想买一辆10万级合资品牌轿车,可选的不少,但是兼顾运动和智能的“选手”寥寥无几。要么就是有颜无料,要么是颜值太拉胯。今天给大家推荐一款,有颜有料被称为10万级家用轿车颜值“天花板...
2023-11-18 11:41:27 - 江铃晶马E路福正式上市,售13.88万元,
10月23日,江铃晶马E路福正式上市,推出一款车型,售价为13.88万元。该车是一款纯电动封闭货车,载货容积约为6立方米,最大设计总质量达3150kg,额定载重近1.5吨。 外观来看...
2023-11-17 19:06:10 - 中型SUV标配1.4T,10万元合资车捷达
捷达大家都不陌生吧?捷达VS7是捷达旗下的SUV车型,作为10万元左右的合资车,其凭着不错的产品力收获了不错的关注度。捷达VS7是标准的5门5座SUV,共有8款车型可供挑选,厂商售价区...
2023-11-17 18:18:51 - 40万元左右家用MPV怎么选?选广汽丰田赛
3-2 40万元左右,家用MPV怎么选?答题要答到点子上,这道题的重点就是“家用”两个字吧。要适合家用,无非是要满足以下几点,看广汽丰田赛那够不够格? 一、空间要大 广汽丰田赛那...
2023-11-17 17:05:19
精彩推荐
-
本周FAMI通新作评分《八方旅人2》36分
2023-02-22
-
《2022年中国电竞产业报告》发布,电竞产业收入五
2023-02-22
-
最新中国手游出海收入排行榜公布,《原神》仍占榜首
2023-02-22
-
开放大省亮出“成绩单”和“任务书”
2023-02-21
-
“人形机器人第一股”背后:“硬科技”没有风口
2023-02-21
-
饿了么到店业务将与高德合并,本地生活业务又将迎来血
2023-02-21
-
联想第三财季营收净利双降PC出货量减少近三成
2023-02-21
-
机器人产业蓬勃发展中国“智造”春潮涌动
2023-02-21