加入收藏 | 设为首页

首页    /    快讯    /    正文

“超强阵容”献计,国产大模型如何突围?

“一个国产大模型要如何才能成为市场主流?需要跨越哪些关键的挑战?”11月16日下午,在由科技部、深圳市人民政府共同主办的“2023西丽湖论坛”平行分论坛,一场以“AI大模型的开源创新与赋能应用”为主题的高峰对话正在进行,清华大学计算机系陈文广教授向百川智能创始人兼CEO王小川提出了一个所有大模型创业者都十分关心的问题,也引发了与会嘉宾的热议。

“超强阵容”献计,国产大模型如何突围?

今年以来,人工智能大模型掀起了澎湃的科技创新与创业浪潮,许多科技巨头与创业公司都在研发自身的大模型,形成了“百模大战”的局面。在高峰对话当中,来自政府、企业、高校的领军人物围绕国产大模型的突围之道,进行了热烈的讨论。

除了目前市场普遍关心关注的可靠算力问题,记者梳理与会嘉宾的观点发现,国产大模型要在全球竞争当中实现突围,有三个重要的关键词:优质数据、繁荣生态、产研合作。

中国外文局副局长高岸明表示,根据研究,目前在国际信息流当中,英文的内容占到60%,而中文的信息流只占到大约2%,不仅远远低于英文,而且也低于很多非通用语种,高质量中文语料的缺失为国内大模型的训练带来挑战。“我们需要有海量、精准、可靠的中文语料数据来训练我们的大模型。”高岸明表示。

作为大模型创业公司中的佼佼者,百川智能发布的Baichuan-7B/13B两款开源大模型累计下载量已超过600万次。其背后的成功原因,离不开王小川“搜索”出身带来的数据优势。记者注意到,在ChatGPT推出不久之后,王小川就曾公开指出,搜狗输入法和搜狗搜索的数据制备和产品形态与ChatGPT接近,都是把互联网上的全部语言数据收集、清洗,压缩成数据并构建超级产品。

“我可以很自豪地说,在开源大模型里面,百川智能的水平在中文方面已经超越了LLaMA。”王小川说。目前,Meta公司的开源大模型ChatLLaMA是国际上最为主流的开源大模型之一。王小川表示,百川智能采用的是搜狗从搜索引擎时代开始就积累的万亿级数据,在其中选取最优质的数据,从而取得了良好的训练效果。

当前,国内外竞逐大模型都采取开源和闭源两条腿并行的模式。开源即开放源代码,允许开发者查看、修改和分发开源代码;而闭源则与之对应,用户只能对产品有使用的权利,没有修改的权利。业内普遍认为,闭源契合知识产权保护,顺应投资与获取利润的逻辑,而开源则有助于技术的快速迭代与创新,形成繁荣的生态。

“两种技术路线有各自的逻辑,不能简单判断哪一种更好,但是我认为事物的发展必须要有多样性。在大模型研发的生态环境中,既会有开源的做法,也会有闭源的做法。”中国工程院院士、鹏城实验室主任高文说。他进一步表示,鹏城实验室与百川智能在开源大模型方面开展了密切合作,并将模型提供给全社会使用,从而助力打造更加活跃与繁荣的生态。

大模型时代中,产研合作的作用变得更为突出。由于大模型研发需要投入巨额的算力,目前该领域的创新主要来自于资金实力更为雄厚的企业。北京邮电大学人工智能学院教授何召峰曾公开表示,在大模型领域,高校不太可能与大企业竞争,但二者之间有广阔的合作空间,紧密的产研合作能助力国产大模型实现更快的发展,二者应结合各自优势,进行针对性的合作。

据了解,鹏城实验室与百川智能合作研发了“鹏城-百川·脑海33B”长窗口大模型。这一大模型也在此次高峰对话后正式发布。据介绍,该大模型是国产算力平台的最长上下文窗口模型,实现了段落、句子粒度的自动化数据过滤、选择和配比,能支持128K的上下文窗口长度,即一次可容纳相当于300多页文本内容的提示词,后续还将升级至192K。值得注意的是,不久前ChatGPT发布了最新迭代版的GPT-4 Turbo产品,其中的一个变化便是上下文窗口长度由32K扩展至128K。

“在去年ChatGPT发布后,国内整体处于比较焦虑的状态,如今已经比年初好很多了。”王小川表示,目前无论是科技巨头还是获得资本加持的创业公司,都在加速向前迈进,他期待国内大模型的突围能够在明年到来。

责编:万健祎

校对:姚远

声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。。
您可能感兴趣的文章
  • 长安启源A07:“卷”非我本意,只想给年轻

    从“看客”到“用户”,有时候或许只需要给消费者一点小小的震撼。 比如,当长安启源A07亮出15.59万元-17.69万元的价格,并且提供24期零息和60期低息贷款,以及最高8000元...

    2023-11-18 18:37:37
  • 五菱首款轿车即将上市,定位中型尺寸,能否“

    五菱在国内市场的知名度以及影响力还是蛮高的,其作为一款民用汽车品牌,凭借着足够便宜实惠的价格,以及实用的产品力,赢得了不少老百姓的喜欢。与此同时,民间流传的“人们需要什么,五菱就造什么...

    2023-11-18 17:08:25
  • 汽车新时代:合资自主“同价”,电车油车“同

    10月20日,两款上市新能源车值得关注:其一是别克E5先锋版,售价16.99万元;其二是长安启源A05,8.99万元起售。这标志着,无论合资还是自主都开始掀桌子了,“油电同价”已经成为...

    2023-11-18 15:58:25
  • 信托公司监管评级与分级分类监管暂行办法印发

    11月16日,国家金融监督管理总局发布关于印发《信托公司监管评级与分级分类监管暂行办法》的通知。 《办法》指出,信托公司监管评级包括公司治理、资本要求、风险管理、行为管理、业务转...

    2023-11-18 15:16:14
  • 中配性价比更高哈弗猛龙让越野不再设限

    国内汽车市场现在可以说是没有最卷只有更卷,哈弗猛龙前不久正式上市,其定位于一台紧凑级SUV,但售价只有16.58-18.38万元。除了价格卷哈弗猛龙配置也相当高,座椅通风加热、L2级自...

    2023-11-18 14:34:39
  • 重庆万州亮相长三角文博会,“披肩秀”惊艳全

    11月16日,第四届长三角文博会正式开幕,作为首届上海对口地区文旅产业展的受邀参展单位,重庆万州在开幕式上带来了戏曲、歌舞等精彩丰富的节目展演,向参展观众展示万州传统文化艺术的魅力。万...

    2023-11-18 11:52:12
  • 可快可稳,全新伊兰特更运动

    如果你想买一辆10万级合资品牌轿车,可选的不少,但是兼顾运动和智能的“选手”寥寥无几。要么就是有颜无料,要么是颜值太拉胯。今天给大家推荐一款,有颜有料被称为10万级家用轿车颜值“天花板...

    2023-11-18 11:41:27
  • 江铃晶马E路福正式上市,售13.88万元,

    10月23日,江铃晶马E路福正式上市,推出一款车型,售价为13.88万元。该车是一款纯电动封闭货车,载货容积约为6立方米,最大设计总质量达3150kg,额定载重近1.5吨。 外观来看...

    2023-11-17 19:06:10
  • 中型SUV标配1.4T,10万元合资车捷达

    捷达大家都不陌生吧?捷达VS7是捷达旗下的SUV车型,作为10万元左右的合资车,其凭着不错的产品力收获了不错的关注度。捷达VS7是标准的5门5座SUV,共有8款车型可供挑选,厂商售价区...

    2023-11-17 18:18:51
  • 40万元左右家用MPV怎么选?选广汽丰田赛

    3-2 40万元左右,家用MPV怎么选?答题要答到点子上,这道题的重点就是“家用”两个字吧。要适合家用,无非是要满足以下几点,看广汽丰田赛那够不够格? 一、空间要大 广汽丰田赛那...

    2023-11-17 17:05:19
精彩推荐
热门文章
闵行区水务闵行区水务局组织召开闵行区农村生活污水治理评估工作培训部署会局15万预算买上绿牌的四驱混动suv,哈枭tMAX全系配置解读2023广州车展:坦克700Hi4-T限定版预售70万元伯恩光学|赋能Xiaomi 14 Pro感知体验「全面跨越式升级」跨界老祖宗-标致504BreakDangel4×4“拉索”精确测量迄今最亮伽马暴高能辐射能谱领克、长安领衔,即将上市的新能源新车推荐,混动/纯电都有引领者再次引领2024款新岚图梦想家上市奇瑞探索06试驾:让“新三有”人群舒服地撒个野15-20万级新能源越野SUV也玩智能和个性?带你体验哈弗猛龙临下单换购奥铃M卡,合肥曹师傅直言“货厢更长”50万以上“全品类MPV”销量冠军,又见极氪009数字化转型“标准+”工作站成立第23届工博会“标准化赋能数字化转型”国际车身尺寸与CX-90相当,马自达CX-70推迟到明年发布,采用插混系统