• 证券股票配资公司排名_配资炒股公司排名_股票配资公司口碑

手机配资 关于大模型竞争,傅盛捅破的不只有数据壁垒

发布日期:2024-12-31 20:26    点击次数:129

尽管OpenAI下一代旗舰模型的上线时间还是未知数,但多方消息指向同一个可能性:性能没那么大飞跃了。来自OpenAI的员工和研究人员表示,高质量文本和其他数据的供应不足是GPT模型性能减速的原因之一。 国内有关数据的讨论也从未降温,仅这半个月,月之暗面创始人杨植麟说,“当Scale(规模)差不多时,更多算力可能并不一定能直接解决问题,核心是高质量的数据没那么多了”,蚂蚁数科索性上线了全新的AI数据合成品与生产平台。 猎豹移动董事长兼CEO、猎户星空董事长傅盛更直白,他要捅破窗户纸,“大模型行业

  • 手机配资 关于大模型竞争,傅盛捅破的不只有数据壁垒

      尽管OpenAI下一代旗舰模型的上线时间还是未知数,但多方消息指向同一个可能性:性能没那么大飞跃了。来自OpenAI的员工和研究人员表示,高质量文本和其他数据的供应不足是GPT模型性能减速的原因之一。

      国内有关数据的讨论也从未降温,仅这半个月,月之暗面创始人杨植麟说,“当Scale(规模)差不多时,更多算力可能并不一定能直接解决问题,核心是高质量的数据没那么多了”,蚂蚁数科索性上线了全新的AI数据合成品与生产平台。

      猎豹移动董事长兼CEO、猎户星空董事长傅盛更直白,他要捅破窗户纸,“大模型行业竞争,真正的竞争壁垒来自于数据”,猎豹移动则联合旗下的聚云科技于近日推出数据服务产品“AI数据宝AirDS”。顶级模型成长放缓是好是坏?怎么平衡人工和机器做数据标注成本?猎豹移动高管团队向北京商报记者开诚布公。

      卡在数据上

      开发过程中,OpenAI的最新模型Orion(猎户座)未能达到预期的性能,谷歌的Gemini模型以及Anthropic的Claude3.5Opus也都遇到了瓶颈,在业内人士看来,三家似乎都面临相似的问题:越来越难以获得高质量数据。

      有关Scaling law(规模定律)是否失效的问题又一次被抛给大模型从业者。

      用OpenAI一篇论文中的定义,所谓Scaling law,是指大模型的最终性能主要与计算量、模型参数量和训练数据量三者的大小相关,而与模型的具体结构(层数/深度/宽度)基本无关。换言之,仅仅增加模型规模和训练数据,就能显著提升人工智能能力,而无需取得根本性的算法突破。

      “没人能下这个结论,”傅盛话锋一转,“从客观事实看,顶级模型的能力和成长,肯定是放缓的,Scaling law不一定放缓了,但受限于数据的容量,不是说芯片和算法不重要,而是大家在这两点上很难作出差异化。”

      一种解决方案是合成数据,Epoch AI Research研究团队预测,“到2026年,现存的用于AI模型训练的高质量语言数据将耗尽”。

      “未来的AI应用需要大量稀缺且难以获取的长尾数据,如自动驾驶中的极端天气与极端路况数据,具身智能训练所需要的复杂场景数据。在此背景下,数据合成将成为关键”,蚂蚁数科AI科技技术负责人、蚂蚁天玑实验室主任李哲持以上观点。

      “合成数据确实是一个很重要的补充,但仅仅使用合成数据肯定是不够的”,猎户星空首席科学家韩堃告诉北京商报记者。猎豹移动将重点放在大模型数据服务上,AI数据宝AirDS提供数据收集、清洗、标准、提示词工程及评估等服务。

      只会“拉框”远远不够

      以数据标注为例,“上一代数据标注趋向于常见的检测、识别和固定化、规则化的任务,这些标注相对来说比较明确,比如依照视频找物体,根据语音找文字。但在大模型时代,企业应用是多种多样的”,猎豹移动高级副总裁孙明焱向北京商报记者举例,“比如客户希望用大模型查数据库,希望让大模型画组织架构图,这种需求找一个标注人员来做是挺难的”。

      用傅盛的话说,大模型让数据标注和服务走向一体化,“光雇人标人脸的时代已经适应不了现在的需求了。没有做过大模型、大模型应用的企业,要构建这套体系需要时间”。

      人工和机器间的平衡,也没有特定的套路。

      “数据服务肯定是需要人工的,但大模型时代会大量借鉴AI模型和工具来提高数据标注的效率,”韩堃进一步说,“如果所有的数据服务都通过人工服务,标注或清理的速度肯定跟不上,成本也非常大,但要产出高质量的数据,仅通过模型肯定是不够的。我们在自己训练模型的过程中发现,数量和质量的平衡点非常微妙,要通过大量实践才能找到,一个既保证数量,质量又非常高的点。而这个点跟企业的目标相关,做预训练、微调或者应用,对于数量和质量的要求是不太一样的。”

    今年“双十一”,直播成为重要促消费渠道。截至11月11日24时,淘宝直播成交破亿元直播间达119个,其中有49个破亿元直播间同比增速超100%。据介绍,今年“双十一”淘宝直播整体成交金额、购买用户数均实现大幅增长。

    当前,河南正重点培育万亿级现代食品产业集群,着力打造休闲食品、冷链食品、预制菜和酒饮品等重点产业链,推动产业转型升级。

      2025年应用会繁荣

      除了猎豹移动,蚂蚁数科也采用人机协同模式。北京商报记者了解到,在数据标注方面,蚂蚁数科AIGD平台通过人机协同进行标注,人工智能算法能够自动识别和预处理大部分基础信息,预标注模型依赖人工标注量降低了70%以上。

      客户需求决定市场,市场永远是动态的。站在客户的角度,“大模型标注更多是在应用层发挥大模型的能力”,猎豹移动副总裁童宁透露。

      他分享了一个有关读取PDF信息的案例,“因为合同的种类有很多种,最初客户认为大模型读取PDF形式合同的正确率到80%就上不去了。后来我们做了POC(概念验证),通过一个智能体理解上下文,调整成一些更优质的提示词。这个流程中,标注团队的能力体现在根据场景设计一套智能体系中间的工作流,并对应成能够输出的高精度的提示词”。

      这些都是大模型应用落地需要解决的问题,即大模型商业化的“最后一公里”。

      “猎豹移动不靠大模型挣钱,也不靠模型接口调取量挣钱,而是通过应用去赚钱,”傅盛认为,“现在可能没有特别顶级的应用出来,2025年大模型应用的繁荣是可见的。”

      他以OpenAI为例手机配资,“最近萨姆.奥尔特曼(OpenAI CEO)接受采访,人家问他OpenAI最缺什么,他说我们最缺产品。OpenAI也是把产品能力、应用能力加强了,最近半年内推出的功能都是应用在做的。所以我认为,2025年应该是大模型大繁荣的一年”。



推荐资讯

  • 炒股配资行情 太二及九毛九初步显现筑底企稳迹象

    近日,九毛九公告第一季度未经审核营运数据。截至3月31日,集团旗下餐厅总数达780家,其中太二品牌610家(自营598家,加盟12家),怂火锅81家,九毛九69家(自营68家,加盟1家)。期内主要品牌同店日均销售额同比下降,太二下降21.2%,怂火锅下降24.2%,九毛九下降18.6%。 公告表示,尽管受到外部环境持续压力影响,该集团主要品牌的同店日均销售额...

  • 银行线上配资 欧盟反制!中方反制!商品市场剧烈波动,后市如何操作?

    美国东部时间4月8日银行线上配资,美方将此前宣布的对中国输美产品加征34%所谓“对等关税”,进一步提高50%至84%。 国务院关税税则委员会昨日发布公告,自4月10日12时01分起,调整《国务院关税税则委员会关于对原产于美国的进口商品加征关税的公告》(税委会公告2025年第4号)规定的加征关税税率,对原产于美国的所有进口商品加征关税税率由34%提高至84%。...

  • 正规实盘配资门户网 49年周希汉一跃从旅长升任军长,邓小平直言:这10年是有意压制你_徐向前_张国焘_麻城

    图|周希汉和陈赓 引言 1949年2月5日,根据中央军委下发的关于统一全军编制序列编号的命令,中原野战军改为第二野战军,原中野第十旅旅长周希汉担任第十三军首任军长。 看到这里,很多人不禁产生疑问:周希汉怎么这么快从旅长一跃成为军长呢? 就在周希汉上任之前,二野政委邓小平找周希汉谈话。两人刚一见面,邓小平便开门见山说:“在这十年来,我们一直在压制你。你很早应该...

  • 配资网站 格力电器获得发明专利授权:“一种除盐雾控制方法、装置及风冷空调”

    本站消息,根据天眼查APP数据显示格力电器(000651)新获得一项发明专利授权配资网站,专利名为“一种除盐雾控制方法、装置及风冷空调”,专利申请号为CN202310082423.1,授权日为2025年4月11日。 专利摘要:本发明公开一种除盐雾控制方法、装置及风冷空调。其中,该方法包括:响应于除盐雾指令,控制节流元件的开度以使排气温度达到预设温度,同时将冷...

  • 股天下配资股票配资平台 滚动更新丨三大股指集体收涨,市场近5000股上涨

    (持续更新中)股天下配资股票配资平台 15:01 A股收盘|三大股指今日集体收涨 市场近5000股上涨 三大股指集体收涨,沪指涨1.16%,深成指涨2.25%,创业板指涨2.27%。市场近5000股上涨。 科技股集体反弹,消费电子、跨境电商、机器人、算力、数字货币、AI应用、智能驾驶概念股活跃;大消费涨幅居前,免税店、乳业、智能物流方向领涨。 14:30 亚...