同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答

潮新闻讯 辞旧迎新之际,如旋风般席卷全球AI圈的浙产AI大模型DeepSeek,继续创造历史。

同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答

图源:苹果美国区应用商店

1月27日,DeepSeek应用登顶苹果美国地区应用商店免费App下载排行榜,力压此前霸榜的OpenAI的ChatGPT,而排在第三名的是Meta旗下的Threads。

同日,苹果中国区应用商店免费榜显示,DeepSeek成为中国区第一。

同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答

图源:苹果中国区应用商店

作为“神秘东方力量”的组成部分、“杭州科技六小龙”之一,国产大模型公司深度求索(DeepSeek)被认为是大模型行业的最大“黑马”。2024年底,其以极低的算力(仅为同行的1/11)和GPU芯片数量(2000个)训练出了性能超越GPT-4o的大模型DeepSeek-V3,总训练成本仅557.6万美元(GPT-4约为7800万美元),被誉为“AI界的拼多多”。

同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答

图源:DeepSeek官网

去年12月DeepSeek-V3发布后,轰动世界AI圈。不到一个月之后,今年1月20日,DeepSeek正式开源R1推理模型。

据DeepSeek介绍,其最新发布的模型DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。

低成本实现高性能模型研发,对用户来说的体验感也立竿见影——它功能强大,但却免费使用,并且DeepSeek还将代码面向开发者进行了开源。

据了解,DeepSeek R1没有使用业内普遍使用的监督微调(SFT)训练范式,而是直接通过强化学习让模型自主进化出复杂的推理能力,包括反思和长链思考等能力。这种方法不仅提高了训练效率,还减少了对昂贵计算资源的依赖。

1月24日,一条发布在teamblind平台上的帖子疯传。一名Meta员工称,现在Meta内部因为DeepSeek的模型,已进入恐慌模式。

这位Meta员工写道:“一切源于DeepSeek-V3的出现,它在基准测试中已经让Llama4相形见绌。更让人难堪的是,一家‘仅用550万美元训练预算的中国公司’就做到了这一点。工程师们正在争分夺秒地分析DeepSeek,试图复制其中的一切可能技术……当部门里一个高管的薪资就超过训练整个DeepSeek V3的成本,而且这样的高管还有数十位,他们该如何向高层交代?”

潮新闻记者在手机上下载了R1免费版本的DeepSeek应用,尝试着让它写一副蛇年春联,其中要包括“龙”与“蛇”。大约两三秒就给出了结果,有对仗的上下联和横批,还写了一段文字来解读这幅对联的寓意,十分周全。

同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答

同时,记者增加难度,让它模仿贾谊的《过秦论》写一下隋朝,以《过隋论》为标题。不到一分钟,它就写了洋洋洒洒一大篇,按时间顺序,从隋文帝杨坚的开皇之治到隋炀帝杨广的倒行逆施导致隋朝二世而亡都写到了,条理清晰,观点鲜明。

同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答

最后,记者问它“为什么能够在美国苹果免费应用下载榜上超越ChatGPT”,它给出的答案就有点泛泛而谈了,给人一种“车轱辘话”的感觉。

同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答

1月26日,游戏科学创始人、CEO,《黑神话:悟空》制作人冯骥在微博上评价DeepSeek:可能是个国运级别的科技成果。

冯骥表示:“希望DeepSeek R1会让你对当前最先进的AI祛魅,让AI逐渐变成你生活中的水和电。太幸运了!太开心了!这样震撼的突破,来自一个纯粹的中国公司。知识与信息平权,至此又往前迈出了坚实的一步。”

同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答

图源:冯骥微博账号

值得一提的是,1月20日,深度求索的创始人梁文锋参加了国务院总理李强主持召开的专家、企业家和教科文卫体等领域代表座谈会。

据东方网报道,梁文锋本科、研究生毕业于浙江大学,拥有信息与电子工程学系本科和硕士学位。2008年起,他开始带领团队使用机器学习等技术探索全自动量化交易。2023年7月,DeepSeek正式成立,进军通用人工智能领域,至今从未对外融资。

DeepSeek团队规模不大,不到 140 人,但 “人才密度” 极高,成员多是来自清华、北大、北航等顶尖高校的应届博士毕业生、在读生以及硕士生。值得一提的是,团队没有“海归”,完全本土人才。

同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答

左一为梁文锋。图源:央视新闻截图

梁文锋秉持“看能力,不看经验”的理念,“选人的标准一直都是热爱和好奇心”,这吸引了大量年轻高潜人才,让众多 35 岁以下、工作经验不超五年的年轻人有充分的施展才华的舞台。

在团队管理上,梁文锋采用扁平化管理,淡化职级,鼓励自由讨论和创新,成员依兴趣选择研究方向并自由组队。当一个有潜力的构想出现时,公司会自上而下调配资源。而且,成员对资源和人员的调动不设上限,不存在层级和跨部门的限制,只要有想法,随时可以灵活调用。

梁文锋观点:

“我们创新缺的肯定不是资本,而是缺乏信心以及不知道怎么组织高密度的人才实现有效的创新。”

“对顶级人才吸引最大的,肯定是去解决世界上最难的问题。”

“创新不完全是商业驱动的,还需要好奇心和创造欲。”

“开源更像一个文化行为,而非商业行为。给予其实是一种额外的荣誉。一个公司这么做也会有文化的吸引力。”

主题测试文章,只做测试使用。发布者:九派网,转转请注明出处:https://www.uuxn.cn/article/4279.html

(0)
九派网的头像九派网
上一篇 2025年1月28日 上午11:42
下一篇 2025年1月28日 下午1:52

相关推荐

  • 国足主帅伊万科维奇:面对强敌要踢得勇敢又聪明

    北京时间3月25日晚7时,国际足联2026世界杯亚洲区预选赛第三阶段(18强赛)C组第8轮比赛,中国队将在杭州奥体中心体育场坐镇主场迎战来访的澳大利亚队。3天前客场0∶1负于沙特队的比赛中,中国队不仅未能获得积分,也损失了蒋光太、王上源等主力球员本场无法出场。24日下午进行的赛前新闻发布会上,中国队主教练伊万科维奇表示,希望球员们能够勇敢面对对手,但同时聪明…

    2025年3月25日
    3100
  • 广东最低气温跌至0℃ 多地发布寒冷预警

    中新社广州2月24日电 (记者 方伟彬 王坚)受冷空气影响,广东于24日早晨出现此轮冷空气过程最低气温,其中,粤北高海拔山区最低气温跌至0℃。 广东省气象局介绍,在冷空气影响下,该省近期天气仍较冷。截至24日18时20分,全省仍有44个寒冷预警信号生效,其中韶关、惠州、肇庆等地发布寒冷橙色预警信号,全省寒冷橙色预警信号达26个。 气象专家表示,预计25日至2…

    2025年2月25日
    4800
  • 各地装扮一新年味渐浓

      央视网消息(新闻联播):挂彩灯、逛花市,随着春节脚步的临近,各地的年味也越来越浓。 在北京长安街,大红灯笼、中国结等各种灯饰陆续点亮,十里长街“披红挂彩”迎新春。广州越秀山华灯璀璨,具有岭南特色的大型灯组、水上花灯打造出流光溢彩的喜庆氛围。在陕西西安,今年灯会将38件文物珍宝以灯组的形式进行复刻,让文物“活”起来、“亮”起来,通过这种方式让市民游客感受中…

    2025年1月21日
    5200
  • 新华社权威快报|共促全球科技创新合作!2025中关村论坛年会开幕

    2025中关村论坛年会3月27日开幕。 今年论坛年会主题为“新质生产力与全球科技合作”,设置了论坛会议、技术交易、成果发布、前沿大赛、配套活动5大板块、128场活动,涉及100多个国家和地区,与会嘉宾将共议科技创新培育新质生产力,为全球创新发展提供新思路、新启示。 本届论坛年会将围绕AI大模型、具身智能、量子科技、生物医药、6G、脑机接口等前沿领域,设置10…

    2025年3月28日
    3500
  • 青海玉树州杂多县发生3.3级地震 震源深度10千米

    中国地震台网正式测定:4月15日0时18分在青海玉树州杂多县(北纬32.53度,东经93.48度)发生3.3级地震,震源深度10千米。

    2025年4月15日
    1500

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信