第396章 DeepSeek问世(1/2)

这两天李宸开始着手规划火星计划的初步框架,一个来自深度求索公司的紧急电话打断了他的工作。

“李总!成了!deepseek成了!”电话那头,章博宇的声音激动得几乎破音,背景里还能听到团队成员的欢呼声。

李宸立刻放下手中的文件:“具体说说。”

“我们刚刚完成了最终测试!”章博宇语速飞快,“基于您提供的初始思路,加上后续您指导的自适应初始化策略和动态梯度裁剪,deepseek在各项基准测试中全面超越了gpt!”

他继续汇报着具体数据:“在mmlu多任务语言理解测试中,deepseek达到了92.1%,比gpt高出20个百分点;在代码生成任务中,humaneval得分87.3%,超过了gpt的84.2%;更重要的是,我们的训练成本比传统架构降低了45%,推理速度提升了一倍以上!”

这些数字并没有让李宸感到很惊讶,毕竟如今的gpt只是第一代,而经过他指导的deepseek可是能和gpt-4掰手腕的,打个小弟不是轻轻松松?

“而且,”章博宇继续说,“我们在您提出的合成数据训练方法基础上做了优化,现在模型在数学推理和科学问题解答上的表现,简直像是......像是拥有了您的一部分智慧!”

李宸微微一笑,这或许就是100点智力带来的间接影响,他在指导团队时提出的那些思路和方法,确实融入了自己独特的思维方式。

“准备发布会吧,”李宸果断决定,“尽快。”

两天后,深度求索公司在国家会议中心召开了盛大的发布会,能够容纳上千人的会场座无虚席,来自全球各地的科技媒体、投资人和业界专家齐聚一堂。

能有这么多资深的专家来全是因为这是李宸的公司,现在全世界都在关注这个华夏天才的一举一动。

章博宇作为ceo主持发布会,当他宣布deepseek的各项性能指标时,台下先是死一般的寂静,随即爆发出难以置信的惊呼声。

一位来自openai的技术专家失声喊道:“这不可能!”

他们作为人工智能的先行者,本以为deepseek只是一款模仿他们的作品,能达到80%的性能就很好了,没想到直接被超越了。

随后的现场演示让所有质疑者都闭上了嘴,deepseek不仅在常规的对话和创作任务中表现出色,更在复杂的数学证明、物理问题推理和代码调试等需要深度思考的任务中展现出了近乎人类的智慧。

在互动环节中,一位来自麻省理工学院的教授提出了一个复杂问题,deepseek不仅准确理解了问题,还给出了一个简洁而优雅的证明思路。

教授当场震惊地说不出话,这是gpt无论如何也无法做到的。

发布会结束后,全球科技界迎来了继核聚变之后的又一次大地震。

《华儿街日报》的头条标题是《华夏ai的惊天逆袭:deepseek全面碾压gpt》。

《科技评论》则写道:“这不仅仅是技术上的超越,更是一种思维方式的胜利。deepseek展现出的推理能力,让人看到了通用人工智能的曙光。”

本章未完,点击下一页继续阅读。