第303章 关于人工智能的合作(2/2)
不过这些东西他完全可以自己做,没理由让李宸来分一杯羹。
他微微一笑,说道:“关于这个,我们董事会还在商量。”
李宸知道这只是梁文峰的托辞,毕竟梁文峰在自己的公司占股超过百分之五十,做不做也就是他一句话的事。
他不紧不慢地说:“这个chatgpt确实好,但是也有缺点。”
梁文峰没想到自己眼中近乎完美的chatgpt竟然还有缺点,疑惑道:“什么缺点?”
李宸的回复很简洁:“成本高。”
梁文峰皱着眉点点头,他就是这个专业的,自然能明白做出chatgpt需要的钱很多。
其中最大的开销就是需要高端的gpu,一张就是数万美元。
而训练一个大模型预估的gpu数量在一万张左右,这绝对是一个非常恐怖的数字。
最关键的是如果能做出来倒还好,问题是你并不知道花几个月时间训练出来的大模型到底能做到什么程度。
chatgpt也不是一下就成功的,而是持续训练,不断优化,一直烧钱。
他好奇道:“李总的意思是?”
李宸笑着说:“我有办法降低成本。”
梁文峰半信半疑地说:“真的假的?”
在人工智能这方面,目前做出chatgpt的openai就是当之无愧的世界第一。
他们都没有找到简单方法,李宸一个大一学生,还是金融专业的学生,会有什么办法?
只是因为李宸的神奇,所以他还是抱有一些期望,没有直接否定。
李宸知道梁文峰不相信自己,打算先露一手。
他有条不紊地说:“首先我们可以从模型架构入手,chatgpt使用moe架构,我们可以继续沿用,不过我们可以利用稀疏激活,这样推理时实际计算量只会相当于小模型,可以大幅降低训练和推理成本。”
梁文峰越听越感觉有道理,知道李宸绝对在人工智能上造诣很深,忙问:“那如何来做这个稀疏激活呢?”
话音刚落,他看到李宸慢悠悠地喝了口酒,知道自己唐突了,这种核心技术李宸肯定不会说出来。
李宸笑着说:“我对人工智能也很感兴趣,最近准备成立一家新公司,想和梁总合作。”
梁文峰有些意动,问道:“ 那出资和股份占比这些怎么算?”
李宸回道:“ 出资和股份一人一半,然后我提供技术指导,梁总提供数据库和人才支持。”
梁文峰赶紧说:“这样分配不合理,数据库和人才都是稀缺资源,我要百分之七十的股份。”
李宸微微一笑,说道:“ 国内可以做这个的可不止梁总的公司,只不过我对梁总的公司比较感兴趣而已。我相信很多人都对将大模型的成本压缩到十分之一非常感兴趣。”
梁文峰震惊了,不可置信地说:“十分之一?”
李宸点头道:“没错,我刚才说的只是其中一个部分。其他还有很多地方,比如说量化与模型压缩、推理引擎、训练策略等等。十分之一一点都不夸张。”