“如果我是一个领导者,一切都以经济为基础,我肯定会更愿意倒闭。就像当时苹果领先一样,因为可以从中获得更多的钱,所以愿意建立一个相对封闭的生态。ChatGPT目前好像就是这个位置。”
【编者按】在2023年人工智能开发者全球先锋大会期间,澎湃科技在上海临港中心开设了一个“超宇宙聊天室”。2月25日下午,在主题为“AI与开源:社区中的社区”的讨论中,Kyligence联合创始人兼CTO李阳、CSDN创始人董事长、极客帮创投创始合伙人江涛、Linux基金会布道者主席APAC、上海市人工智能行业协会秘书长钟俊豪就开源的重要性、开源社区的建设、工程师的待遇等问题进行了探讨,嘉宾们特别谈到了ChatGPT背后的大模式开源。以下为对话实录,有删减。
去开源社区不如去大厂实习。
(上海人工智能行业协会秘书长):我想请李会长先给我们介绍一下布道者的情况。这是什么意思?为什么叫传道士?
李建生(APAC福音传道者Linux基金会主席):从技术角度来看,有很多争论。传播自己的知识,需要传播知识。作为知识火种的热情传播者,一个人被称为传教士。它起源于宗教。现在,对于我们技术开发人员来说,技术是我们的信仰。我们都疯狂于某一种技术,比如我是Linux的超级粉丝,或者我是Java的超级粉丝。事实上,我是一个开源传教士。很多人认为开源需要说教。我们经常低估开源。作为一个从业20年的人,我探索开源的东西越多,发现用两句话解释开源并不是那么简单。我可能需要写三本书才能把这两个字解释清楚。
让我们来谈谈我们的LF APAC福音传道团队。今年我被选为主席。Linux是一种开源技术,也是一个开源社区。后来成立了开源基金会,这是迄今为止世界上最大的基金会之一,相当于一个非常重要的项目,承载了我们很多现代的数字基础设施。Linux基金会亚太区想传播技术和理念,让技术人员拥抱技术,让企业和组织受益,所以招募了一批人,他们以纯粹志愿者的方式做事,不领工资。
钟俊豪:开发者一进入开源社区,他们就必须开源并贡献自己的代码。也有人告诉我,开源不代表以后没有商业价值。
江涛(CSDN创始人董事长、极客帮创投创始合伙人):我给你讲个故事吧。我是一名程序员。对于一个程序员来说,他的最终价值就是作为代码输出。那么代码收费吗,代码有价值吗?比尔盖茨曾经写过一封信,说我们辛辛苦苦写的代码,为什么卖不出去?于是微软建立了微软帝国,微软生来就是卖软件的,所以软件可以卖钱。
但与此同时,一个人出现了。自由软件的创始人理查德斯托尔曼说,你可以卖钱,但是你的代码应该对我公开。因为买了家电,出了问题可以修。你可以卖给我软件,但你得让我来修。以前的软件叫闭源,把软件锁起来。理查德斯托曼说软件不应该被封闭在里面。如果你扩展它,你必须公开代码。所以在1998年,一群人提出了自由软件。能不能改成开源,开源就这样发展。
开源代码,怎么才能传递价值,每个人都能贡献?这是有文化的,里面有各种深刻的道理。我说浅一点。我自己也是程序员。我写了金山词霸,词霸1,词霸2。当时我们录了一个真人,让一个外国人录发音。我给了他一个单词表。他看完之后,我记录下来,变成了文字。我不得不关掉声音。这是我写的程序。一个人念了一串字,我想把它剪开。那时候开源还没那么丰富,因为找不到代码所以自己写了一段,效果也不好。所以汽巴1和汽巴2的话最后可能不太准确,因为我切的不好。
后来我出来创业,我做了复读机,就是你读一段,我给你复读。我还需要切断声音。当时网上起来了,就去网上找,找不到。我问了一个问题,就是想区分一个人说的一句话中一个词的切分音。某专家论坛说,人与人之间是可以交流的。一个德国人说,你的问题很简单。他说你给我100分(积分),我就给你一段代码。我拿了他的代码试了试。太完美了,比我写的好多了。后来我问他,我能用这个代码吗?他说是开源的。他们是搞语音识别的,这个功能是他们最基本的功能,而且是开源代码,拿过来用就行了。
所以人类的进步是科技带来的,是共享开放的,软件属于科技。软件的开放就是开放源代码,人类智慧的结晶就在这个领域。但是你不能只是开放,你要有经济模式,所以这几年开源有了很大的进步,它的商业化和开源生态已经被接受和认可。华为现在投入开源,看到开源对它建立行业领先地位非常重要。开源并不意味着免费。开源现在甚至和商业密切相关。但是程序员喜欢开源,因为你想学点东西。现在最好的软件的代码都是开源的,你可以学习世界上最好的程序员都写了什么,这是人类的财富。
钟俊豪:第一类是每个人都为技术建立了这样一个技术开源社区。第二类是人工智能开发者全球先锋大会邀请的开源和开放社区大概有四五十个。我也看到一些学习型组织,大家一起成长,一起学习。第三类是为可以商业化的项目而组建的组织。
李阳(Kyligence联合创始人兼CTO):这个挺有意思的。一个是社区,一个是免费开源,一个是商业。有句话叫社群比代码更重要,正好呼应了布道者。沉淀下来的是人的知识,代码是知识的一部分,还有描述设计理念的文档和一些软件项目管理项目,记录了知识发展的过程。这个想法是什么时候产生的,第一份草案设计是什么时候,第一份代码成型是什么时候,测试是什么时候?这些都是除了代码以外更大的知识。所以传承下来的开源理念是知识,代码是知识的一部分,承载知识的人可能更重要,这种思想也慢慢演变了。
现在知识开放了,怎么做生意?可以为爱情发电。但不可能每个人都为了爱情发电。这不是永动机。这就把我们带到了开源商业模式的话题上。我先简单回答一下。企业,尤其是传统行业,采购一个开源软件主要是为了服务,其采购的本质是一种技术服务。
钟俊豪:让我打断一下。既然是开源,为什么要购买?
李阳:我用一个俚语的例子,特别好理解。因为我在IBM工作过一段时间,所以IBM有句老话,不会因为收购IBM而解雇甲方。你这话是什么意思?如果我是金融企业,我买了一个IBM数据库。总有一天,银行的金融服务垮了,IBM会出来背锅。IBM会说我错了,我的系统没做好。IBM会对当时做采购决策的甲方采购经理负责,帮助他一起解决危机。尽快解决问题,这就是我所说的技术服务。即使我给你整个免费代码,包括它的相关知识,你自己经营这个业务,你也需要对这个基础设施负全责。但是你可以通过购买技术服务来分担这部分责任。
李建生:让我们从另一个角度来看商业付款的问题。刚才江总提到了一件非常好的事情。如果一个开源项目解决了我们的实际问题,那么它就是有意义的。无论是什么项目,软件,工程,建筑,还是人工智能,想要进入项目,肯定需要各方面的资源。首先需要解决人和物的问题。这个时候我们需要融入大社会,方法有很多。首先是建立商业信任。IBM建立的品牌完全是一种商业逻辑。你信任我,我信任你,大家可以背靠背工作。这是商业非常注重的一个基石,那就是信任。不管我的代码是不是开源的,你都应该通过付费把事情做好。这是方式之一,商业被我们的现代世界所接受。
另一种是捐赠。比如Linux基金会要向政府注册一个合法组织,接受社会、个人、企业、政府的资金。对于全世界的企业和组织来说,帮助一个对所有人都有利的项目,并让它发挥作用,是一个了不起的项目。
钟俊豪:这是因为每个人的热情吗?
江涛:有些人愿意花钱解决问题,而有些人愿意花时间解决问题。有一个开源项目,我自己也花时间折腾过。但是你能保证把自己折腾好就能做到这一点吗?然后对自己有信心。不愿意花钱,这是一种人,80%是这种人,他花不起钱,或者他愿意花时间。还有一类人愿意花钱,比如银行,因为可靠性很重要。这两者形成一个生态。除了捐款,银行用了这个东西,银行说我还有一些功能。你能做到吗?它形成了一个社区。社区分为:不给钱的用户也要需求,给钱的用户也要需求。如果你想影响这个项目,给更多的钱。所以生态的玩法有很多。
钟俊豪:开源的商业形式非常多样。并不是所有人都认为因为开源,所有人都必须免费享受所有的好处。
江涛:你应该致力于开源。首先,你可以学到世界上最好的技术和知识。你说,哦,我可以送我们的孩子去百度实习吗?不会,如果发到Linux社区会好很多。开源是世界上最好的技术展览,你的问题真的有答案;第二,做好开源可以赚钱。
李建生:关于免费的理解,一些经济学家应该普及科学。天下没有免费的午餐,有个学名叫机会成本。其实你在选择开源项目的时候,已经投入了大量的资源,不一定能选择其他的方式。其实这个是需要计算的。你投入开源的时间和资源和你花钱买的有区别吗?很多公司就是因为这个把自己的技术拖向深渊。
钟俊浩:这一段时间,我们围绕人事协会,在推动人工智能整体的产业和人才培育高地的时候,倒真的开始在研究这方面的尝试。我们现在就在考虑论文的引用量,已经在考量这个指标了。第二是在开源开放社区当中的贡献值,我们也开始考量。
蒋涛:很多开源项目有一个经济账。反过来,国家也要把经济账算好,怎么给予开源方向、AI方向各种各样的扶持和支持,搞一个开源的特区政策。
钟俊浩:或许可以在临港尝试。
李扬:这里确实说得对,就是价值闭环,闭环了以后可以螺旋上升,这是一个关键的机制。我倒是有一个很不成熟的想法。最近自然语言模型ChatGPT很火,有一种理解,就是这个模型的能力其实是来自于它学习了所有贡献给它语料的人的知识。按照这个价值链条逻辑来说,是不是我贡献了我的知识给一个AI模型,这个AI模型建造出来以后,它产生的服务能力以及服务产生的商业价值,如果能够回馈到提供智慧给AI学习的那群人,这就好像形成了闭环,这其实适合所有知识贡献者。
如果投影到代码开源的社区里,这也可以有一个具体例子。比如我有一个机器人,它学习GitHub(全球最大的开发者社区)上所有的开源代码,学会编程了,不就可以帮所有程序员写程序了吗?我作为给这个开源社区贡献过算法的人,是不是可以优先来使用它,来帮我写程序?或者我有一个折扣,好像挺合理。而且今天的信息技术应该是可以做到的。因为我上面说到的这些知识资产,其实都在数字化,都已经被系统管理了,账本是捋得清的,虽然可能工作量很大。
李建盛:我从布道的角度谈一谈关于建社区这个事。我们要相信知识的力量。当一个人掌握了一些知识的时候,他能够洞悉所有机理的时候,他会做出自己的选择。我们是站在拥抱开源这一方的,但有很多人是站在诋毁开源或者认为开源不可行的一方。我做布道就是要普及知识。普及知识当然有国家传统的教育通道,还有培训机构,但我们从个人角度搞联盟。我认为从地域的角度来说,比如临港可以搞一些文化沙龙,聊聊项目、聊聊问题。我们要打造这种文化高地,先让知识流动起来。
钟俊浩:最后一个问题。在ChatGPT这种状态下,我们也知道类ChatGPT的开源也开始有了,大家分析一下,这种非常有前瞻性的模型,它的开源或者闭源路径会是怎么样的?
李建盛:我最近读完一本书叫《算法的力量》 ,开源的书里有一本很经典的叫《代码2.0》 。这两本书有一个共同点,它们没有说开源还是闭源,而是说它是我们社会上的力量,有商业的力量,有政府的力量,有法律的力量,有技术的力量,这四种力量在胶着。开源也好,闭源也罢,我们政府能不能承担这个成本,普惠大众。我们这个世界不是一分为二地开、闭。我们都是利益的综合平衡。
有的时候商业的力量很强大,我把高新技术控制住了,我当然可以坐地起价,但政府允许你吗?法律会允许你吗?社区会允许你吗?这是各种力量的胶着。我觉得我们每个人都要去做出平衡,努力让它开源,也得均衡背后推动者的力量。开闭之间,长久来看我们都得开源。但在某个阶段,就好像我们去跟商人达成和谐一样,你让人家有利益。
李扬:如果要说ChatGPT和开源,我觉得是有一层领跑者和追赶者的逻辑。如果我是领跑者,一切以经济为基础,我肯定更愿意封闭一些。就好像苹果在领跑那段时间,它也愿意建立一个相对封闭的生态,因为它能够从中拿到更多的钱。ChatGPT目前看起来似乎就是在这么个位置。所以它如果选择封闭一些,我觉得非常合理,这是符合底层经济原理的。
从追赶者的角度来说,它就更适合开放的模式。因为它会牺牲一些短期利益,但长期会促进交流,火花碰撞,技术进步更快。这一段政府可以发挥很大力量,从最长远的角度,政府有最长的眼光和魄力来做长期投入。
我也很希望国内类似ChatGPT的技术很快起来。但在起来这个阶段,我们需要最大力度去开放,把开放的姿态打开。而且这里我觉得不仅是代码角度,算法只是一部分,人工智能还有一大部分是数据语料,甚至中文世界的所有语料质量对比英文世界的语料质量,假如我的语料质量弱了一些,那我学习的东西肯定起点就弱了。所以我觉得这不光是算法本身,数据、语料甚至更广泛一点,所有信息化的知识本身,都需要打开,然后提升质量。又说到前面那个价值闭环,如果打开能够有一个价值闭环,就好像我献血,然后我生病了,我就能够优先回馈回来,形成这种循环可能是一个最好的效果。
蒋涛:ChatGPT会重写所有的软件,它会是新的操作系统,所以马上会面临巨大的变革,而且短期内,可能三年之内没有人能够追上它,我们只能跟着它的脚步走,这应该是比较确定的。
它会对产业产生颠覆性的革命,人类软件使用方式的重大变革,从命令行到鼠标,到触摸,现在到了对话,对话以后一定会转换成语音交互,这是巨大的历史时刻。
这个产品由于投资巨大,数据非常重要,数据迭代和优化没办法开源开放,领先者具有巨大领先优势。OpenAI也绝对不可能开源的。以后这样的公司再加上机器人,绝大部分人类都不需要干活了,因为物质生产是由算法和机器人完成的,我们干别的活就行了。OpenAI联合创始人山姆奥特曼非常有理想主义,他已经想到了这一点,所以这种公司以后就应该属于国家,OpenAI 90%的收入应该上交美国国库,或者上交给联合国基金会,给全世界人发钱,这是未来趋势。
短期怎么办?大家都慌了,就会出来开源的模式,一家搞不过。ChatGPT就是新一代的“苹果”,新一代的应用就是ChatGPT对话式应用。谁都干不了,大家就开始搞开源吧。开源的产品一开始一定很烂,但开源的优势是跟时间做朋友,一定会出来一个开放式的大模型新生态,对抗微软。未来三五年以后会发生新的变革,基于ChatGPT或对话式智能的新应用时代,大家要学习新的技术。
钟俊浩:一句话,给今年大会的寄语。
李建盛:愿开源更成功。
李扬:开源和AI是很好的组合,再加上上海的金融资本,三个要素加在一起,有可期。
蒋涛:希望未来的大会有更多的开源社区味儿,有更多的自主式的会议和活动。
(对话实录由张静整理,看直播回放视频请)