Email Addresses
1 available
Phone Numbers
0 available
June 19, 2024
<p style="color:#333333;font-weight:normal;font-size:16px;line-height:30px;font-family:Helvetica,Arial,sans-serif;hyphens:auto;text-align:justify;" data-flag="normal"><img data-key="0" src="http://imagev2.xmcdn.com/storages/8206-audiofreehighqps/FE/88/GMCoOSIKR__9AALWxQLkAA_9.png!op_type=4&device_type=ios&upload_type=attachment&name=mobile_large" alt="" data-origin="http://imagev2.xmcdn.com/storages/8206-audiofreehighqps/FE/88/GMCoOSIKR__9AALWxQLkAA_9.png?op_type=0" data-large="http://imagev2.xmcdn.com/storages/8206-audiofreehighqps/FE/88/GMCoOSIKR__9AALWxQLkAA_9.png!op_type=4&device_type=ios&upload_type=attachment&name=mobile_large" data-large-width="750" data-large-height="210.83333333333331" data-preview="http://imagev2.xmcdn.com/storages/8206-audiofreehighqps/FE/88/GMCoOSIKR__9AALWxQLkAA_9.png!op_type=4&device_type=ios&upload_type=attachment&name=mobile_small" data-preview-width="140" data-preview-height="39.355555555555554"></p><blockquote style="font-size:14px;margin:10px 0px;color:rgb(102, 102, 102);border-left:5px solid rgb(232, 232, 232);padding-left:15px;"><p style="color:#666666;font-size:14px;" data-flag="bk-span"><span data-flag="bk-span" style="color:#666666;font-size:14px;">高校所承担的角色更多地是进行技术验证,即探索技术路径的正确性和可行性;而大模型产品化需要企业的介入。</span><br></p></blockquote><span><br></span><p style="color:#333333;font-weight:normal;font-size:16px;line-height:30px;font-family:Helvetica,Arial,sans-serif;hyphens:auto;text-align:justify;" data-flag="normal"><span>| 嘉宾 |</span></p><p style="color:#333333;font-weight:normal;font-size:16px;line-height:30px;font-family:Helvetica,Arial,sans-serif;hyphens:auto;text-align:justify;" data-flag="normal"><span>张奇</span><span> 复旦大学计算机科学技术学院教授、博士研究生导师,“眸思”(MouSi)大模型负责人,MOSS大模型核心人员</span></p><p style="color:#333333;font-weight:normal;font-size:16px;line-height:30px;font-family:Helvetica,Arial,sans-serif;hyphens:auto;text-align:justify;" data-flag="normal"><span>| 内容 |</span></p><p style="font-size:17px;line-height:30px;margin:10px 0px;color:#333333;font-weight:900;" data-flag="subtitle"><span>从MOSS到“眸思”</span></p><p style="color:#333333;font-weight:normal;font-size:16px;line-height:30px;font-family:Helvetica, Arial, sans-serif;hyphens:auto;text-align:justify;" data-flag="normal"><b>复旦金融评论:</b>2023年复旦大学自然语言处理实验室发布了国内首个类ChatGPT模型MOSS,您作为该团队的核心成员,能否分享一下团队是如何实现这一突破的?是因为研究的预见性,还是因为团队在执行上展现出了非凡的速度和效率?</p><p style="color:#333333;font-weight:normal;font-size:16px;line-height:30px;font-family:Helvetica,Arial,sans-serif;hyphens:auto;text-align:justify;" data-flag="normal"><span><b>张奇:</b></span><span>首先,ChatGPT不是一夜之间就出现的。早在2020年,GPT-3就已经发布了。当时,我们就开始与多家企业展开合作,着手进行相关的预训练工作。在2021年,我们就已经与合作伙伴共同推进了相关项目的发展。得益于这些技术积累,当2022年底ChatGPT发布时,我们能够迅速调动已有的技术快速响应。</span></p><p style="color:#333333;font-weight:normal;font-size:16px;line-height:30px;font-family:Helvetica,Arial,sans-serif;hyphens:auto;text-align:justify;" data-flag="normal"><span>其次,我们的实验室在国内自然语言处理(NLP)领域一直处于领先地位。自20世纪90年代起,我们便开始深耕NLP研究,对NLP的各个方面有着深刻的理解和前沿的认知。这也是为什么ChatGPT一问世,MOSS就能够迅速在算法上复现的原因之一。</span></p><p style="color:#333333;font-weight:normal;font-size:16px;line-height:30px;font-family:Helvetica,Arial,sans-serif;hyphens:auto;text-align:justify;" data-flag="normal"><span><b>复旦金融评论:</b></span><span>在MOSS发布后,仅用半年时间,多模态大模型“眸思”横空出世。MOSS和“眸思”的模型有何关联?</span></p><p style="color:#333333;font-weight:normal;font-size:16px;line-height:30px;font-family:Helvetica,Arial,sans-serif;hyphens:auto;text-align:justify;" data-flag="normal"><span><b>张奇:</b></span><span>MOSS和“眸思”是由我们实验室开发的两个不同的模型。MOSS是一个对话式大型语言模型,而“眸思”是一个多模态大模型,能够理解并识别图片内容。这也意味着我们实验室的研究从原本基于GPT3.5的文本模型转向围绕GPT4-v复现多模态大模型。</span></p><p style="color:#333333;font-weight:normal;font-size:16px;line-height:30px;font-family:Helvetica,Arial,sans-serif;hyphens:auto;text-align:justify;" data-flag="normal"><span>随着“眸思”项目的推进,我们开始思考它还能做些什么。“眸思”多模态的处理能力(联合语言和视觉的力量)就像是为MOSS增添了“一双眼睛”。只需拍摄一张照片,“眸思”就能准确描述出周围的环境。这一特性启发我们将“眸思”模型应用于辅助视障人士的公益性项目。想象一下,视障人士只需用手机拍张照片,“眸思”就能告诉他们前面有没有障碍物,或者周围有什么重要的事物,帮助他们更方便地“看清世界”。</span></p><p style="font-size:17px;line-height:30px;margin:10px 0px;color:#333333;font-weight:900;" data-flag="subtitle"><span>从实验室到市场:产学研融合下的大模型产业化</span></p><p style="color:#333333;font-weight:normal;font-size:16px;line-height:30px;font-family:Helvetica,Arial,sans-serif;hyphens:auto;text-align:justify;" data-flag="normal"><span><b>复旦金融评论:</b></span><span>作为一个高校研究团队,“眸思”在资金投入和研发产出方面如何实现平衡?除了公益性质的项目,未来是否有计划做市场化的盈利项目?</span></p><p style="color:#333333;font-weight:normal;font-size:16px;line-height:30px;font-family:Helvetica,Arial,sans-serif;hyphens:auto;text-align:justify;" data-flag="normal"><span><b>张奇:</b></span><span>在大模型的研发和产业化过程中,资金投入是非常大的。不过,得益于2023年与企业的一些合作,我们对大模型的能力边界有了更深入的理解。这也帮助我们在后续的产业项目中能够更加明确大模型的潜力和应用范围。</span></p><p style="color:#333333;font-weight:normal;font-size:16px;line-height:30px;font-family:Helvetica,Arial,sans-serif;hyphens:auto;text-align:justify;" data-flag="normal"><span>实际上,真正在“眸思”项目的资金投入相对较少,并且研发团队也少走了一些弯路。“眸思”的核心工作是验证研究路径的可行性,也就是确定我们能够达到的技术高度、模型的优势与局限、是否具有商业可行性,以及如果落地所需的资金规模。在这一过程中,我们并不需要巨额资金从零开始对模型进行预训练,也不会使用千亿参数规模的大模型。</span></p><p style="color:#333333;font-weight:normal;font-size:16px;line-height:30px;font-family:Helvetica,Arial,sans-serif;hyphens:auto;text-align:justify;" data-flag="normal"><span>我们利用实验室内部已有的积累,包括之前项目的结余资金来以一种可持续的方式逐步推进研发,这就类似于一个滚动发展的过程。一旦“眸思”完成,可能吸引更多企业合作,尤其是在多模态领域。这一方面增强我们产品落地的能力,另一方面也推动我们的研究和开发工作,从而形成良性循环。</span></p><p style="color:#333333;font-weight:normal;font-size:16px;line-height:30px;font-family:Helvetica,Arial,sans-serif;hyphens:auto;text-align:justify;" data-flag="normal"><span>另外一个“眸思”目前主要在做的项目是为个人和企业提供知识问答服务。用户可以在单卡3090这样的硬件上,利用我们的“智工”知识问答平台,实现对内部知识的高效检索和问答。具体来说,我们将数千篇论文上传至平台,平台将自动进行PDF文件解析,使得用户能够直接针对这些文档进行询问并获取答案。在进行前期研究的过程中,我们发现当前市场上缺少一种既能够私有化部署又成本较低的知识问答系统,而且它不仅要能够精确地解析PDF的复杂版式,还要实现高准确率的问答功能,同时避免产生幻觉(即生成与现实不符的信息)。因此,我们致力于开发一套能够满足这些需求的产品,为个人和企业用户提供更加智能化的服务。同时,我们的系统支持全离线操作,无需访问互联网资源。这意味着所有的模型推理和PDF解析工作都可在本地完成。这个项目是我们正在计划未来孵化的业务方向。</span></p><p style="font-size:17px;line-height:30px;margin:10px 0px;color:#333333;font-weight:900;" data-flag="subtitle"><span>智胜未来:中国AI突围之战</span></p><p style="color:#333333;font-weight:normal;font-size:16px;line-height:30px;font-family:Helvetica,Arial,sans-serif;hyphens:auto;text-align:justify;" data-flag="normal"><span><b>复旦金融评论:</b></span><span>鉴于AIGC在内容生成方面展现出的巨大潜力,越来越多的人开始关注“AIGC+”,类似于过去的“互联网+”“AI+”。您认为现在的“AIGC+”和之前的“AI+”哪个更适用于描述现在的发展趋势?</span></p><p style="color:#333333;font-weight:normal;font-size:16px;line-height:30px;font-family:Helvetica,Arial,sans-serif;hyphens:auto;text-align:justify;" data-flag="normal"><span><b>张奇:</b></span><span>我觉得之前的“AI+”还有很多问题未解决。AIGC的核心优势在于其生成能力,包括生成图片、视频等,本身就具备广泛的应用前景。没有把文本生成列入在内是因为以往的文本模型更多强调的是分类,而不是内容生成。但随着生成技术的发展,所有自然语言处理的任务都被视为生成式的结果,将其统一于AIGC的框架之下。</span></p><p style="color:#333333;font-weight:normal;font-size:16px;line-height:30px;font-family:Helvetica,Arial,sans-serif;hyphens:auto;text-align:justify;" data-flag="normal"><span>我个人认为“AI+”的概念更为合适。一方面是因为它涵盖了AI技术与各个领域的结合,而不仅仅是内容生成。以天气预报为例,它采用的是纯数据+大模型的技术。如果将这样的技术应用于工业界,可以极大地提高预测关键数据的准确性,从而有助于实现节能减排、优化生产调度等目标。</span></p><p style="color:#333333;font-weight:normal;font-size:16px;line-height:30px;font-family:Helvetica,Arial,sans-serif;hyphens:auto;text-align:justify;" data-flag="normal"><span>另一方面,我认为并不是所有问题都必须采用生成式方法来解决,它本身也存在一些固有的局限性和缺陷。只能说在目前探索AGI的过程中,生成式可能是比较合适的一个数据驱动模式,但要是完成别的任务的话,生成式未必是最合适的。</span></p><p style="color:#333333;font-weight:normal;font-size:16px;line-height:30px;font-family:Helvetica,Arial,sans-serif;hyphens:auto;text-align:justify;" data-flag="normal"><span><b>复旦金融评论:</b></span><span>就正在研究和应用这些技术而言,您认为AI领域可能会存在哪些突破?</span></p><p style="color:#333333;font-weight:normal;font-size:16px;line-height:30px;font-family:Helvetica,Arial,sans-serif;hyphens:auto;text-align:justify;" data-flag="normal"><span><b>张奇:</b></span><span>在小模型的研究上,实际上很难预测哪些想法最终会取得突破。即便是现在被尊称为“深度学习之父”的杰弗里·辛顿(Geoffrey Hinton),他在该领域早期也曾面临项目资助难和论文无人问津的困境。这表明,当前可能已经存在一些有潜力的研究方向,但它们仍在等待被发现和重视。</span></p><p style="color:#333333;font-weight:normal;font-size:16px;line-height:30px;font-family:Helvetica,Arial,sans-serif;hyphens:auto;text-align:justify;" data-flag="normal"><span>就目前而言,可能的一个方向是实现通用人工智能(AGI)。然而,AI真正要解决的更多是因果推理和逻辑问题。这是一个开放性的问题,也是未来研究需要探索的方向。</span></p><p style="color:#333333;font-weight:normal;font-size:16px;line-height:30px;font-family:Helvetica,Arial,sans-serif;hyphens:auto;text-align:justify;" data-flag="normal"><span>但我认为如果想在AI领域实现真正的突破,可能需要下决心“换道超车”,探索新的方法和路径。例如,放弃传统的大数据、大模型、大算力的模式,转而研究小模型、小数据的可行性,或者寻找其他可能的新途径。关键还是在于鼓励广泛的尝试和探索。尤其是学术界应该倡导多元化的研究思路,鼓励研究人员探索不同的理论,而不是让所有人都集中在单一的研究路径上。</span></p><p style="color:#333333;font-weight:normal;font-size:16px;line-height:30px;font-family:Helvetica,Arial,sans-serif;hyphens:auto;text-align:justify;" data-flag="normal"><span><b>复旦金融评论:</b></span><span>鉴于大模型研发的高成本和技术挑战。您认为国内大模型研发和应用,会被算力和数据“卡脖子”吗?资金投入对于大模型开发有着怎样的重要性?</span></p><p style="color:#333333;font-weight:normal;font-size:16px;line-height:30px;font-family:Helvetica,Arial,sans-serif;hyphens:auto;text-align:justify;" data-flag="normal"><span><b>张奇:</b></span><span>算力和数据短缺是个全球性问题。我认为与其说大模型的研发和应用会被算力和数据“卡脖子”,不如说是与资金投入的多少有关。我估算在资金充足的条件下,要达到GPT-4级别的模型开发,仅技术层面的投入就可能需要40亿元起步。如果遇到一些技术挑战,成本可能进一步攀升至50亿元。这还不包括数据采购、标注、整体运算、后续推广、以及运维的费用,整体来说这是一个百亿级的投入。</span></p><p style="color:#333333;font-weight:normal;font-size:16px;line-height:30px;font-family:Helvetica,Arial,sans-serif;hyphens:auto;text-align:justify;" data-flag="normal"><span>大模型的研究和开发已不再是一个小团队短时间内能快速迭代上线的项目。在移动互联网时代,一个小团队可能几周内就能开发出一个应用并推向市场。但大模型,即使是一个初步的演示版本,也需要数千万甚至上亿的投资。要开发出能与Open AI竞争的产品,所需的投资更是高达十几亿到二十几亿。</span></p><span><br><br></span><p style="color:#333333;font-weight:normal;font-size:16px;line-height:30px;font-family:Helvetica, Arial, sans-serif;hyphens:auto;text-align:justify;" data-flag="normal"><span><strong style="color:#FC5832;word-break:break-all;font-family:Helvetica,Arial,sans-serif;font-weight: normal;">欢迎添加小助手微信FFReview2018,加入听友群。</strong></span><span>第一时间收获经济热点轻解读、在线金融大师课。为了营造更好的讨论环境,我们准备了两个小问题,请在添加小助手后回答:</span></p><p style="color:#333333;font-weight:normal;font-size:16px;line-height:30px;font-family:Helvetica,Arial,sans-serif;hyphens:auto;text-align:justify;" data-flag="normal"><span><b>1. 关于金融方面,您最喜欢/推荐的一本书?</b></span></p><p style="color:#333333;font-weight:normal;font-size:16px;line-height:30px;font-family:Helvetica,Arial,sans-serif;hyphens:auto;text-align:justify;" data-flag="normal"><span><b>2. 您希望听到《财经相对论》聊哪些话题?</b></span></p><span><br></span><p style="color:#333333;font-weight:normal;font-size:16px;line-height:30px;font-family:Helvetica, Arial, sans-serif;hyphens:auto;text-align:justify;" data-flag="normal"><span>采访/制作/运营:葛雯瑄</span></p><p style="color:#333333;font-weight:normal;font-size:16px;line-height:30px;font-family:Helvetica,Arial,sans-serif;hyphens:auto;text-align:justify;" data-flag="normal"><span>收听方式:您可以通过苹果播客、喜马拉雅、小宇宙、网易云音乐、QQ音乐等平台收听节目。</span></p><p style="color:#333333;font-weight:normal;font-size:16px;line-height:30px;font-family:Helvetica,Arial,sans-serif;hyphens:auto;text-align:justify;" data-flag="normal"><span>联系我们:FFReview2018(微信)</span></p><p style="color:#333333;font-weight:normal;font-size:16px;line-height:30px;font-family:Helvetica,Arial,sans-serif;hyphens:auto;text-align:justify;" data-flag="normal"><span>期待与您交流!</span></p>
June 26, 2023
<blockquote style="font-size:14px;margin:10px 0px;color:rgb(102, 102, 102);border-left:5px solid rgb(232, 232, 232);padding-left:15px;"><p style="color:#666666;font-size:14px;" data-flag="bk-span"><b>AI思维的底层逻辑——其基础在于数据,核心在于模型,实现在于算力,具体应用在于业务场景。</b></p></blockquote><p style="color:#333333;font-weight:normal;font-size:16px;line-height:30px;font-family:Helvetica, Arial, sans-serif;hyphens:auto;text-align:justify;" data-flag="normal">嘉宾:丁磊 人工智能商业化落地先行者、历任百度金融首席数据科学家、PayPal全球消费者数据科学创始负责人、《生成式人工智能》作者</p><p style="color:#333333;font-weight:normal;font-size:16px;line-height:30px;font-family:Helvetica, Arial, sans-serif;hyphens:auto;text-align:justify;" data-flag="normal">策划/采访 | 潘 琦<br>制作/视觉 | 葛雯瑄</p><hr style="border:0px;margin:20px 0px;background:#ddd;display:inline-block;width:100%;border-style:solid;height:1px;"><p style="color:#333333;font-weight:normal;font-size:16px;line-height:30px;font-family:Helvetica, Arial, sans-serif;hyphens:auto;text-align:justify;" data-flag="normal"><b>数据、模型、业务形成飞轮效应</b></p><p style="color:#333333;font-weight:normal;font-size:16px;line-height:30px;font-family:Helvetica, Arial, sans-serif;hyphens:auto;text-align:justify;" data-flag="normal">《复旦金融评论》:ChatGPT等人工智能机器人通过交互界面走进大众视野。而实际上人工智能的概念早在1956年达特茅斯会议就诞生了,当下人工智能所用的算法也是上个世纪五六十年代就有的。为什么发展和应用了这么多年的决策式AI没有像生成式AI(或AIGC)引发这么大的轰动效应?<br>丁磊:作为一名从事模型相关工作近20年的人,我认为有必要先简要介绍一下什么是模型。模型是人工智能通过从数据中不断学习和总结得出的一种类似于人脑的思考方式,可以将其理解为知识和逻辑的数字化载体。与存储数据或信息的数据库不同,模型更接近人类的思维过程,通过分析和推理来完成各种任务。<br>人工智能发展了这么长时间,最近才引起了更大的公众层面关注,可能是因为现在的模型发展到了一个新的阶段。现在的这些大模型,如GPT-4,已经初步具备了成年人的通识和逻辑能力,我们可以利用这些模型研发大量的相关应用。从这一角度来说,人工智能对人类社会的生产和工作具有重大意义。<br>《复旦金融评论》:在2020 年的专著《AI 思维》和最近的这本《生成式人工智能》中,您提到目前可以观察到的人工智能应用只是人工智能领域的冰山一角,那么您认为冰山的内核是什么呢?<br>丁磊:2020年《AI 思维》这本书更多关注的是决策式AI,而我们现在新的大模型主要是生成式AI。这两者可以看作是人工智能的两个主要分支。无论是哪种人工智能,我认为其内核都是AI模型驱动的运营模式。换句话说,人工智能的内核是基于数据、模型、业务三者的相互作用所形成的飞轮效应。<br>也就是说,随着数据的不断积累和模型的持续训练,模型的智能程度不断提高,进而在业务中产生更大的价值。而在业务的运行过程中,又会积累更多的数据来训练模型,从而数据、模型、业务之间形成了一种正反馈的飞轮效应。就像是一个飞轮不停地转动,数据越来越多、模型越来越聪明,业务所带来的价值也会越来越大。<br>因此,基于这种飞轮效应可以构建出伟大的商业模式。例如,亚马逊、天猫的推荐引擎可以有效促进消费者的购买行为;字节跳动捕捉到目标受众的需求和兴趣的能力越来越强,抖音推荐的内容越来越精准,让人“上瘾”;自动驾驶通过数据的自学习反馈变得越来越智能,可以实现无人员干预的价值;当前非常流行的图片生成工具,如Midjourney,其团队虽然很小,但却通过数据和模型的正反馈的效应,使其生成的图片越来越符合人类需求。<br>《复旦金融评论》:您能不能为我们再解释一下,为什么到了生成式人工智能这样兴起的一个阶段,会有这样的一个正反馈效应?随着生成式人工智能的兴起,人工智能领域是否会加速发展?<br>丁磊:飞轮效应并不仅限于决策式AI或生成式AI。实际上,它是人工智能的一种本质学习属性,可能带来正反馈机制。但要实现这种效应,须建立完整的数据、模型、业务闭环,否则效应难以实现。<br>展开来说,决策式AI更像是在做选择题,分类是它的强项。人脸识别就是一个典型的案例,决策式AI对实时获取的人脸图像进行特征信息提取,再与人脸库中的特征数据匹配,从而实现人脸识别。当然,现在人脸识别模型的基数是非常大的,动辄处理成百万、上千万的人脸数据,并进行相应的识别。<br>而生成式AI则擅长做简答题,以创作为长处。我们所说的生成式AI,其核心在于生成内容。而“内容”是一个相当广义的概念,不仅仅指常见的文本、图片、视频、音乐等形式,还包括日常工作中所涉及的方案、策划、程序、代码。在人工智能的发展过程中,无论是决策式AI还是生成式AI都需要飞轮效应的推动。<br>那么,为什么决策式AI之前没有受到太多关注呢?作为从事AI相关研究并在企业中开发应用的人员,我发现决策式AI一直以来的特点是难以呈现。比如,我之前在PayPal、在百度金融使用决策式AI来优化业务,这种优化很难被可视化展示出来。这也在一定程度上解释了为什么决策式AI之前没有引起更多的关注,除非在一些相对细分的领域,如自动驾驶。决策式AI应用通常属于企业后端,可以说是企业的决策大脑,这些领域吸引了大量的研究,因为它们具有成熟的且实体的产品。但普通消费者可能无法很好地理解或看到。<br>相比之下,生成式AI则可以让人们看到它生成的内容。例如,ChatGPT等生成式AI可以让用户与之简单交互,这也是为什么生成式AI能够吸引更多人的原因之一。<br>《复旦金融评论》:未来对于算力的竞争是否会成为各国家和地区和平台之间竞争的关键?<br>丁磊:要训练出真正功能强大的人工智能,处理算力这一重要的资源,还需要数据、模型和业务模式。只有当这四个要素相互促进形成闭环的时候,才能真正训练好人工智能。这是一个复杂的过程,仅仅依靠算力和训练数据的投入是不够的。<br><br><b>AGI有多远</b><br>《复旦金融评论》:GPT-4之后的生成式AI模型已经发展到跨模态的阶段。您之前在2020年出版《AI思维》一书中描述当时的人工智能还处于“弱人工智能”的阶段,您觉得目前到了什么阶段?如果我们要迎接AGI(通用人工智能)还需要多久? <br>丁磊:ChatGPT的“横空出世”让普罗大众对人工智能的突破有了新的认识。目前的自然语言处理技术和大型语言模型确实展现出了一些AGI的影子,但我认为距离真正的AGI还很远。因为ChatGPT等模型虽然已经具有智能对话、语言翻译、文本生成等使用功能,但它们仍然缺乏某些关键的特征和能力,如跨模态感知、多任务协作以及自我学习与适应、情感理解、超级计算能力等。<br>第一,跨模态感知。我们将平时接触到的每一个信息来源域称为一个模态,这些来源可以使文字、声音、图像、味觉、触觉等等。随着信息技术和传感器技术的发展,模态的范畴也变得更广。跨模态感知涉及两个或多个感官的信息交互,如最基本的图像检索就是一种从文本到图像的感官转换。反过来,从图像到语言的转换,可以帮助有视觉感官的缺陷的人们,强化感知环境的能力。人类天然具有跨模态感知能力,能够对来自多种感官的信息进行整合和理解。而当前绝大部分的人工智能系统只能单独的运用其中的一项作为传感器来感知世界,对于不同的模态,需要设计不同的专有模型。例如,根据文本生成图像的模型,采用的是将文本和图像进行联合编码的专有模型,这种模型无法适配声音生成等其他任务。各种模型之间无法真正打通是走向AGI的一大痛点。<br>第二,多任务协作。人类能够同时处理多个任务,并在不同任务之间进行协调与转换。当人们面对机器人时,一句简单的吩咐,比如“请帮我热一下午餐”,这些指令听上去简单,执行时却包括了理解指令、分解任务、规划行走路线、识别物体等一系列动作,针对每一个细分的动作都有专门的系统或模型的设计。这就要求机器人具备多任务协作的能力。<br>第三,自我学习与适应。人类具有学习和适应能力,能够通过不断的学习和经验积累来提高自己的能力。因此,研究如何让人工智能系统具备自我学习和适应能力也是实现AGI的必要步骤。其中主要包括增量学习、迁移学习和领域自适应三个方向。<br>《复旦金融评论》:相对于人类的思维方式,人工智能的局限性以及其认知背后的逻辑方面是什么呢?<br>丁磊:人工智能模仿的是人脑,但又不同于人脑。人类侧重于从经验中学习,而人工智能则依靠模型从数据中学习。 <br>那么,人工智能的天然优势是什么呢?首先,其优势在于强大的算力支持,使得它的学习能力没有上限。研究表明,即使是勤奋的人每天最多也只能接受2兆容量的信息。此外,人工智能的学习速度非常快,只要有充分的数据和足够的算力,它就可以在短时间内学习接近无限量的数据。其次,人工智能善于掌握“有迹可循”的规律,快速处理规律性强的任务。<br>而人类的优势是社交智慧、创造力、精细感知和操作能力。社交智慧是人与人交互的技能,包括同理心、谈判能力、社交洞察力等情感能力,对应的职业主要是教师、销售、心理咨询师、管理人员、社工等;创造力指的是原创能力和艺术审美能力,对应的职业主要是艺术家、作家、研发工程师等;精细感知和操作能力指的是手指灵敏度、协调操作能力和应付复杂工作环境的能力,包括专业能力、行业经验、工作效率、完成效果等,对应的职业主要是律师、医生、司机、美发师、急救人员、电工等。<br>因此,人工智能在处理不面对人、创新性和变通性较低的工作时,效率更高、稳定性更好,而面对需要情感交互、相对复杂场景或者需要创新性高的工作时,就表现得不那么令人满意了。<br>《复旦金融评论》:超级人工智能是否会对人类社会造成威胁?在2023年4月,马斯克等人曾发表联名声明,呼吁暂停比GPT-4更强大的模型的训练。您认为背后的原因是什么?<br>丁磊:人工智能和其他技术一样,本身是中性的,其风险取决于人们如何使用它。我们应始终秉持“科技向善”的理念,并从法律和伦理角度引导人工智能朝着这个方向发展。要保证模型的发展朝着科技向善的方向发展,就需要在模型训练时,注意训练所需要的数据“原料”要更广泛、更全面;在算法方面,要贯彻公平正义、透明可验证的原则。<br>当然,法律不应成为限制技术进步的桎梏。法律的推进虽然往往滞后于科技发展的速度,但仍应积极做出回应,正如中国国家互联网信息办公室起草的《生成式人工智能服务管理办法(征求意见稿)》即将立法审议,旨在促进生成式人工智能技术健康发展和规范应用,进一步促进科技进步,确保“科技向善”,助力行业发展,实现产业升级。<br>《复旦金融评论》:美国当地时间5月16日,美国参议院首次就人工智能的隐私、技术和法律问题举行听证会。人工智能领军者 OpenAI 呼吁政府介入监管,发布实施“注册制”或“许可制”。中国在这方面可以做一些借鉴吗? <br>丁磊:我认为这肯定是个方向,不仅仅在国家层面,像抖音这样的大型平台也在生成式AI领域出台了一些指引性办法。它要求当生成式AI为创作者时,必须注明这是由算法生成的作品,并打上相应的数据标签,以便清楚地表明这是由算法生成的,而不是人类创作的。因此,无论在国家层面还是平台层面,都有相应的规定来引导人工智能更健康、更良性的方向发展,最终实现“科技向善”的目标。<br><br><b>替代业务流程,重塑商业模式</b><br>《复旦金融评论》:如果以2022年ChatGPT引爆生成式人工智能为起点,2023年初中外各类科技公司都纷纷发布了自研的模型和插件,进入“百模大战”的阶段。而目前的关注度逐渐转移到应用方面。您是否能给我们介绍一下生成式AI从模型侧向应用侧转移的基本情况?<br>丁磊:短期来看,我认为生成式AI的商业价值是提升效率。其实,如今已经有不少中小企业开始使用生成式AI,比较显而易见的是通过生成式AI工具来提高图片和文案创作的效率。在这个过程中,如果一家企业能够快速地使用AI,就能够跑赢竞争对手。换言之,一家企业能否很好地利用生成式AI,将标志着这家企业是否能在千变万化的市场中站稳脚跟、持续保持足够的竞争力。<br>中长期而言,生成式AI的出现很可能改变现有的业务模式。具体来说,传统行业中的各个职能领域,如研发、生产、供应链、营销和客服等各环节,在生成式AI的支持下重塑相应的业务流程,甚至是重构业务模式。这意味着我们可以使用生成式AI的程序来替代之前需要人工来完成的任务,从而提高业务流程的效率和质量,促进业务的发展和进步。<br>另外,生成式AI的涌现可能会掀起新的商业模式浪潮。举个简单的例子,现在许多时尚达人和主播已经被数字人所取代。数字人主播可以24小时在线,不间断地为客户提供货品推荐介绍及在线服务,由其打造出的IP资产也是品牌自身的资源。同时,数字人主播不受人为情绪、健康等影响,更加稳定和可靠。在我看来,这将为生成式AI产业带来长远的价值。<br>《复旦金融评论》:您之前在PayPal创立了人工智能平台,也曾经在百度金融担任首席数据科学家,您能否结合多年深厚的经历,为我们分享大数据、人工智能等技术的应用对于金融领域有怎样深刻的影响,比如在营销、风控、投顾、投研等方面的实际应用是否有效可行?行业的发展已经到了什么阶段? <br>丁磊:我可以分享一下过去一些我自己实际操盘过的案例。<br>之前在PayPal工作的时候,PayPal作为一个硅谷公司,拥有丰富的数据资源,但是在应用人工智能方面并不是很早。这是因为它也是一个具有金融属性的公司,与其他像谷歌之类的公司对应的发展方向并不相同,所以在人工智能领域的应用落后了很多。我则负责构建基于人工智能的数据科学平台,用于分析公司全球范围内数亿消费者的数据。通过分析这些数据,我们可以预测消费者下一步的行为并对其进行定向营销。<br>由此,我们建立了消费者行为预测引擎,通过它精准地预测了消费者未来可能购买哪些商品、关注哪些商家。以便我们提前将相应商品的信息或者一些折扣信息带到消费者面前,促进消费者在适当的时间购买。通过这种精准的AI营销,我们为PayPal带来了巨大的收益,公司的营销活动响应率提高了两到三倍。可能原来有10个人响应一次的营销活动,那么现在可能会有20个或者30个人响应营销活动。这是在PayPal进行了AI营销方面的一个实践。<br>在百度我主要负责金融风险控制模型。众所周知,金融行业中最关键的是风险控制,绝对没有风险的贷款行为是不存在的。通过海量的数据分析,我们构建了精准的消费者风险模型。根据画像、行为等因素,我们能够较好地评估风险,进而控制风险。例如,一些人的行为稳定,向他们提供贷款是非常安全的;一些人的行为则会导致逾期风险较高。<br>通过该风险控制模型,百度金融取得了长足的发展。2015年它的放贷规模只有50亿,到2018年时达到了1,500亿,提升了30倍。其背后的原因就是大量的使用了人工智能技术进行精准的风险控制,提升了业务的规模,使得整体风险维持在极低水平。<br><br><b>那么,人类又该做什么</b><br>《复旦金融评论》:您提到了在精准营销和融资效率方面的应用,随着生成式AI的兴起,会带来一个怎样的新变化呢?<br>丁磊:我刚刚所说的主要还是决策式AI,而生成式AI可以从两个方面来解读。一方面,生成式AI可以精简、优化既有的业务流程。通过分析大量的数据,识别常见模式和规则,生成式AI能够生成与业务流程相契合的自动化程序,提高组织生产效率和自动化水平。大大减少人工的干预,进而解放人力、降低成本,同时还可以提高业务流程的执行效率。<br>举例来说,现在开发人员已经开始用ChatGPT来编写代码了,只要开发人员给的要求和提示足够完整,ChatGPT甚至可以编写完整的代码。ChatGPT同时还能阅读已有代码,添加注释或者纠错,如此一来便可极大地提升代码、文档的编写和审查效率。<br>另一方面,基于生成式AI的新流程可以替代原有的人力所承担的业务流程。原先人力不足的情况下,只能将业务外包,在效率并未提升的情况下,成本却在逐步上升。有了可以胜任业务的生成式AI,自然就可以替代原有的业务流程。智能客服就是其中一个典型的案例。<br>此时,人类要做好“一前一后”的工作。在内容生成之前,人需要与生成式AI合作,明确内容方向和业务节奏。在内容生成后,人需要对生成的内容进行评估、修正和优化,并与下游业务对接。因此,人需要发挥自身的主观能动性,完成好“一前一后”的工作。<br>从实现角度而言,可以将生成式AI工具与公司内部的ERP(企业资源计划)系统集成,形成端到端的解决方案,以全局化的方式优化业务流程。如自动生成项目排期计划。又如可以将ChatGPT用于低代码平台通过对话聊天的方式自动构建流程框图等。而在这个过程中,生成式AI与这些管理系统不是并行关系,而是将整体业务流程融合。随着搭载生成式AI的解决方案走入更多的企业和组织,生成式AI也将带领它们迈入更高效的业务流程时代。<br>《复旦金融评论》:在未来5年内,我们这些普通人应该做些什么?除了技术人员以外,是否每个人都需要学会GPT的操作和应用,以便在学习和研究中使用这些AI工具呢?<br>丁磊:其实真正被人工智能取代的工作很少,但是绝大部分职业都会受到影响。根据普华永道2018年12月发布的《人工智能和相关技术对中国就业的净影响》估算,未来20年,中国现有约26%的工作岗位将被人工智能及相关技术取代,但是人工智能及相关技术通过提高生产率和实际收入水平,能够产生约38%的新工作岗位,最终将净增约12%的工作岗位。因此,人工智能带来的影响并不是简单的取代工作岗位,而是对职业结构的影响。<br>与其说人工智能将取代从业者,不如说它完成的是枯燥繁重的工作内容。它淘汰的不是人类,而是落后的生产力。对个人而言,人工智能不是竞争对手,而是我们的工作伙伴,它将成为必要的生产要素,使生产力倍增。我们应该做的是训练和使用人工智能,让人工智能为我所用,与人工智能一起工作( Work with AI)!<br>首先,应该拥有AI思维。所谓AI思维,本质上是一种“数据驱动”的思维,就是从大量数据中形成模型,进而对未知的情况做出最佳预测。在AIGC的应用中,则是从大量数据中形成模型,自动生成全新的内容。无论是决策式AI模型还是生成式AI模型,其基础逻辑都是一致的,只靠逻辑和经验难以推导,需要海量的数据进行训练。我们需要理解AI思维的底层逻辑——其基础在于数据,核心在于模型,实现在于算力,具体应用在于业务场景。拥有AI思维能够避免经验主义带来的主观、片面和限制,具有积极的意义。<br>其次,我们需要拥有AI工具思维。掌握数据化思维,掌握使用人工智能、训练人工智能的方法,使其具有更强的适配性,将我们从繁杂的事务中解放出来。未来,人人都可以是AI的使用者和训练师。<br></p><span><br></span><p style="color:#333333;font-weight:normal;font-size:16px;line-height:30px;font-family:Helvetica, Arial, sans-serif;hyphens:auto;text-align:justify;" data-flag="normal"><span>本文代表受访者个人观点,仅供读者参考,并不构成为投资、会计、法律或税务等领域提供建议。</span><br></p>
March 7, 2023
Pod Engine is not affiliated with, endorsed by, or officially connected with any of the podcasts displayed on this platform. We operate independently as a podcast discovery and analytics service.
All podcast artwork, thumbnails, and content displayed on this page are the property of their respective owners and are protected by applicable copyright laws. This includes, but is not limited to, podcast cover art, episode artwork, show descriptions, episode titles, transcripts, audio snippets, and any other content originating from the podcast creators or their licensors.
We display this content under fair use principles and/or implied license for the purpose of podcast discovery, information, and commentary. We make no claim of ownership over any podcast content, artwork, or related materials shown on this platform. All trademarks, service marks, and trade names are the property of their respective owners.
While we strive to ensure all content usage is properly authorized, if you are a rights holder and believe your content is being used inappropriately or without proper authorization, please contact us immediately at [email protected] for prompt review and appropriate action, which may include content removal or proper attribution.
By accessing and using this platform, you acknowledge and agree to respect all applicable copyright laws and intellectual property rights of content owners. Any unauthorized reproduction, distribution, or commercial use of the content displayed on this platform is strictly prohibited.