清流资本 Crystal Stream

【新一轮AI来了】梦秋对谈数美科技唐会军:使用AI工具的人和AI工具的边界

清流资本 2023.4.27

编者按

AIGC 爆火出圈引发了一系列关于新一轮AI技术的讨论,有人兴奋于底层大模型技术迭代带来的生产力大幅提升,有人担心会因为AIGC强大的生成能力失去工作,甚至,还有关于人类未来是否会被AI替代的恐慌。

清流资本认为,新AI技术的出现是令人兴奋的,但是,技术真正落地到实际场景也需要时间,与其对未知的未来过度反应,不如冷静地坐下来看看,新一轮AI技术到底给人类带来了什么。

清流资本推出【新一轮AI来了】对谈栏目,由清流资本创始合伙人王梦秋 1v1 对谈清流投资的科技企业创始人,探讨新一轮AI技术的进展、时间节奏、可能的应用场景,以及,随着我们进入新AI时代,与AI共存的人类会是什么样的?

嘉宾简介:

唐会军硕士毕业于南开大学,曾先后出任百度“系统技术委员会主席”和360高级技术总监 ,同时担任中国信通院互联网新技术新业务安全评估中心高级评估专家,拥有十余年互联网大数据在线产品研发与管理经验,拥有数十项大数据相关技术专利 。

唐会军于2015年6月创立数美科技,致力于用AI技术解决在线业务中广泛存在的各类风险问题。数美科技推出了“天网”与“天净”两大智能风险识别引擎,为客户解决营销欺诈、支付欺诈、渠道假量,音视频内容合规等业务风险问题。已服务全球超过3000家客户,覆盖银行、保险、航旅、电商、社交、视频、教育、游戏等领域。遍布全球的数字风控服务网络每日承载百亿次风控服务请求。

公司核心成员均来自百度、阿里、腾讯、360、小米等知名互联网企业,在大数据、人工智能、机器学习等领域具有丰富的实践经验。

目前,公司已完成1.35亿美元D轮融资,入选北京市首批专精特新创新中小企业,北京民营企业科技创新百强榜单。

AIGC让我们业务的需求急剧膨胀

王梦秋:我先问一下,你觉得这新一波的AI跟上一波AI有什么区别?其次,这一波对于咱们数美科技来说有什么新的机会?第三,不管是对咱们自己的业务流程,还是对咱们所服务客户的业务流程,你觉得会有什么样的变化和影响?

唐会军:之前的AI主要是决策式的AI为主,主要是做各种判断,例如推荐场景的是不是喜不喜欢的内容,安防领域(判断)是不是数据库的某个人,风控领域(判断)里面是不是有风险的人等等。

王梦秋:是,就回答yes or no,我们都通常会讲它是一个理解。

唐会军:对,所以过去主要以决策式AI为主,决策式AI经过这么多年发展,形成了一些典型场景:安防类、推荐类,还有我们风控类的,严格意义上也是泛安全类的。决策式AI的场景是相对有限的,没有那么多。然后这一波的AI,它是生成式的,它有很多的场景是原来决策式 AI覆盖不到的,生成图、文章、视频等,它极大地拓展了AI 能够触达的场景。大家为什么这么兴奋呢?就是因为它不再局限于决策类的有限场景,极大拓展了AI的应用场景,这一下把大家的想象空间打开了。这是偏宏观的理解。

王梦秋:咱们的核心业务是做风控的,那么现在,咱们用了AI的什么能力?哪些部分用了AI ,或者说,之前判决式AI的算法?

唐会军:我们的内容风控业务里面所有的视频、图片、文字内容风险判别都在用AI算法。例如我们判断图片有没有未成年、色情血腥、违禁等风险内容,就用到了大量神经网络相关算法,包括视频里面的劣迹艺人识别就用到了人脸识别技术,这些都是典型的计算机视觉(CV)相关AI技术。

王梦秋:所以那也是用了深度学习,神经网络。

唐会军:必须的,例如我们识别语音里面有没有风险内容,现在是把语音通过ASR技术转成文字,再通过NLP技术识别风险内容,AI里面三大块技术我们业务场景都有用到:视觉、ASR、 NLP。所以我们的业务其实用了大量的AI决策技术。这些AI 技术的应用,更多体现在对内容的识别准召率的提升方面,包括我们做的账号风控产品判断行为有没有风险,也是一样的用到决策式AI技术。

王梦秋:除了咱们说到的宏观的理解以外,你觉得新一波AI技术对咱们自己的业务这方面有些什么影响,或者是促进作用吗?

唐会军:AIGC起来以后,对我们的业务影响有几个维度。利好的一方面,是扩大了我们服务客户的范畴。我们的“天净”产品核心是去识别内容的合规。过去,内容的生产更多是PGC,专业的编辑、编剧才能做到。Web 2.0的时代,出现了UGC,所有的人都可以生产博客、视频,这些人工产生的内容,极大提升了内容的数量,给我们的产品带来很大的需求。到了AIGC时代,不需要靠人就可以产生很多的内容了,而这些内容本身也是要需要做合规的一些检测,保证机器产生内容出来是合规可控的,国内外都面临同样的问题。

所以就一下子让我们能够服务的内容的数量和场景就进一步地加大了。靠人产生的内容还是有限的,但是靠机器产生的内容数量就会急剧的膨胀。我们认为,未来 AIGC产生的内容数量会极大地超过UGC。这是对我们的业务利好的一面,让我们业务的需求量急剧膨胀,我们现在服务了非常多AIGC领域的客户。

产品层面,我们现在用AIGC做一个很重要的事情——用ChatGPT去做数据打标签,以前我们打标基本是靠人,成本很高,我们花了很多钱在数据的标注上面。但我发现ChatGPT有很多接口,它可以打一些很基础的tag,有些tag还挺准的。我们还在持续尝试,走通后我们训练数据的标注成本会显著下降。

王梦秋:就相当于我们不用人工,直接用生成式AI去(打标),调用GPT的接口。那这样的打标签还需不需要人工去校验呢?

唐会军:我们会去评估一下准召率,因为它的模型会容纳一定的噪音,准确率能做到 95% 以上就可以了,目前来看还是比较准的。这对我们有个要求,我们要去设计抽出什么样的底层标签出来让ChatGPT去打,又帮助我们把大的模型的训练效果变好,我们一直在设计这个事情。初步证明它的打标的能力还是很强的,而且它的标签多样性很强。

过去一直受限于成本,我们的数据量、规模靠人标注是有限的,你的质量、速度、成本都很高,所以在这做好以后,我预期我们的模型的训练数据量会比之前要大很多。我们现在特别看好这个事情,每周都在碰进展,就把它(ChatGPT)的技术跟我的模型的打标结合起来了,然后去进一步地提升我们决策式产品的准确率。

王梦秋:听起来是不仅是提高效率,而且本身就是这个效果也在提升 ,是吧?

唐会军:因为决策式AI很依赖于一个是算法、一个是数据。你数据选得越来越好的、标准选得越好、指标越多的话,这个一结合,它的指征就越好。决策式的AI里面可能七八成的效果是靠数据。

王梦秋:但生成式其实也很靠数据,对吧?但现在相当于数美是用咱们的数据训练它来打标签。

唐会军:对,用它打标签,然后再去做我的模型的训练。这个是目前我们基本走通了的一条路。另外一条路还在尝试,用GPT相关技术去提升我们产品的准召率,这条路还在不断探索中。

垂直场景的护城河

唐会军:因为它(ChatGPT)是通用大模型,我们现在试图在解构它、借鉴它的一些思路和方式,想去学习它,为我们垂直场景所用,那这个我们就刚开始。

王梦秋:就是咱们会试图就去构建一个基于咱们自己垂直应用场景的模型,但是我们可以不需要那些所谓的上千亿的参数,对吧?

唐会军:对,我们这个场景还是个垂直场景。但是我们用大模型的思路,大模型在更广泛的场景下效果都这么好的话,我的语料数据局限在具体的一个场景下,它是不是效果也会很好。理论上我们这个想法也是成立的。

王梦秋:大模型的通用能力很强,很大程度上就是因为它的数据规模大和算力power大。但如果我们把它局限到我们所拥有的比较垂直场景的数据,会不会就没有这么强的效果呢?

唐会军:在局部的场景下,其实我们数据量也很大的。我的问题,或者我的答案都是在局部的场景下,所以在局部下我的数据密度、覆盖度有可能比它还更大。这是我们目前的一个逻辑假设,但这些路还没走通。

王梦秋:明白。其实这跟我另外想跟你探讨的一个问题有关系。随着底层通用大模型能力越来越强,有很多上层应用的能力就被它cover了,比如刚才说的文案生成,以后非常有可能他们也会cover到文生图、文生视频。所以垂直的行业的这些公司,未来的护城河是什么?比如我们过去若干年积累下来这些数据。刚才说的构建新一代AI模型的三大要素——数据、算力和算法。算力、算法先不说,但是数据本身还是一个很重要的东西。那咱们会是在数据这个门槛上比较高吗?因为其实洗数据也是一个非常需要经验的东西。

唐会军:数据就跟我刚说的那个逻辑一样,在通用场景下它总的数据量是非常非常庞大的,但可能在垂直领域它的数据的密度和数量就没那么多了。我们最近也在评估,直接用我们的决策式的结论(对比ChatGPT),它也具备这个能力,但是它的准召率是比不过我们的。大模型跟一个垂直场景的模型比的话,垂直模型可能在局部数据的密度和数量是比它要更大的。所以如果你要ChatGPT跟垂直类的模型拼准召的话,我个人理解是拼不过的。很多决策式覆盖不了的场景,它确实很强。

王梦秋:数美现在服务客户在咱们这个领域算是通用,还是说我们针对不同的用户,还有一定程度的定制?

唐会军:底层逻辑就是我们是个风险识别产品,所以我们会把风险识别通过产品逻辑定义成很多的维度,什么叫风险?色情的风险、未成年的风险等等,我们定义很清楚。所以我们具备一个风险识别的大宽表,所有的客户在大宽表里面去选自己需要的能力,可能90%以上能力都是通用的,像色情、未成年的(风控)没有人是不选的。还会有少量的能力他们可能会自己去选,但是本质在产品上都具备这个能力了,他是在勾选的模式。

王梦秋:我们的方向是做到在这个领域的更全?

唐会军:对。他就选就好了,不需要给他额外去定制,定制开发的概率是极低的了。有可能我有1000个维度能力了,过了很久才会说有客户来以后,非常小的概率会出现1001、1002的能力,我们会放到这个能力大宽表里面去,类似客户又可以接着用它了。

会用AI工具的人,取代不会用它的人

王梦秋:刚才你也提到,新一代的 AI 生成式工具出来,可能原来有很多人类的岗位确实是会受影响,对吧?我们用AI模型来自动打tag,打得又准又好,那原来的很多人工标注的人,我们只需要留下一部分,就是设定什么叫标注得好的这个标准的这些人。所以这引出另外一个想跟你探讨的问题,放到咱们具体的语境下来讲,人才模型你觉得会发生什么变化,以及这个更往远一步说,教育这件事情,咱们要培养什么样的人才?

唐会军:我举个例子,因为我们做风控有专门研究黑产的团队,他在做黑产研究的时候要写工具去爬一些情报、一些信息,他原来的方式是提需求给研发工程师帮他写,最近那个 leader 跟我说,会军我不用等了,我说咋了?他说,我用ChatGPT写这个代码了。哈哈哈哈哈哈。

说明什么?未来,很多的代码工作可能真的会被取代了。但他这个岗位是取代不了的,基于业务逻辑、更会用ChatGPT作为工具去解决需求的人,是最稀缺的。

所以,工具类的岗位、不是那么复杂实现类的岗位,可能慢慢都会被ChatGPT 类似的技术取代,但是,基于对业务需求逻辑理解的这些人,我认为是比较稀缺的,我觉得未来社会还是需要这种人才。

王梦秋:其实这有点像以前咱们在百度的时候,产品经理永远需要等着工程师写代码,所以产品经理很弱势。未来是不是产品经理、就有想法的人、有设计理念的人就雄起了?

唐会军:是的是的,所以说,不是ChatGPT替代人,是会用ChatGPT 的工具的这些人,取代不会用它的人,或者做它类似工作的人。

王梦秋:往前推到咱们的大学教育,或者从小学教育开始,你会不会觉得咱们现在的教育其实并没有在鼓励创意这件事情?

唐会军:业务逻辑本质对需求创意的理解是关键。我们培养的很多人才是还是偏实现,技能型的一些人才偏多。

王梦秋:就是know how的人,但不一定知道该做什么。

唐会军:是的,这些人真的是被取代可能性越来越大了。所以我一直觉得懂业务、懂产品经理思维人是以后最稀缺。

王梦秋:那你从公司招聘的角度呢?比如说咱们公司招人的标准会不会发生改变?

唐会军:当然我们改变还不是很大,但是有两个地方发生改变的。第一个是说,我们特别重视产品经理的招聘,一定招非常好的产品经理,不受预算的限制。因为这种有创意有想法的人,我觉得一定是非常稀缺的人才,不是会被取代的,这是一个。

在研发岗位上,我们后来发现公司里面做得非常好的同事,不仅仅是他的代码写得好,而是业务逻辑梳理得很好的人。我们属于一个业务逻辑比较复杂的产品,如果业务逻辑不理顺,他做出来的产品体验和竞争力会很差的。

所以在工程师的招募上,我们也会突出对业务逻辑的理解的考核维度,而不只是只能看到代码写得好不好,会让HR 和 leader都去问他的业务逻辑。所以我觉得,未来可能很多场景下纯编码技能的重要性会下降,业务逻辑理解的重要性会大幅上升。

王梦秋:那其实除了刚才说的像打tag ,这是一种相当于给咱们自己用的工具,那相应的其他的办公自动化工具,包括你刚才说的,如果我有了足够多的懂业务逻辑的人,他们自己用any AI tool 写代码就完了。

唐会军:对,办公类的东西现在不是我重点关注的,我更关注我们自己的业务,所以我觉得这个还是非常好的一个事情。

王梦秋:我其实就觉得这个对于我们的教育体系真的是一个巨大的挑战。

唐会军:你觉得我们人才模型会朝哪些方面去偏?

王梦秋:我跟你看法一样,最后可能只需要现在的 10% 的人,就可以做到现在100%的事,剩下 90% 的人我不知道该干嘛。但是 10% 的人只要非常会善用这种(工具),因为工具本身也在迭代,所以我的观点真的是,这一代AI会 reshape 所有的工作流程。

唐会军:对。

数美的风控就是一种边界

王梦秋:你会觉得是接下来AI技术的迭代速度会是怎样?你会怎么判断这个技术本身?比如说现在大家觉得ChatGPT已经是一个 iPhone 时刻了,那你会觉得下一个milestone是一个什么样子?再更上一层楼的。

唐会军:我们一直从事AI产品研发,我们产品很多时候比较显著的改进,触发因素除了算法,就是高质量训练数据的大幅增加,而数据大幅增加的原因很多时候都是我们的产品或数据挖掘技术上了一个新台阶,这是促使我们的模型做进一步迭代的一个内在的一个因素。

这个数据包括用户对你的反馈,ChatGPT 现在迭代速度越来越快了,我觉得是跟用的人越来越点多有关系。它把这个正循环形成了——用的人越多,反馈数据就越多,把这些数据融入它的模型中去,会加速它的迭代。所以我一直很认可一个观点,你的模型,投入的语料和用户反馈越多,你的效果越好。

王梦秋:对,包括咱们调用他们的API,本质上也在给他们反馈数据,对吧?

唐会军:是的。

王梦秋:所以咱们要形成咱们自己的数据飞轮嘛,对吧?就是我们自己的这个垂直领域应用场景的数据门槛要构建起来。

唐会军:对,我们称之为效果飞轮,这个很重要。效果飞轮就是典型的,一定要有大量的人用,第二,一定要大量的反馈,反馈产品的决策对还是不对。所以为什么我们坚持我们的产品用SaaS模式去服务客户,就这个原因,大量数据、大量的反馈,你就能迭代速度越来越快。所以为什么数美每年花那么多钱做数据标注,因为大量的反馈我需要人去标注、去看,确认好这个语料。但是受限于人力的成本,我们觉得速度还不够快,用技术手段的话我们迭代速度会更快。

王梦秋:现在其实关于生成式 AI 本身也存在很多安全问题,或者是伦理问题。所以专门有一个环节叫Alignment,你觉得咱们会在这个方面有机会切入吗?

唐会军:最近我看了一个NVIDIA CEO和OpenAI联合创始人对话的视频,其中就专门提到了ChatGPT功能越来越强大后的边界问题,表达了和你类似的担忧问题。

王梦秋:老黄跟Ilya的那个视频?

唐会军:对,(老黄)他问了一个很好的问题,就是ChatGPT你的边界在哪里?你能力这么强,可以通过用户给你设定任务,完成任务,你的边界在快速拓展。所以最后老黄就问Ilya,那你的边界在哪里?我觉得这个是很重要的事情,它既然能力越强的话,如果越界了,在很多方面它会带来很大的危害。这个是大家恐慌的,估计也是 elonmask 他们比较担心的一个事情。

所以我觉得ChatGPT火了以后,一方面应用场景越来越广、能力越来越强,另外一方面就是它的边界问题,其实数美做的内容风控就是边界的一种形式、一个分类吧。所以ChatGPT起来以后,对我们的业务是一个很大的利好,我们也是在做一个边界的事情,边界有很多维度,我们是其中典型的维度。

王梦秋:如果Alignment这件事情它就是一种程度的风控,那我们的业务其实也可以朝这方面扩展,因为未来有越来越多的公司,无论是做大模型、或者做finetune ,又或者他们就是从底层来构建自己的垂直模型,都需要 Alignment 。

唐会军:是的,所以我们最近在做调研,(ChatGPT )它不是支持插件的吗?我们在想,是不是我们的这种边界的能力可以做一个插件,放到它的生态里面去服务,客户在用它的AI能力的时候,顺便把我们的插件的能力合在一起去用,然后做的内容更合规。

王梦秋:那是迟早的事,从第一天起就知道他们肯定要干这事,跟咱们当年阿拉丁一样,平台就应该干这事。

唐会军:是的。所以如果我们融入它的平台里面去,做生态的一部分,其实也是一个不错的方向。

王梦秋:而且Alignment这个插件本身也是用的人越多、效果会越好,它本身就是一个 AI 自训练的一个东西。

唐会军:对,是的。所以我觉得未来可能就跟操作系统一样,真正它把底层的核心能力构建好以后,更大的想象空间还是在生态。所以AI里面的操作系统的定位,我很认可这个说法。

王梦秋:好,差不多咱们关于AI就先聊这些。