AIGC真实用户体验:来自最懂科技的时尚品牌创始人徐易容
清流资本 2023.9.18
编者按
2023年,AIGC经历了爆火出圈到逐渐冷静。关于新一轮AI技术的讨论也从盲目推崇到开始客观审视其落地节奏。清流资本始终认为,新AI技术的出现是令人兴奋的,而技术真正落地到实际场景也需要时间,相信技术但不迷信技术。
过去半年我们在【新一轮AI来了】对谈栏目中,和清流Family的AI企业CEO们,就AI实际在企业业务中的应用情况,探讨新一轮A技术的进展、时间节奏、应用场景。以及,随着我们进入新AI时代,与AI共存的人类会是什么样的。
现在让我们把目光转向AIGC工具的真正使用者们。我们访谈了不同领域的AIGC产品使用者,聊了聊他们在实际工作流程中使用AIGC的一手体验。我们想知道,目前层出不穷五花八门的AI工具们,在用户角度,到底好用不好用?是否真正“智能”?对于“AI会否完全替代人类”这一见仁见智的惊悚命题,他们的真实体感如何?我们陆续访谈了音乐人、文字创作者、资深创业者,等等。
/// 本期访谈嘉宾:
徐易容,小着创始人。
本科毕业于北京大学,硕士毕业于斯坦福大学,曾受聘于硅谷著名的IBM阿莫顿研究中心,在互联网、数据挖掘、数据管理领域创造多项新技术,共拥有5项专利。
作为Web2.0时期就投身创业大潮的中国互联网先行者,徐易容2009年创立美丽说,是中国著名的快时尚社交及电商平台。2014年创立HIGO,是中国有名的时尚买手店。2018年创立小着,是来自伦敦和上海的新时装品牌。理所当然地,他是这一次AI新技术的early adopter。
坐而论道,不如dirty hands。徐易容已经用AIGC实现了工作效率5倍提升、生产成本5倍降低,这无疑是AIGC工具应用的成功案例。不过,当我们了解到他使用AIGC的全过程以后,我们发现,当前的AIGC产品使用门槛仍然非常之高,距离普及给多数人使用仍然还有一段路要走。
时装品牌的痛点——拍LOOK图
小着XiaoZhuo公众号在3月26日发布了一篇文章《你好,提示词设计师。》,正文由ChatGPT生成、全部图片由Midjourney生成。文章中提到:“我们输入小着之前的文字,仅用6分钟,简单训练,ChatGPT就完稿了。千倍效率,AI已来。”从这段文字不难看出小着对于AIGC的兴奋狂喜。我们在访谈小着的创始人徐易容时,他也和我们提及,最早使用AIGC产品,就是用ChatGPT写公众号。
当时的ChatGPT生成的内容是让他惊喜的,输入三篇小着过去的文章,它就能自动学习小着的文字风格生成新的文字,“ChatGPT写90%,我再润色一点,就可以排版发布了。”而且,ChatGPT还能准确地描述出小着想要的文字风格是什么。“我会问ChatGPT:小着的风格跟山本耀司的风格有什么区别吗?ChatGPT告诉我,山本耀司的语言风格更有意境、更抽象,而我们的文字更具体一点。我说那你看一下我们的文字风格跟苹果的文字风格有什么区别?它说苹果的介绍更具有功能性、更实用,我们的更灵动一些。如果把三个一起比较的话,一边是山本耀司,另一边是苹果,小着在中间。这个判断是准的。”
但是,这个兴奋的过程是短暂的。5月份,小着的公众号文章就成了“ChatGPT出创意的”。徐易容认为这个变化的核心原因,是写公众号的痛点还不够痛。“我们自己写的文字也蛮准确的,而且更快,还省得给ChatGPT改作业。”于是,他后来就决定还是亲自撰文,AI只用来提供灵感。
谈及什么才是他真正的痛点,徐易容毫不犹豫地说是拍照。他这里指的是时装行业的LOOK图,向人们展示每一款衣服的穿着和搭配。他向我们介绍了传统服装LOOK图的创作过程,大致就是请一个专业模特和一个专业的摄影团队到公司租赁的专业摄影棚,让模特穿上小着的衣服进行拍照。但是,这个过程中有很多的痛点:首先,模特是不是符合品牌调性、档期和价格是否合适,好的模特档期少、费用高,很难得才能请来拍一次;其次,摄影棚的租赁是按天计费,价格也不便宜;而想要拍出优秀的摄影作品,还需要10—20人的专业摄影团队。所以,一次LOOK图的拍摄公司至少就要花费几十万元。为了分摊成本,大多数时候需要在一天内拍摄五六十款衣服,但即使这样,每套衣服的LOOK图拍摄成本也至少要10000元。所以,一年只能在春夏、秋冬拍摄两次,今年12月份穿的羽绒服需要在前一年的冬天开始研发,在今年的夏天拍摄。“(拍照)这个效率太低了!”
于是,今年3月份开始,徐易容就开始研究如何用AIGC工具生成满足小着需求的时装LOOK图。经过几个月的探索和亲身实践,6月1日,小着在公众号上正式介绍了他们用Stable Diffusion生成的AI模特“小周”制作的新款时装LOOK图:
“小周是一个非常有美感的模特。她像一个邻家女孩儿、有亲和力,但是又很高级、很大方,她没有侵略性,从眼睛、眉毛、鼻子、嘴巴、发型都能透露出来。”看得出来,徐易容对这个自己亲手finetune出来的AI模特非常满意。
更让他兴奋的是,他不再受限于传统的时装设计和拍摄流程,提前一年就要设计明年的衣服,承担极大的fashion risk。有了AI模特后,小着现在已经可以实现随时设计、开发新款,随时拍摄,再用AI生成非常漂亮的LOOK图,甚至视频,然后上线发布。一套衣服的LOOK图1~2天就可以创作完成,在同样的质量下,创作效率提高了5倍。而且,每款时装的拍摄成本也从10000元降到1000-2000元。“我们现在非常依赖使用Stable Diffusion创作照片。这个需求是很痛的,不可或缺。”
finetune一个自己的AI模特
徐易容把AI生成图片的微调过程称为“工艺”,而要实现上图中的效果至少需要几十道工艺。“今天的 AI一方面卡在算力上,另一方面,AI还需要有大量的工艺的琢磨,让它能够变成人们可以接受的产品。”他认为工艺是AI从科学走向技术、产品必经的过程。如果想创造出来用户首选的产品,需要不停地发展技术、完善技术、迭代工艺。他认为大部分创业公司都不是去研究大模型本身的,而是想办法把研究出来的大模型,通过不停的技术和工艺优化,以产品的形式呈现在用户面前。“科学家和工程师的区别就在这里,爱因斯坦是不会研究超高压输电线的。”
为了训练自己的模型,他专门租了GPU,自己配置了一套Stable Diffusion的开源软件(这个门槛已经拦截了大部分不懂技术的人)。然后,再通过Google Dream Booth在Stable Diffusion模型的基础上做finetuning,让它生成想要的固定形象。他从网上找了十张想要的脸庞的照片,作为训练数据,大约15—45分钟可以训练出一个微调模型,训练速度受GPU算力影响,如果是H100会更快。刚开始,训练的模型经常会生成一些扭曲的、不精致的脸庞。徐易容分析原因,发现是因为图片中的视觉信息量巨大,而由于算力的限制,AI只能对图片进行压缩处理。“随便一张照片的像素都是1024×768,Stable Diffusion会把输入的图片压缩到64×64像素的一个很小空间里,所以很多信息都丢掉了”。于是,他又把图片拆解成很多局部,一块一块地用AI绘制,最后再把它们拼起来。训练模型的过程,他就是这样发现一个个的细节问题,然后想各种方案去解决它。
所幸,结果是令他满意的。用Dream Booth训练好的Stable Diffusion模型,输入文字prompt “xiaozhou” ,再结合ControlNet,已经可以实现10分钟生成200张接近小周的脸庞。不过,他仍需要人工从中挑出最接近他心里的小周,因为AI仍然会不时发生偏移, “有时候改一点权重,生成的图片波动就很大。如果权重是默认的1,可能没有任何反应;把权重调到1.2,它开始会有反应,但好像还不够;如果加大到1.5,发现又过曝了,生成的脸庞完全变形了。”运气好的时候,第一批生成的16张图片中就有一张非常满意的,但有时候可能生成了几百张,也只能从中选择一张还凑合的。“这个过程有点像‘炼丹’,但在多半时候你还是能够找到一枚可接受的丹药,而不是出来的每一个都是毒药。”
到今天为止,LOOK图上的模特身体和衣服都是没法靠AI生成的,只能通过拍照合成。一方面是受限于算力,AI承载的信息量不足;另一方面则是训练模型的身体和面料数据不足,徐易容希望展示的有空气流动感的衣服图片始终无法实现。“提示AI生成一条白裤子的时候,它给出来的是一条僵硬的白裤子,哈哈哈,跟铁片一样。根本无法还原衣服的面料和质感。”
于是,为了匹配AI模特的脸庞,徐易容专门搭建了一个适配AI的摄影棚,用于LOOK图中模特的身体和衣服部分的拍摄。AI降低了对专业模特的要求,现在只需要找普通模特,拍摄几十张不同肢体动作的服装上身图即可。拍摄的角度、布光、色温、遮罩等几十个细节,也需要人工去进行调整和拍摄。但在徐易容看来,AI在一两年内就会取代摄影师,自己完成拍摄。“未来影棚所有的光线、摄影设备的调参,应该由AI自己搞定。”
此外,徐易容也尝试过Midjourney,但是,“因为我们对于想要的东西有非常既定的需求,而Midjourney不能训练、不能微调,不太准确,只能泛泛地画点东西。专业领域,大家还是用Stable Diffusion去精调自己的模型用于创作。”
AI会重塑时装行业,加强品牌表达
服装乃至整个时尚行业,无疑会随着AI技术的应用发生一场效率革命,在时尚行业十数年的AI信仰者徐易容看来,更是如此。他把AIGC时代的服装设计、生产、销售三个环节,称之为“超级创作”“超级生产”和“超级体验”。AI可以在各个环节实现巨大提效,他认为目前可见的至少已经有了5—10倍效率提升。
在使用了AI模特以后,小着的服装开发周期现在已经缩短到2—3个月,而且不用一次次打样出来再去给设计师看拍摄图、修改设计,成本也减少很多(每次打样需要1000-2000元/件)。虽然,现状距离徐易容所设想的直接从设计创意,生成拍摄图还有一定距离,但对行业已然是一个巨大的效率提升,至少目前,小着上新的时装不再需要提前一年去设计了。
徐易容坚信,经过类似摩尔定律的迭代,AI未来会将时装开发从传统模式,推向超级创作的时代。传统的时装开发,从提出创意、勾勒出技术稿,再去打样衣,返回调整设计,再打样,再拍摄,到最终投入大货生产,前前后后要耗费至少9个月的开发周期。效率低、成本高,一年只能做两季衣服,限制了服装创作的活力。他认为,未来AI能够直接生成服装面料的纹理材质,把创意稿直接翻译成 LOOK图,绕开打样的环节,有望使服装开发周期缩短至2周。
当前,服装生产流程中仍然有很多无法标准化的低效环节,例如套口、裁剪,受限于面料的柔软性和线孔的大小形态不一,无法直接用机器生产,需要人工在流水线上操作。徐易容毫不掩饰对特斯拉超级工厂理念的推崇:“未来所有的时装工厂,都应该是特斯拉那样的超级工厂,每个环节标准化,全自动化生产。”未来,服装生产流程中的各个环节都会被AI学习,最后省去人工在流水线上的辛劳。
而服装销售端也会因为AI而实现巨大变革。“当非常了解用户身形数据、精神味道和衣服需求的AI助理能够彼此直接对话,交易瞬间就完成了,那么今天的交易平台可能就不再有必要了。”在他更进一步的设想中,未来服装都是个人定制的,不再有尺码的限制,生产也可以实现柔性化。用户看到照片就能下单了,服装可以真正实现预售,从而解决困扰行业已久的库存问题。
“超级创作”“超级生产”和“超级体验”的理念,带来的是一个区别于传统公司形态的“超级组织”。虽然经营着两家线下店和多个线上电商平台(小程序、天猫、抖音),小着公司目前却只有20+人,而参与AI生图全套工艺的仅3-5个人。他说,“我们今天的努力目标是用耐克和优衣库1%的团队规模,创造百倍的效率。”他判断未来的工厂、公司都会变得更小型化,因为小型化意味着比大型化效率更高,可以更好地满足人类在各个方面的细分需求。
虽然大多数工作流程,在徐易容看来都会被AI替代,但他对于AIGC时代品牌的存在价值仍然给予了高度肯定。“品牌的本质是帮助人们表达精神味道,AI会让这个本质更加容易。”十年前智能手机的爆发并未使一些东西消亡,比如人类永远需要又好又便宜又高级的东西,智能手机让这件事情变得更容易了,而不是颠覆了。效率低的、不那么好、不那么便宜、不那么高级的东西会被替代掉,但是对于又好又便宜又高级的东西的追求是亘古不变的。
所以,AI不仅不会让品牌消亡,反而会使得人类更好、更容易地通过品牌去表达自己。
碳基生命不认真就会被硅基生命替代
“如果你认为今天是AI的iPhone时刻,其实今天是AI的iPhone2时刻。”毫无疑问,徐易容是一个不折不扣的AI推崇者,他非常认可Marc Andreessen的一句名言:“Software is eating the world.(软件在吞噬世界)”他提醒我们,不能高估今天的AI,也不能低估未来的AI。“2013年,张小龙在微信内部讲话,说未来没有电脑、都是手机。我听到这句话的时候非常震惊,不敢相信。可是这就是今天的现实——有很多人是没有电脑只有手机的。”如同今天人不会用手机就很难生存一样,这在十年前是难以想象的事情。
基于他对AI技术发展的极度乐观判断,他断言未来十年有望实现人形AI助理的普及。“现在的AI可以做很多不确定的、需要学习的事情。这是本质的变化,而在十年之内它就会迅速变得便宜。因为痛点足够强烈,会反过来促进研究上的突破,促进AI技术以指数级发展。AI的前进不是单点的,而是一个生态,成千上万的创业创新者在往前推进。”
即使AI已经可见能完成很多人类工作和生活中的事项,徐易容仍然不认为AI一定会替代人类,他把AI叫作“执行力工具”。AI这种强大的执行力工具,可以更好地发挥人类的想象力和创造力,且会进一步赋能人类的想象力和创造力。
同时,他也表达了自己的担忧:“如果碳基生命不认真的话,可能会被硅基生命替代掉。”人类有一个特点,是喜欢让自己更容易。这是好事情,会推动人类发展。但也因此,大部分人们都是以消费者而不是以创造者的形态出现。就像看电影的观众多,而优秀的导演少。创造比较难。如果未来认真创造的人越来越少,物种就没有了活力,就有逐渐走向消亡的危险。“我觉得AI能不能替代人类,取决于还有多少人类在积极地创造。只要不停有人们在发挥自己的想象力和创造力往前走,那AI不会替代人类。否则就危险。”
在徐易容看来,未来的人才模型也发生了变化,既要有深度,还要有宽阔视野,能跨界。“未来需要的是复合型的人才,因为创造力来自你想不到的几个领域的交叉和边缘地带。”他用小着来举例,“Stable Diffusion的架设,今天仍然是很困难的,需要工程师的能力,但在绝大部分技术男的电脑里面,AI生成的又都是卡哇伊的日本动画女孩,而那并不是很多女生真正需要的。所以AIGC时代会是‘跨界+创新’的时代,需要有美感的工程师和AI一起去创造。”
他认为,要让更多的人发挥创造力,需要调整教育体系。现有的教育,大部分是教孩子“复制”,这会导致人们不能发现问题,不知道自己想要什么,也无法充分发挥AI的力量。未来的教育,应该鼓励年轻人学会发现问题,这是培养创造力的第一步。
“我希望整个教育体系、社会的文化,多去鼓励和眷顾这些创造一点新东西的人们。只要有足量的人在创造,在想象,在致力于让这个世界变得更好,人类就不大可能灭亡。”
清流deal team说:
纺织服装是一个古老而传统的万亿市场,受困于固有的惯性,一直处于低效、反应迟缓的状态。外来者徐易容回归第一性原理,尝试打破惯性并提出质疑——为什么时装品牌必须提前一年开发产品?为什么一年只能有两季上新?为什么一定要有高倍率?如何解决时装生意的库存难题?生成式AI给这一切带来了转机。
在AI的加持下,今天小着的时装LOOK图里全部的模特脸庞都由AI生成,并显著实现了降本增效。但前期Stable Diffusion的架设和后期几十步的操作“工艺”仍然代表着极高的使用门槛,同时,现阶段AI仍然无法生成面料最真实的质感,也就因此无法绕开“打样”这一费时费资金的环节直接从技术稿生成LOOK图。但这些痛点都为新工具提供了切入机会,清流持续关注多模态生成领域的创新技术与使用门槛更低的新工具,期待更多的创业者推动AI从今天的“iPhone 2”时刻向“iPhone 4”时刻迈进。