Freepik 如何从库存图像平台转变为生成式 AI 强国
快速阅读: 据《解密》称,Freepik从提供库存图片起家,现已转型为每月吸引六千万访客的AI创意生态系统。CEO胡安金·库恩卡·阿贝拉强调,Freepik通过集成多种AI工具,提供全方位服务,旨在赋予创作者更多控制权。尽管AI版权争议不断,库恩卡认为AI促进了技术创新,同时强调AI是表达工具而非替代品。未来,Freepik将深化AI视频工具的应用,力求成为创意中心。
Decrypt的艺术、时尚和娱乐中心——发现场景。十五年前,Freepik只是一个提供库存图片的供应商,帮助设计师找到适合他们项目的正确视觉元素。如今,它已经完全变了样——成为一个每月吸引超过六千万访客的生成式人工智能中心。这种转变并非偶然。这是公司愿意重新思考其目标,超越静态图像,迈向更大规模的全人工智能创意生态系统的成果。
Freepik首席执行官胡安金·库恩卡·阿贝拉坐在他的客厅里,与Decrypt讨论了人工智能行业的现状,以及他的公司如何利用生成式人工智能为数字艺术家带来机会。“当生成式人工智能出现时,我们看到了扩展我们使命的机会,”他告诉Decrypt。“我们不再仅仅为设计师提供现成的内容。相反,我们可以根据他们的需求进行调整,为每个人创造独特的东西。”
这一举措取得了成效。Freepik现在是一个一站式AI驱动的图像和视频生成、放大、动画等服务提供商。库恩卡·阿贝拉简单地说:“我们只是想给创作者更多控制权。”
从空白页面到AI引擎
Freepik起步时有一个简单的前提:消除面对空白页面的挫败感。在人工智能之前,该平台提供了数百万张库存图片和模板,供创作者作为起点。“最具挑战性的部分是从零开始,”库恩卡·阿贝拉说。“我们通过向设计师提供数百万张可以开始创作的图片来消除这个障碍。”
如今,借助生成式人工智能,Freepik不仅提供内容库——该公司还按需创建内容。“摄影师并不是传统的Freepik用户,”库恩卡·阿贝拉说。“他们已经有了自己的图片。但现在,通过我们的放大器Magnific,他们可以以前所未有的方式增强这些图片。”
这一转变使它的受众超出了平面设计师的范围。摄影师用它来增强、调整和放大图片。电影制作人尝试使用AI生成的视觉效果,建筑师和室内设计师以过去耗时且昂贵的方式构建概念,而普通用户则用它来生成美丽的Waifus——因为,当然,我们说的是人工智能。
不仅仅是另一个图像生成器
在拥挤的人工智能领域,Freepik专注于工作流程集成。大多数人工智能工具专精于某一方面,无论是图像生成、视频创作还是放大。Freepik将它们全部连接起来,作为一个集成了不同开源和闭源生成式人工智能工具的枢纽。
除了其他服务外,公司的AI套件包括:
– 使用Mystic、Flux、Ideogram和Google Imagen等模型进行图像生成。
– 自定义LoRA训练以保持一致的角色和风格。
– 生成使用七种不同的模型进行视频生成,包括Google的Veo2、Hunyuan、Luma、Kling、Hailuo和Minimax。
– 用于修补、扩展、滤镜和无缝图像扩展的编辑工具。
– 音频生成,包括音乐、配音和音效。
– SVG格式矢量资产的转换功能。
最成功的故事之一是Freepik的AI驱动放大器Magnific。由于其能够增强图像细节而不失真,它变得非常受欢迎——即使是顶级的人工智能模型也难以做到这一点。然后,Mystic成为锦上添花之作,提供的结果能够与Ideogram或MidJourney等最先进的模型相媲美。Mystic实际上是一个工作流,以Flux为核心模型,并进行了许多微调。尽管如此,许多专家和爱好者尝试模仿Freepik的秘密配方——依赖于开源模型——但结果参差不齐。Freepik有一种方法,可以始终如一地提供高质量的结果,并拥有最佳的用户界面,这是客户所支付的价值所在。
“人们有时低估了优秀产品与卓越产品之间的区别,”库恩卡·阿贝拉说。“最后10%的努力需要90%的时间。这就是为什么许多人试图复制Magnific,但却未能完全做到。”
版权争议
随着AI生成内容的到来,出现了争议。许多艺术家认为,AI开发者未经许可不公平地使用受版权保护的作品来训练他们的模型。库恩卡·阿贝拉并不否认他们的担忧,但他对这个问题有不同的看法。“如果你要求每位创作者的许可才能训练AI模型,那么这些模型根本无法存在,”他说。“这就像在推出谷歌之前要求许可索引每个网页一样。”
他承认存在紧张关系。“短期内,这损害了艺术家的利益——使用由艺术家创作的东西。对于受影响的艺术家来说,这是一个深刻的不公正情况,”他告诉Decrypt,认识到这样的进步迫使他们作为企业进行演变。“类似的事情也发生在我们身上。当(AI)出现时,我们的业务突然失去了价值。我们必须适应。”
不过,他认为AI生成的图像不是直接的副本。“传统艺术家通常的抱怨是他们的图像被使用时没有得到许可,这是完全正确的,”他承认。“但反驳是,这些模型产生的图像是非副本。如果是由人制作的,就不会有版权侵权的主张。”
这场辩论的核心基本上是创意控制和技术进步之间的权衡。库恩卡·阿贝拉相信社会最终会偏向AI的好处——正如它在类似辩论围绕摄影杀死绘画、数字艺术杀死传统艺术或互联网搜索引擎杀死百科全书时所做的那样。“作为社会,我们需要平衡一切并做出决定。如果需要创作者的许可才能训练模型,那么文本和图像的生成模型将不会存在。”他说。“那样的话,社会就会失去所有文本模型所提供的进步。它们可以帮助我们找到疫苗、药物;它们能带来的科学进步是巨大的。所有的进步都会丧失。”
库恩卡还认为AI是一种自我表达的工具。他不区分AI艺术家和艺术家。“没有区别。它只是一种工具。AI是用来表达你想要的东西,艺术是你内心的感受、你的经历——好吧,你可以用AI、油画、照片来做这些。这取决于艺术家。”他告诉Decrypt。
多样性与灵活性
过去,闭源软件是终端用户的首选,因为它们通常更加用户友好,并提供了比开源选项更好的体验。然而,多年来情况发生了巨大变化。Stable Diffusion彻底革新了AI艺术领域,Llama将本地文本生成技术普及给大众,而最近,DeepSeek R1重新引发了关于闭源AI公司对其模型过度收费的争议。然而,一些用户仍然偏好闭源选项。库恩卡·阿贝拉对AI行业未来发展有着强烈的观点,尤其是在开源与专有模型之间的较量中。“就代码而言,最先进的开源模型与专有模型处于同一水平。”他说。“主要区别在于训练时间和数据集整理,以及更长的后期训练阶段和稍好的标签等。但在技术水平方面,我没有看到显著差距。”
尽管像MidJourney和Ideogram这样的专有模型得到了更多改进,但库恩卡认为开源替代品正在快速缩小差距。他以Flux为例:“它可能略逊于最佳的闭源模型,但差距不大。由于它是开源的,社区可以对其进行微调和扩展,有时甚至超越了闭源版本。”
这是许多Flux微调中的一个示例。图片:Civitai
对Freepik而言,多样性和灵活性是优先考虑的因素。“熟悉Freepik使用方法的人能得到比MidJourney更好的质量。”库恩卡·阿贝拉说。“如果你需要逼真的图像,我们可以使用Google Imagen。如果你需要艺术性的文本生成,使用Ideogram。如果你需要角色一致性,训练一个LoRA。没有单一模型可以解决所有问题。”
换句话说,在AI领域没有全能的工具。能够根据需求选择开源和闭源模型的灵活性对于获得完美的艺术品所需的精细度至关重要——这正是用户心中所想的样子。
AI视频赌注
最近,Freepik加倍投入于AI驱动的视频工具。该公司集成了Google的Veo 2,这大大提高了视频生成的质量。“在Veo 2之前,你必须生成10到20个视频才能得到一个可用的。”库恩卡·阿贝拉指出。“现在,有了Veo 2,每两次尝试就能得到一个好的结果。”
但他表示,对视频艺术家来说真正的改变者将是即将推出的AI视频编辑器。用户很快将能够在Freepik内完全组装完整的视频,而不仅仅是生成短片段。“今天你只能制作视频片段——只能生成2秒、3秒或8秒的小片段。我们正在开发一种功能,让用户可以直接在页面上编辑它们、添加音频并完成整个合成。”库恩卡·阿贝拉告诉Decrypt。“我们的目标是让Freepik成为创意中心,用户无需离开平台即可完成项目。”他说。
AI的未来:机遇还是挑战?
我们是否接近人工通用智能(AGI)?机器是否会取代人类?库恩卡·阿贝拉认为AI的快速发展既令人兴奋又令人不安。AI的未来:机遇还是挑战?
“[AGI]感觉非常接近——比几年前任何人预想的都要近得多。”他承认。“我们从人们认为AI只是玩具,到机器能够思考的时代已经过去了。”
关于AGI的确切定义并没有真正共识,但它可以大致视为一种能在人类水平或更高水平上理解、学习和应用知识于几乎所有领域的AI。我们现在处于“狭义AI”的状态,模型在某些方面表现出色,但在其他方面表现不佳。他认为这种转变引发了重大存在的问题。“机器可以暂停、重启或复制。人类不能。这些差异很重要。”他说。“这意味着人类将始终与技术保持独特的地位。”
尽管有些人担心AI会取代人类创造力,但库恩卡·阿贝拉对AI的潜力持乐观看法。“我认为这将导致非常深刻和强大的加速,让人感到有点不知所措。我们无法预测未来能实现什么。”
更实际地说,他认为近期可能会提供更多工具,帮助机器更准确地理解用户的需求,提供更高品质的结果。而Freepik的新理念似乎正朝着这个方向发展,成为一个艺术家可以找到一切所需,将AI生成转化为个人想象的艺术作品的中心。
“我们的使命是帮助人们制作出色的设计来表达他们的想法的力量。”库恩卡·阿贝拉说。“对我们来说,AI只是一个工具——但人们如何与AI互动才是关键所在。”
(以上内容均由Ai生成)