编程语言应用

注册

 

发新话题 回复该主题

AI只会画画聊天这家公司可能要打破一切了 [复制链接]

1#

如果说这半年来,当红炸子鸡是哪一位。

那AI生成内容说第二,恐怕也没有人敢说一。

虽说热度一直没停过,但是这几天感觉,看AI们乱杀,完全不如看它翻车来得有意思。比如下面这种认人成狗的乌龙。

又或者是这种莫名其妙直接让人头脚倒置的。。。

甚至互联网上还出现了一大批带着AI生成的图,想替兄弟讨回公道的网友们。

连无穷小亮都中招了,在自己的微博声讨AI。

不过,AI犯傻也不是一天两天了,自从DALL·E带头的这批绘画模型出现后,各种段子就没停过。

比如因为喂的素材不够多,一旦涉及了知识盲区,AI就开始不懂装懂,原地乱画。画出来的筷子,世超怎么看都觉得手里那个,更像我奶奶的锅刷。。。

输入的描述词如果有点抽象的话,AI甚至会画出一些有点冒犯性的照片。

比如非常经典的“鲑鱼回流”图,是鲑鱼看了要喊律师的水平。

结果,这AI绘画的热度还没降下来,AI聊天就又来了。

世超左手边的同事在玩StableDiffusion,右手边的人就在和chatGPT聊天。这款AI聊天应用上线的时候,火到连马斯克都在调侃,人们陷入了一个GPT的循环里面。

世超自己还没体验上呢,各种网友调戏AI聊天的段子又横空出世了。

比如给AI出脑筋急转弯,结果当然是一头撞到了墙上。

又或者是用中国人的经典小学数学题,考验对方。虽然AI答题态度很好,试卷题目都写满了,但是没一个答案是对的。。。

不过啊,玩归玩,闹归闹,但AI要是认真起来,实力早已经相当可怕了。

虽然chatGPT做不来脑经急转弯,但是它可以快速找出一段代码中的bug,并且完成代码修复。

而偶尔犯傻的AI绘画,如果调试得好,它甚至能帮你做出一张足以拿奖的作品。

国外甚至已经有人用chatGPT和其他AI绘画软件,创作了一本儿童读物《AliceandSparkle》。目前,已经上架了亚马逊。。。

玩梗归玩梗,但AI的潜力网友们早就心知肚明。像老美做的chatGPT这类AI应用,国内其实也早就有企业悄咪咪在跟进做了,比如抖音、意间之类的。

而这条赛道上,甚至还有一个你完全想不到的参赛选手,就是靠游戏起家的互联网出海巨头——昆仑万维。

说实话,虽然它是以游戏起家的公司,但是世超第一时间想到的已经不是游戏业务,而是它在全球范围的各种业务和投资。

比如想要做浏览器,但是大部分浏览器市场都被谷歌牢牢地坐在屁股下面。

于是,昆仑想到了收购没落的Opera浏览器,带着它从非洲这个互联网增速最快的新市场入手,把这个没落的浏览器,扶上了非洲第二大浏览器的位置。

再比如虽然也搞社交聊天,但是却投资了同性交友软件Grindr。因为群体的高消费属性,直接给企业带来29.5亿的收益。。。

而这一次,昆仑万维早在年就瞄准了AI这个炙手可热的香饽饽。

虽然老本行靠游戏发家,但是昆仑做起AI项目来,也毫不马虎。前面咱们聊过的绘画和聊天模型,昆仑万维全都有布局。

废话不多说了,练家子还得拿出真本事来,咱们直接上手体验一下。

先是昆仑万维用现在最火的AI绘画模型StableDiffusion,做的一个支持中英文双语的AI绘画模型——天工巧绘SkyPaint。

天工巧绘这个模型目前可以在小程序上体验它的实力,小程序界面非常简单,输入描述词后,就可以一键生成画作。而输入之后,程序都会一次性生成四张图片。

世超体验了一下,基本上所有图片都能在10秒之内生成。

世超先用兄弟小黑胖试了一下,输入了:“一个丰富细节的小黑胖。”

结果,小黑胖这么挫的名字,居然获得了一张这么细致的生成图。。。甚至连裤子和手部的纹理细节,都渲染出来了。

说实话,才10秒不到就能做出这么细致的图片,确实是超乎了世超的预期。

但是,光用这些普通的描述词有啥意思,不如给AI搞点抽象的东西,考验一下。

于是,世超尝试了一句陆游《十一月四日风雨大作》里的名句——“铁马冰河入梦来”。

结果,天工巧绘真的画出了一只踏着云霞,毛发飘逸的铁青色马匹。

不服输的世超又用更抽象的“灯火阑珊处”试验了一下,结果也是非常惊喜。

甚至,世超从这一句中文古诗词的生成结果里,感觉到了一些赛博朋克的味道。

可能有小伙伴发现了,世超从头到尾用的都是中文。甚至,后来使用的古诗词,天工巧绘都能很精准地读懂我的意思。

其实说到AI绘画,世超想要说一个容易被人遗忘的关键词输入。

所有人都盯着最后生成的图片看,但是,却忘记了AI绘画的第一步其实是文本输入。

比如你想获得这样一张充满现代感,并且风格强烈的图片。

那你可能得输入长达七行的关键词,才能获得一张满意的作品。。

因此关键词还被做成了一门暴利的生意,一家叫PromptBase的公司,主就是专门售卖“关键词”。一个关键词,能卖到1.99美元的价格。。。

说实话,匮乏的英文储备,每次都限制了世超的发挥,用的时候,还得在旁边挂一个谷歌翻译。

这不,为了方便中文用户使用,昆仑万维直接做了一套中文文本模型。

虽然咱看着好像没啥难度,不就是英译中吗。但是,这项目一开启,就是一个止不住的投资无底洞了。

首先中文是一种信息密度更高的多维语言,简单来说,就是表达的意思会比英文更复杂。

这个前提下,要想做中文模型,就得花大量精力做语料清洗和中文语义的理解。为了提高AI的准确性,昆仑用了一种“回报机制”来训练这个模型,简单说就是给模型做的试卷打分。

给模型出一百道题,最后工程师们给AI提交的答案挨个评分。通过这种方式,给AI做一对一语文辅导,慢慢提成绩。

这看似容易的英译中服务,其实非常烧钱。

昆仑万维为了做这块,光是加速卡就有两百多张,仅仅是硬件支出就得近千万,而这还不算人力成本投入。模型每个月的训练成本,又固定是上百万。。。

烧了这么多钱后,他们才慢慢把这套大语言模型打磨出来,用最少的人力,获得了很好的效果。

也是依靠着它,天工巧绘才能够很好地理解世超输入的中文语义。

而依托这套中文模型,昆仑万维也用GPT3做了一套AI文本模型——瑶光。

除了基本的聊天回答、摘要、续写之类的功能,还有很多针对中国人的各种传统技能,比如对对联,古诗词之类的。

而chatGPT能够做到的代码修复,昆仑万维也没落下。他们直接做了一套AI编程助手SKYCODE,只要给它输入一段代码,它就能帮程序员们完成后面的续写。

当然这套AI代码模型,也是完全支持中文注释的。

而在AI编曲赛道上,昆仑也是赛道的头部,依托自己的音乐社区Starmaker,昆仑搞到了目前市面上最全的音乐数据集。

旗下的AI音乐工作室StarXMusicXLab制作的曲子现在已经是非常成熟,大家在Spotify、QQ音乐、网易云音乐上就能直接搜到。

看到这,可能很多人会觉得疑惑了,为啥昆仑万维作为一家互联网平台出海企业,却看似“不务正业”地花这么多力气,来搞这个全新的业务呢?

其实,上面咱们聊的那么多东西,有个总称,也就是AIGC。说白了,就是让AI来提供和创造内容。

所以AI的用途,可远不止开头那些玩梗这么简单的。

虽然一开始,大家对AI还都嗤之以鼻,早几年听过最多的词就是:人工智障。

包括年李开复在《人工智能》里说的,也只觉得AI最多,就只能够代替人们五秒钟的工作。比如人脸识别、淘宝客服回复的水平。

但是,慢慢地所有人都发现事情不简单了。

尤其是身处年年末的我们,被AI轰炸了一整年,眼看着AI绘画从DALLE到StableDiffusion,AI聊天从续写到及时应答。

当年的DALL·E▼

照这个势头下去,AI似乎真的要奔着超越人类去了?

虽然还不至于到取代人类的地步,但是AIGC对我们生活的改变,很有可能有18世纪时,人们跨入蒸汽时代那么大。

只不过,这一次负责驱动的,是一个看不见、摸不着的计算程序。

AI给人们带来的不是失业,而是人与机器共存、协作完成各类工作的全新时代。

而昆仑万维的所有布局,就是为了迎接这个时代。

就在昨天,昆仑万维召开了一场线上发布会,宣布把覆盖绘画、文本、编程三大块的AIGC模型,正式地开源发布。

这就意味着利用昆仑万维的算法与模型,作为应用开发的底层基石,所有人都可以自由地搭建自己需要的垂类应用。

昆仑万维会选择把耗费数千万的模型,对外开放的原因,一方面当然是希望通过更多人的参与,让昆仑天工有更多的应用可能性和创新性。

像完全开源的StableDiffusion,网上就有各种各样地围绕它的创意版本。

网友魔改的宝可梦版▼

而另一方面,一项技术进步,只有给普通人带来便携,才具有正面的社会意义。

尤其是当技术都掌握在头部手里,算法的成本只会水涨船高。技术壁垒的高墙,就这样慢慢地越砌越高。

最后,个人开发者或者是小企业,就被会高成本拦在门外。

但是,昆仑万维觉得技术不应该只属于头部。所以,他们打从一开始,就是冲着对外开源这个方向去的。

通过模型开源,降低行业门槛和开发成本。而且,开发中文大语言模型作为支撑,更好地配合中文使用者的习惯。让更多的个人开发者或者是中小厂,也可以搭上AIGC这辆高效的马车。

已经落地了的昆仑AI音乐就是很好的例子。

昆仑万维有一个叫starmaker的音乐K歌软件。可能你会有点陌生,因为它主要是面向的是海外用户,在南亚东南亚、中东南美洲地区的活跃用户已超过万。

昆仑根据starmaker开发了各种音乐类的游戏。对于音乐类游戏或者应用来说,歌曲库的丰富程度,肯定是执掌大局的关键。

但是,一首曲子的制作成本费用,最便宜也大概在三万多左右。。

有了自己的AI音乐实验室MusicXLab之后,他们利用AI就能快速玩出各种想要的音乐风格。最近,昆仑做了款音乐游戏,里面有接近两百多首的音乐,全都是来自这个工作室。

假设用AI制作只是省去一半成本,那也是减少了将近万的支出。。。

这还仅仅只是AI音乐的可能性,之后AIGC还会深入到各种创作者的工作之中去。例如AI绘画以可以后帮助原画师、3D美术师、艺术家等等进行内容创作,帮助画师们打开想象。

就算是普通的用户,也有使用它的可能。比如搭建一个专门做各种美甲图片的应用,美甲师们只需要动动手指,就能获得各种甲面风格。

甚至有一天,你可能会发现在文章的最后,署名不再是世超,而变成了chapingAI。

分享 转发
TOP
发新话题 回复该主题