重庆三峡中心医院、三峡中心医院、中心医院重庆三峡中心医院、三峡中心医院、中心医院

10克是几两

10克是几两 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天(tiān)机器人ChatGPT火(huǒ)爆(bào)以(yǐ)来,微软公司创始人比尔·盖茨已多次公开谈(tán)论人工(gōng)智能话题。在最近的一次采访中,他再次表示:“AI可能会(huì)让科技行业(yè)迎来(lái)一次剧烈(liè)的洗牌(pái)”。

这个结论(lùn)是(shì)他在当地时间2月20日接受《In Good Company》节目专访时提出的。

他预期,AI的发展可能会威胁到(dào)谷(gǔ)歌的市占率,因为微软在AI方面的行动相(xiāng)当迅(xùn)速。而(ér)最(zuì)终科技(jì)巨(jù)头将把AI整合成用户的“全能助手”,包(bāo)揽一切(qiè)应用,与人们进(jìn)行沟通(tōng)并(bìng)提(tí)供建议(yì),可以取代亚马逊、Siri或Outlook等应用。

大佬口(kǒu)中全(quán)能助手的到来可能(néng)尚需时日,但由ControlNet引发的又一次(cì)AI绘画浪潮,让AIGC在ChatGPT的(de)话题热点包围中杀出(chū)重围。

ChatGPT之后又(yòu)一(yī)应用杀(shā)疯了(le),AIGC或进入(rù)可控期,将(jiāng)洗牌(pái)科技(jì)行(xíng)业?_黑料(liào)正能量(liàng)

01

ControlNet颠覆AI绘画新玩法

AIGC向可控靠(kào)近

以AI绘画为代表(biǎo)的AIGC上一次爆火的时候,还是2022年(nián)8月,在美国(guó)科罗拉多(duō)州举办的(de)新兴数字艺术家竞赛中,一(yī)幅名为(wèi)《太空歌剧院》的作(zuò)品获奖(jiǎng)。

随后各大厂商(shāng)的(de)AI绘画(huà)软件(jiàn)被广大网友熟知并(bìng)体(tǐ)验,Stable Diffusion便是其中代(dài)表。

ChatGPT之后又一(yī)应用(yòng)杀疯了,AIGC或进入可控(kòng)期,将洗牌科技行业?_黑料正(zhèng)能量

用户们(men)可以在(zài)应用中输入一组关(guān)键词或者一张照片,就能获(huò)得一幅AI创作的画作。

作画(huà)的关键就(jiù)是所输入的文(wén)本。同一组关(guān)键词(cí)也可以创作(zuò)出(chū)很(hěn)多张(zhāng)风格不(bù)一样的画作,这让创作的过程就像开盲盒。

很多用(yòng)户很喜欢这种不确定的惊喜,他们会(huì)将生成(chéng)的美图(tú)当做头(tóu)像(xiàng)。而(ér)另一部(bù)分喜欢翻看(kàn)AI绘画的“翻(fān)车”作品。在(zài)社交媒体上,许(xǔ)多用户分享AI“翻车现(xiàn)场”,例(lì)如(rú),一位网友的(de)小狗照片被AI画成了(le)“肌肉男”,还有网友的(de)个(gè)人照(zhào)片被(bèi)AI识别(bié)成(chéng)了建筑。

而如(rú)今随着ControlNet的出(chū)现与(yǔ)加持,以往(wǎng)AI绘(huì)画的填(tián)写关键词游戏可能要被颠覆了。

ChatGPT之后又一应用杀疯(fēng)了,AIGC或进入可控期,将(jiāng)洗牌科技(jì)行业?_黑(hēi)料正(zhèng)能量

ControlNet是一位(wèi)正(zhèng)在斯坦福(fú)读博的中国人张吕敏创(chuàng)作的一(yī)种(zhǒng)基(jī)于控制点的(de)图像变形算法(fǎ),主(zhǔ)要用于数字图(tú)像(xiàng)处理、计算机视(shì)觉和计算机图形学等领域。

其SD插件一经发布(bù),在短(duǎn)短的两天内便(biàn)成为(wèi)了AI绘画领(lǐng)域最(zuì)新的热点。

在此之前,大(dà)家用(yòng)了很(hěn)多方(fāng)法想让(ràng)AI生成(chéng)的(de)结(jié)果尽可能的符合要求(qiú),但是都不尽如人意,它的(de)出现代表着AI生成开始进入真正的可控时期(qī)。

因(yīn)为ControlNet可以直接提取画面的构图,人物(wù)的姿(zī)势和画面的深度信息(xī)等(děng)。有了它(tā)的帮助,就不用频繁的用提示词来碰运气,抽盲盒式的创作(zuò)了。

通俗的说ControlNet相当于给AI绘画加了(le)“魔(mó)法”,不(bù)少博(bó)主的作品已(yǐ)经获(huò)得了大量的(de)浏览量,“viggo”就是其中之一,他用朋友的照片直(zhí)接带她们走进动漫(màn)世(shì)界。

ChatGPT之后(hòu)又一(yī)应用杀疯了,AIGC或进入可控期,将(jiāng)洗牌科技行业?_黑料正(zhèng)能(néng)量(liàng)

viggo先用StableDiffusion图片转文字。

再用(yòng)Text2Prompt插件拓展找(zhǎo)到(dào)对应的关(guān)键词;最后用(yòng)ControlNet插件绑定(dìng)骨骼开始(shǐ)换关键(jiàn)词试效果。

ChatGPT之后又一应用(yòng)杀疯(fēng)了(le),AIGC或进(jìn)入可(kě)控期,将洗牌科技行业(yè)?_黑料(liào)正能量

通过图片就可以看出来,效果十(shí)分惊艳(yàn)。

ChatGPT之后又(yòu)一应用杀(shā)疯了(le),AIGC或进(jìn)入(rù)可控期(qī),将洗牌科技行(xíng)业?_黑(hēi)料(liào)正能量

ChatGPT之后又一(yī)应用杀疯了,AIGC或进入可控(kòng)期,将洗(xǐ)牌科技行业(yè)?_黑料正(zhèng)能量(liàng)

更厉害的是,除了真实的照片(piàn),草图也可以加(jiā)上(shàng)“魔法(fǎ)”,知(zhī)乎大牛“DevPoint”和“逗砂”介绍(shào)到ControlNet还能(néng)实现线稿转全彩图(tú)。大(dà)神张吕敏(mǐn)其本(běn)尊也亲自回应。

ChatGPT之后又一应(yīng)用杀疯了,AIGC或进入(rù)可控期,将(jiāng)洗牌科技行业(yè)?_黑料正(zhèng)能(néng)量

不得不(bù)说当下AIGC已经变得越(yuè)来越强大,甚至输出的作(zuò)品都已经(jīng)能以(yǐ)假乱真了(le)。

02

难辨虚实,AIGC技术(shù)力爆(bào)发

警惕安(ān)全问题

近日,“苏州金鸡湖有游艇party”的(de)消息火遍网络,而(ér)经过警方辟谣这(zhè)所谓的“party”可能是(shì)全国第一起(qǐ)AI绘图诈骗。

由于(yú)这个(gè)活动里面给出的美(měi)女照片都是AI制作的真(zhēn)人照片绘图,因为太逼真,被大家当(dāng)成真(zhēn)事传播了(le)

ChatGPT之(zhī)后又一应用杀疯了,AIGC或(huò)进入可控期,将(jiāng)洗牌科(kē)技行业?_黑料正能量

不过仔(zǎi)细(xì)观察可(kě)以发(fā)现,活动发起(qǐ)者提供(gōng)的(de)照片中(zhōng)有(yǒu)个很大的漏洞(dòng)可(kě)以发现并非真人,而是(shì)AI绘图,那便(biàn)是图片中(zhōng)女性的手指部(bù)分有的存在异常。

ChatGPT之后又一(yī)应用杀疯了,AIGC或进入可控期(qī),将(jiāng)洗牌科(kē)技行业?_黑料正能量

有行(xíng)业人事表示:“现(xiàn)在因为(wèi)手指部(bù)分的绘(huì)画算(suàn)法比较复杂(zá),AI还不太会(huì)画(huà)人的手,但最(10克是几两zuì)新(xīn)看到的(de)图片已(yǐ)经有越来越完美的AI模型出现,以(yǐ)后可(kě)能(néng)就完全没有漏洞了。

类(lèi)似的AI作图诈骗在国外也已有发生。据英国广播公司报道,土耳其(qí)地(dì)震期间,有(yǒu)Tiktok用(yòng)户使(shǐ)用AI合成了儿童受灾(zāi)的假(jiǎ)照片发(fā)布到(dào)网络(luò),以此诱骗善良(liáng)的人打赏“捐助”从(cóng)而(ér)实施诈骗。

目前(qián)随着(zhe)技术发展,AIGC已经(jīng)能(néng)做出(chū)真人(rén)照片(piàn)般的绘图效果,如果这样(yàng)的(de)图片被用来诈骗(piàn),将非(fēi)常可怕。

此(cǐ)外(wài)AIGC还引发了(le)很多担忧,一方面,批判者(zhě)认为(wèi)AI在“学习”了大量前人的作(zuò)品之后,其创(chuàng)作(zuò)没有任何情绪和灵(líng)魂(hún),难(nán)以和人类的艺术创作相提并论(lùn)。

另一方面,AIGC背后的版权、目(mù)前都并(bìng)没有得到有效的解决,还有AIGC会不会代(dài)替(tì)人类“至高(gāo)无上”的创意。

马斯(sī)克也强(qiáng)调(diào),人工(gōng)智(zhì)能的安(ān)全(quán)问题需要得到重视(shì),太晚就来不及了。

03

AIGC下一(yī)站除了(le)视频(pín),还有远方

技术都是有两面(miàn)性(xìng)的,潜(qián)在的危害并不能掩盖其光辉的贡献。现在看来,人工智能(néng)技术将是第四次工(gōng)业(yè)革命的核心驱(qū)动力量,将(jiāng)创造新(xīn)的增长奇迹。

过(guò)去一(yī)年,人(rén)工智能在技术和商业层面都有(yǒu)了巨大(dà)进展,AI绘画就是人工智能技术发(fā)生方向(xiàng)性改变的一个代(dài)表(biǎo)。其下(xià)一站或许就(jiù)是视频。

此前,Meta和谷歌先(xiān)后发(fā)布了几条引爆科技圈的短视频(pín)。这些视(shì)频(pín)引(yǐn)发关注并非内(nèi)容做得(dé)多优秀,反而都非常简单,比如一匹(pǐ)正在(zài)喝水(shuǐ)的马,一只画画(huà)的玩具熊,或者一段骑(qí)摩托车的第一视角录像,随便一(yī)个有(yǒu)手机的人(rén)都(dōu)可以随手录下(xià)一段(duàn)。

ChatGPT之后又一应用(yòng)杀疯了,AIGC或进入可(kě)控期,将洗牌科技行业?_黑料正能量

但这些短(duǎn)视频的创作方(fāng)式非常(cháng)简单,创作者(zhě)仅仅需要向AI输入(rù)一段话,甚至只是(shì)说一下要求,AI就可以根据需要生成一(yī)段视(shì)频(pín)。

谷歌发布的两个(gè)AI生成视(shì)频分别(bié)来自于Imagen Video和Phenaki,前者(zhě)主要突出(chū)的是高清,与(yǔ)Meta的Make-A-Video没(méi)有太多的差别。

在Make-A-Video公布(bù)了AI生成的视频后(hòu),AI圈就(jiù)已(yǐ)经(jīng)玩(wán)了(le)一(yī)波梗,一个能够做(zuò)出更高清视频的AI还不足以在短时间内戳(chuō)中兴(xīng)奋(fèn)点。

Phenaki更(gèng)加令人震惊的地(dì)方(fāng)在于(yú),它可以制作出超过2分钟的连贯(guàn)的(de)也有确切(qiè)内容的视频(pín),这才是真正(zhèng)让人们(men)感到惊喜的地方。因(yīn)为无论AI生成的(de)视(shì)频多么(me)高清,也只(zhǐ)能是(shì)为内(nèi)容(róng)生(shēng)产者提供(gōng)一个(gè)灵感,一个(gè)素材(cái),一个过场动画。

不过能够(gòu)制作出有具体剧情内容的(de)视频就意味着(zhe),一些(xiē)视频(pín)创作由AI代替(tì)人工完成(chéng)已经初(chū)步有了(le)可能。

当下(xià)AI的发展速度已经超过大部分人(rén)的想象。内容产业(yè)的本质是供(gōng)给创造需求,AIGC作为全新(xīn)的内容生产(chǎn)方式(shì),可以为内(nèi)容产业带来(lái)更新的内容风格(gé)、更快的生产速(sù)度,更低的生产(chǎn)成本,这无疑会驱动内(nèi)容产业的大爆发。

除了(le)AI绘(huì)图、视频(pín),AIGC技(jì)术还能应用(yòng)于音乐、代码、机器人(rén)动作等多种内(nèi)容形式的生成。不(bù)难(nán)发现该项技(jì)术不仅在游戏等行业(yè)能得(dé)到有效(xiào)应用,对于下一代互联网各(gè)种元(yuán)素的(de)构建亦有关键(jiàn)意义。

从商业化的角(jiǎo)度来看,文化娱乐、教育、传(chuán)媒等诸多领(lǐng)域,本身(shēn)就对基于AI的可视(shì)化内容有强烈需求(qiú)。

因此,AI绘画及视频或不是结(jié)果,而只是AI进程(chéng)中的(de)一(yī)块重要拼图(tú),有望(wàng)在技(jì)术更新的加持下实(shí)现更大的应用价值。

AI从理解内容(r10克是几两óng),走向了可以生成内容,甚至能(néng)够创造出独立(lì)价值和(hé)独立视角的内容。AIGC的再次出圈,更代表着(zhe)未来(lái)的(de)先进生产(chǎn)力即(jí)将(jiāng)到来。

ChatGPT之(zhī)后(hòu)又一(yī)应用杀(shā)疯了,AIGC或进入可控期,将洗牌科(kē)技(jì)行业?_黑料正能量

04

紧抓大模型与(yǔ)算力,牢固AIGC底座

从技术(shù)的发(fā)展也可(kě)以看(kàn)出,在(zài)语(yǔ)言(yán)大模型、图像大模型之(zhī)后,多模态(tài)大模型已经成为了新的趋势。

大(dà)模型被(bèi)誉为当前人(rén)工智能发展的智能(néng)底座,是全球竞(jìng)争最激(jī)烈的研究方向之一,包括谷歌、亚马(mǎ)逊、百度(dù)、阿里、腾(téng)讯(xùn)等众多头部企业都在竞相发力。

不过训练大模型的确价格不菲,以国盛证券发布的《ChatGPT需要多少算力》报(bào)告估算,GPT-3训练(liàn)一次的(de)成本约为140万美元。而对于(yú)一些更大的LLM(大型语(yǔ)言模型),训练成本(běn)则介于(yú)200万(wàn)美元至(zhì)1200万(wàn)美元(yuán)高价之间。

以ChatGPT在2023年1月的独立访客(kè)平均数1300万计算,其对应芯片需(xū)求为3万多(duō)片(piàn)英(yīng)伟达A100 GPU,初始投入成本约为8亿(yì)美元(yuán),每(měi)日仅电费就在5万(wàn)美(měi)元左右。

ChatGPT之后(hòu)又一应用杀疯了,AIGC或进入(rù)可控(kòng)期,将(jiāng)洗牌科技行业?_黑料正能量(liàng)

此(cǐ)外不论(lùn)是(shì)ChatGPT还(hái)是AIGC,都(dōu)离不(bù)开庞大算力支持。在关注各类大模(mó)型的发展同时,更应(yīng)该关注算力网络的建设。

算力网络正(zhèng)驱动AI产业发展进入(rù)史诗级(jí)加速进(jìn)程,让AIGC及通(tōng)用AI这一人工智能发展的终极(jí)目标离得更近。

因为算(suàn)力可(kě)以对突破性技(jì)术创新提供大力的支(zhī)持(chí)。这方面(miàn),多(duō)模(mó)态大模型是典型。作为(wèi)面向(xiàng)未来强人工智能、通用人(rén)工智(zhì)能的重要技术创新,多模态大模型已(yǐ)经(jīng)在人工智能(néng)领域(yù)提(tí)出了(le)很多年,业界也有不少(shǎo)技术突破,但是,多模态(tài)大模型进一(yī)步往下走,算力需求呈几何式上升,一般的算(suàn)力(lì)基础设施很快将难以(yǐ)胜任。

从图(tú)像(xiàng)、文字、语音单(dān)独一项的训练,到双模态、三模(mó)态(tài)的跃迁(qiān),让人工(gōng)智能可以灵(líng)活应对(duì)不同模态的(de)转化、像人与世界交互一(yī)样自然(rán),这方面(miàn),由算力网络来驱动将有明(míng)显优势。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业(yè)?_黑(hēi)料正(zhèng)能量

此外,还有(yǒu)很多需要(yào)爆发(fā)式(shì)增长的(de)算力来支撑的技(jì)术创新,将在人工(gōng)智能算力(lì)网络支撑(chēng)下快速推进。

AIGC已经露出曙光,期待(dài)在(zài)大模型和(hé)大(dà)算力的支持下(xià)AIGC能持续(xù)颠覆(fù)内容生产的方式,将创造的边际成本降低,让万众受益。

未经允许不得转载:重庆三峡中心医院、三峡中心医院、中心医院 10克是几两

评论

5+2=