10克是几两-重庆三峡中心医院、三峡中心医院、中心医院

10克是几两 ChatGPT之后又一应用杀疯了，AIGC或进入可控期，将洗牌科技行业？

自聊天(tiān)机器人ChatGPT火(huǒ)爆(bào)以(yǐ)来，微软公司创始人比尔·盖茨已多次公开谈(tán)论人工(gōng)智能话题。在最近的一次采访中，他再次表示：“AI可能会(huì)让科技行业(yè)迎来(lái)一次剧烈(liè)的洗牌(pái)”。

这个结论(lùn)是(shì)他在当地时间2月20日接受《In Good Company》节目专访时提出的。

他预期，AI的发展可能会威胁到(dào)谷(gǔ)歌的市占率，因为微软在AI方面的行动相(xiāng)当迅(xùn)速。而(ér)最(zuì)终科技(jì)巨(jù)头将把AI整合成用户的“全能助手”，包(bāo)揽一切(qiè)应用，与人们进(jìn)行沟通(tōng)并(bìng)提(tí)供建议(yì)，可以取代亚马逊、Siri或Outlook等应用。

大佬口(kǒu)中全(quán)能助手的到来可能(néng)尚需时日，但由ControlNet引发的又一次(cì)AI绘画浪潮，让AIGC在ChatGPT的(de)话题热点包围中杀出(chū)重围。

ChatGPT之后又(yòu)一(yī)应用杀(shā)疯了(le)，AIGC或进入(rù)可控期，将(jiāng)洗牌(pái)科技(jì)行(xíng)业？_黑料(liào)正能量(liàng)

ControlNet颠覆AI绘画新玩法

AIGC向可控靠(kào)近

以AI绘画为代表(biǎo)的AIGC上一次爆火的时候，还是2022年(nián)8月，在美国(guó)科罗拉多(duō)州举办的(de)新兴数字艺术家竞赛中，一(yī)幅名为(wèi)《太空歌剧院》的作(zuò)品获奖(jiǎng)。

随后各大厂商(shāng)的(de)AI绘画(huà)软件(jiàn)被广大网友熟知并(bìng)体(tǐ)验，Stable Diffusion便是其中代(dài)表。

用户们(men)可以在(zài)应用中输入一组关(guān)键词或者一张照片，就能获(huò)得一幅AI创作的画作。

作画(huà)的关键就(jiù)是所输入的文(wén)本。同一组关(guān)键词(cí)也可以创作(zuò)出(chū)很(hěn)多张(zhāng)风格不(bù)一样的画作，这让创作的过程就像开盲盒。

很多用(yòng)户很喜欢这种不确定的惊喜，他们会(huì)将生成(chéng)的美图(tú)当做头(tóu)像(xiàng)。而(ér)另一部(bù)分喜欢翻看(kàn)AI绘画的“翻(fān)车”作品。在(zài)社交媒体上，许(xǔ)多用户分享AI“翻车现(xiàn)场”，例(lì)如(rú)，一位网友的(de)小狗照片被AI画成了(le)“肌肉男”，还有网友的(de)个(gè)人照(zhào)片被(bèi)AI识别(bié)成(chéng)了建筑。

而如(rú)今随着ControlNet的出(chū)现与(yǔ)加持，以往(wǎng)AI绘(huì)画的填(tián)写关键词游戏可能要被颠覆了。

ControlNet是一位(wèi)正(zhèng)在斯坦福(fú)读博的中国人张吕敏创(chuàng)作的一(yī)种(zhǒng)基(jī)于控制点的(de)图像变形算法(fǎ)，主(zhǔ)要用于数字图(tú)像(xiàng)处理、计算机视(shì)觉和计算机图形学等领域。

其SD插件一经发布(bù)，在短(duǎn)短的两天内便(biàn)成为(wèi)了AI绘画领(lǐng)域最(zuì)新的热点。

在此之前，大(dà)家用(yòng)了很(hěn)多方(fāng)法想让(ràng)AI生成(chéng)的(de)结(jié)果尽可能的符合要求(qiú)，但是都不尽如人意，它的(de)出现代表着AI生成开始进入真正的可控时期(qī)。

因(yīn)为ControlNet可以直接提取画面的构图，人物(wù)的姿(zī)势和画面的深度信息(xī)等(děng)。有了它(tā)的帮助，就不用频繁的用提示词来碰运气，抽盲盒式的创作(zuò)了。

通俗的说ControlNet相当于给AI绘画加了(le)“魔(mó)法”，不(bù)少博(bó)主的作品已(yǐ)经获(huò)得了大量的(de)浏览量，“viggo”就是其中之一，他用朋友的照片直(zhí)接带她们走进动漫(màn)世(shì)界。

viggo先用StableDiffusion图片转文字。

再用(yòng)Text2Prompt插件拓展找(zhǎo)到(dào)对应的关(guān)键词；最后用(yòng)ControlNet插件绑定(dìng)骨骼开始(shǐ)换关键(jiàn)词试效果。

通过图片就可以看出来，效果十(shí)分惊艳(yàn)。

更厉害的是，除了真实的照片(piàn)，草图也可以加(jiā)上(shàng)“魔法(fǎ)”，知(zhī)乎大牛“DevPoint”和“逗砂”介绍(shào)到ControlNet还能(néng)实现线稿转全彩图(tú)。大(dà)神张吕敏(mǐn)其本(běn)尊也亲自回应。

不得不(bù)说当下AIGC已经变得越(yuè)来越强大，甚至输出的作(zuò)品都已经(jīng)能以(yǐ)假乱真了(le)。

难辨虚实，AIGC技术(shù)力爆(bào)发

警惕安(ān)全问题

近日，“苏州金鸡湖有游艇party”的(de)消息火遍网络，而(ér)经过警方辟谣这(zhè)所谓的“party”可能是(shì)全国第一起(qǐ)AI绘图诈骗。

由于(yú)这个(gè)活动里面给出的美(měi)女照片都是AI制作的真(zhēn)人照片绘图，因为太逼真，被大家当(dāng)成真(zhēn)事传播了(le)。

不过仔(zǎi)细(xì)观察可(kě)以发(fā)现，活动发起(qǐ)者提供(gōng)的(de)照片中(zhōng)有(yǒu)个很大的漏洞(dòng)可(kě)以发现并非真人，而是(shì)AI绘图，那便(biàn)是图片中(zhōng)女性的手指部(bù)分有的存在异常。

ChatGPT之后又一(yī)应用杀疯了，AIGC或进入可控期(qī)，将(jiāng)洗牌科(kē)技行业？_黑料正能量

有行(xíng)业人事表示：“现(xiàn)在因为(wèi)手指部(bù)分的绘(huì)画算(suàn)法比较复杂(zá)，AI还不太会(huì)画(huà)人的手，但最(10克是几两zuì)新(xīn)看到的(de)图片已(yǐ)经有越来越完美的AI模型出现，以(yǐ)后可(kě)能(néng)就完全没有漏洞了。”

类(lèi)似的AI作图诈骗在国外也已有发生。据英国广播公司报道，土耳其(qí)地(dì)震期间，有(yǒu)Tiktok用(yòng)户使(shǐ)用AI合成了儿童受灾(zāi)的假(jiǎ)照片发(fā)布到(dào)网络(luò)，以此诱骗善良(liáng)的人打赏“捐助”从(cóng)而(ér)实施诈骗。

目前(qián)随着(zhe)技术发展，AIGC已经(jīng)能(néng)做出(chū)真人(rén)照片(piàn)般的绘图效果，如果这样(yàng)的(de)图片被用来诈骗(piàn)，将非(fēi)常可怕。

此(cǐ)外(wài)AIGC还引发了(le)很多担忧，一方面，批判者(zhě)认为(wèi)AI在“学习”了大量前人的作(zuò)品之后，其创(chuàng)作(zuò)没有任何情绪和灵(líng)魂(hún)，难(nán)以和人类的艺术创作相提并论(lùn)。

另一方面，AIGC背后的版权、目(mù)前都并(bìng)没有得到有效的解决，还有AIGC会不会代(dài)替(tì)人类“至高(gāo)无上”的创意。

马斯(sī)克也强(qiáng)调(diào)，人工(gōng)智(zhì)能的安(ān)全(quán)问题需要得到重视(shì)，太晚就来不及了。

AIGC下一(yī)站除了(le)视频(pín)，还有远方

技术都是有两面(miàn)性(xìng)的，潜(qián)在的危害并不能掩盖其光辉的贡献。现在看来，人工智能(néng)技术将是第四次工(gōng)业(yè)革命的核心驱(qū)动力量，将(jiāng)创造新(xīn)的增长奇迹。

过(guò)去一(yī)年，人(rén)工智能在技术和商业层面都有(yǒu)了巨大(dà)进展，AI绘画就是人工智能技术发(fā)生方向(xiàng)性改变的一个代(dài)表(biǎo)。其下(xià)一站或许就(jiù)是视频。

此前，Meta和谷歌先(xiān)后发(fā)布了几条引爆科技圈的短视频(pín)。这些视(shì)频(pín)引(yǐn)发关注并非内(nèi)容做得(dé)多优秀，反而都非常简单，比如一匹(pǐ)正在(zài)喝水(shuǐ)的马，一只画画(huà)的玩具熊，或者一段骑(qí)摩托车的第一视角录像，随便一(yī)个有(yǒu)手机的人(rén)都(dōu)可以随手录下(xià)一段(duàn)。

但这些短(duǎn)视频的创作方(fāng)式非常(cháng)简单，创作者(zhě)仅仅需要向AI输入(rù)一段话，甚至只是(shì)说一下要求，AI就可以根据需要生成一(yī)段视(shì)频(pín)。

谷歌发布的两个(gè)AI生成视(shì)频分别(bié)来自于Imagen Video和Phenaki，前者(zhě)主要突出(chū)的是高清，与(yǔ)Meta的Make-A-Video没(méi)有太多的差别。

在Make-A-Video公布(bù)了AI生成的视频后(hòu)，AI圈就(jiù)已(yǐ)经(jīng)玩(wán)了(le)一(yī)波梗，一个能够做(zuò)出更高清视频的AI还不足以在短时间内戳(chuō)中兴(xīng)奋(fèn)点。

Phenaki更(gèng)加令人震惊的地(dì)方(fāng)在于(yú)，它可以制作出超过2分钟的连贯(guàn)的(de)也有确切(qiè)内容的视频(pín)，这才是真正(zhèng)让人们(men)感到惊喜的地方。因(yīn)为无论AI生成的(de)视(shì)频多么(me)高清，也只(zhǐ)能是(shì)为内(nèi)容(róng)生(shēng)产者提供(gōng)一个(gè)灵感，一个(gè)素材(cái)，一个过场动画。

不过能够(gòu)制作出有具体剧情内容的(de)视频就意味着(zhe)，一些(xiē)视频(pín)创作由AI代替(tì)人工完成(chéng)已经初(chū)步有了(le)可能。

当下(xià)AI的发展速度已经超过大部分人(rén)的想象。内容产业(yè)的本质是供(gōng)给创造需求，AIGC作为全新(xīn)的内容生产(chǎn)方式(shì)，可以为内(nèi)容产业带来(lái)更新的内容风格(gé)、更快的生产速(sù)度，更低的生产(chǎn)成本，这无疑会驱动内(nèi)容产业的大爆发。

除了(le)AI绘(huì)图、视频(pín)，AIGC技(jì)术还能应用(yòng)于音乐、代码、机器人(rén)动作等多种内(nèi)容形式的生成。不(bù)难(nán)发现该项技(jì)术不仅在游戏等行业(yè)能得(dé)到有效(xiào)应用，对于下一代互联网各(gè)种元(yuán)素的(de)构建亦有关键(jiàn)意义。

从商业化的角(jiǎo)度来看，文化娱乐、教育、传(chuán)媒等诸多领(lǐng)域，本身(shēn)就对基于AI的可视(shì)化内容有强烈需求(qiú)。

因此，AI绘画及视频或不是结(jié)果，而只是AI进程(chéng)中的(de)一(yī)块重要拼图(tú)，有望(wàng)在技(jì)术更新的加持下实(shí)现更大的应用价值。

AI从理解内容(r10克是几两óng)，走向了可以生成内容，甚至能(néng)够创造出独立(lì)价值和(hé)独立视角的内容。AIGC的再次出圈，更代表着(zhe)未来(lái)的(de)先进生产(chǎn)力即(jí)将(jiāng)到来。

紧抓大模型与(yǔ)算力，牢固AIGC底座

从技术(shù)的发(fā)展也可(kě)以看(kàn)出，在(zài)语(yǔ)言(yán)大模型、图像大模型之(zhī)后，多模态(tài)大模型已经成为了新的趋势。

大(dà)模型被(bèi)誉为当前人(rén)工智能发展的智能(néng)底座，是全球竞(jìng)争最激(jī)烈的研究方向之一，包括谷歌、亚马(mǎ)逊、百度(dù)、阿里、腾(téng)讯(xùn)等众多头部企业都在竞相发力。

不过训练大模型的确价格不菲，以国盛证券发布的《ChatGPT需要多少算力》报(bào)告估算，GPT-3训练(liàn)一次的(de)成本约为140万美元。而对于(yú)一些更大的LLM(大型语(yǔ)言模型)，训练成本(běn)则介于(yú)200万(wàn)美元至(zhì)1200万(wàn)美元(yuán)高价之间。

以ChatGPT在2023年1月的独立访客(kè)平均数1300万计算，其对应芯片需(xū)求为3万多(duō)片(piàn)英(yīng)伟达A100 GPU，初始投入成本约为8亿(yì)美元(yuán)，每(měi)日仅电费就在5万(wàn)美(měi)元左右。

此(cǐ)外不论(lùn)是(shì)ChatGPT还(hái)是AIGC，都(dōu)离不(bù)开庞大算力支持。在关注各类大模(mó)型的发展同时，更应(yīng)该关注算力网络的建设。

算力网络正(zhèng)驱动AI产业发展进入(rù)史诗级(jí)加速进(jìn)程，让AIGC及通(tōng)用AI这一人工智能发展的终极(jí)目标离得更近。

因为算(suàn)力可(kě)以对突破性技(jì)术创新提供大力的支(zhī)持(chí)。这方面(miàn)，多(duō)模(mó)态大模型是典型。作为(wèi)面向(xiàng)未来强人工智能、通用人(rén)工智(zhì)能的重要技术创新，多模态大模型已(yǐ)经(jīng)在人工智能(néng)领域(yù)提(tí)出了(le)很多年，业界也有不少(shǎo)技术突破，但是，多模态(tài)大模型进一(yī)步往下走，算力需求呈几何式上升，一般的算(suàn)力(lì)基础设施很快将难以(yǐ)胜任。

从图(tú)像(xiàng)、文字、语音单(dān)独一项的训练，到双模态、三模(mó)态(tài)的跃迁(qiān)，让人工(gōng)智能可以灵(líng)活应对(duì)不同模态的(de)转化、像人与世界交互一(yī)样自然(rán)，这方面(miàn)，由算力网络来驱动将有明(míng)显优势。