自聊天机器人ChatGPT火(huǒ)爆以(yǐ)来,微软公(gōng)司创始人比尔(ěr)·盖茨已(yǐ)多次公开谈论(lùn)人工智能(néng)话题(tí)。在最近(jìn)的一次采访中,他(tā)再次(cì)表示:“AI可能会(huì)让科技行业迎来一(yī)次剧烈的洗(xǐ)牌”。
这(zhè)个结(jié)论是他在(zài)当地时间2月20日(rì)接受(shòu)《In Good Company》节目专(zhuān)访(fǎng)时提出(chū)的(de)。
他预(yù)期,AI的发展可能会威胁到(dào)谷歌的市占率,因(yīn)为微软(ruǎn)在AI方(fāng)面的行动(dòng)相当(dāng)迅速(sù)。而(ér)最终科(kē)技巨(jù)头将把AI整合成用户(hù)的“全能(c上标3下标5怎么算公式,c上标2下标5怎么算néng)助手(shǒu)”,包揽一切应(yīng)用(yòng),与人们进行(xíng)沟通(tōng)并提供建议,可以取(qǔ)代亚马逊、Siri或(huò)Outlook等应(yīng)用。
大佬口(kǒu)中全能助(zhù)手(shǒu)的(de)到(dào)来可能尚需时日,但由ControlNet引(yǐn)发的又一次AI绘画浪潮,让AIGC在ChatGPT的话题热(rè)点包围中(zhōng)杀出重围。
01
ControlNet颠覆AI绘画(huà)新玩法
AIGC向可控(kòng)靠(kào)近
以AI绘画(huà)为代表的AIGC上一次爆火的时候,还是2022年8月,在(zài)美国科罗(luó)拉多州举办的新(xīn)兴数字艺术家竞(jìng)赛中,一幅名为《太空歌剧院》的(de)作品获(huò)奖。
随(suí)后各大厂商的AI绘(huì)画软(ruǎn)件被广大网友熟知并体验(yàn),Stable Diffusion便是(shì)其中代表(biǎo)。
用户们可以在(zài)应用(yòng)中(zhōng)输入一组(zǔ)关键词或者一张照片(piàn),就能(néng)获得一(yī)幅(fú)AI创作的画作。
作画的关键就是(shì)所(suǒ)输入的文(wén)本。同一组关键词(cí)也可(kě)以创作出很多张风(fēng)格不一(yī)样的画(huà)作,这让创作的过程就像开盲(máng)盒。
很多用户(hù)很喜(xǐ)欢这种不确定的惊喜,他们(men)会将生(shēng)成(chéng)的(de)美(měi)图当做头像。而另一(yī)部分喜欢翻看AI绘画的“翻车”作(zuò)品(pǐn)。在社交c上标3下标5怎么算公式,c上标2下标5怎么算(jiāo)媒体上,许多用户分享AI“翻(fān)车现场”,例(lì)如,一位网友的小狗照(zhào)片被AI画成了“肌肉男”,还有网友(yǒu)的个人照片(piàn)被AI识别(bié)成了建筑。
而如今(jīn)随着ControlNet的出现(xiàn)与加持,以(yǐ)往AI绘画(huà)的填写关(guān)键词游戏可能(néng)要被颠覆了。
ControlNet是一位(wèi)正在斯坦福读博的中国人张吕敏(mǐn)创(chuàng)作的一种基于控(kòng)制点的图像(xiàng)变(biàn)形算法(fǎ),主(zhǔ)要用于数字图像处理、计(jì)算机视觉和计算机图形学等领域。
其SD插件一经(jīng)发布(bù),在(zài)短短(duǎn)的两天内便成为了AI绘画(huà)领域(yù)最新(xīn)的热点。
在(zài)此之前,大家用了很多方法想让(ràng)AI生成的结果(guǒ)尽可(kě)能的符合要求,但(dàn)是都不(bù)尽如人意,它的出现代(dài)表着AI生成(chéng)开始(shǐ)进入真正的可(kě)控(kòng)时(shí)期。
因为ControlNet可以直接提取(qǔ)画面的(de)构图,人物的姿势(shì)和画面(miàn)的深度信(xìn)息等。有了(le)它(tā)的帮助,就不(bù)用(yòng)频繁的用提示词来碰运(yùn)气,抽盲(máng)盒(hé)式的创作了。
通俗的(de)说ControlNet相(xiāng)当于给AI绘画加了(le)“魔法(fǎ)”,不少博主的作品已经(jīng)获得了大量的浏览量,“viggo”就是其中之一,他用朋友(yǒu)的照片直接(jiē)带她们走进动漫世界。
viggo先(xiān)用StableDiffusion图片(piàn)转文字。
再用Text2Prompt插件拓展找到对应的关(guān)键词;最后用ControlNet插件绑定骨骼(gé)开始换关(guān)键(jiàn)词试效果。
通(tōng)过(guò)图片就可以看(kàn)出来(lái),效果(guǒ)十分(fēn)惊艳。
更(gèng)厉害(hài)的(de)是,除了真(zhēn)实的照片(piàn),草图也可以加(jiā)上“魔法(fǎ)”,知乎大牛“DevPoint”和“逗砂”介绍到ControlNet还能实现线稿转全彩图。大神张吕敏(mǐn)其本尊也亲自回应(yīng)。
不得不说当下(xià)AIGC已经变得越来越强大,甚(shèn)至输出(chū)的作(zuò)品都已经能以(yǐ)假乱(luàn)真(zhēn)了。
02
难辨虚实(shí),AIGC技(jì)术(shù)力爆(bào)发
警惕安全问题
近日,“苏州金鸡(jī)湖有(yǒu)游艇party”的消息火遍网络,而经过(guò)警方辟谣这所谓的“party”可能是全国(guó)第一起AI绘图诈骗。
由(yóu)于这个(gè)活动里面给出的美(měi)女照片都是AI制(zhì)作的真人照片(piàn)绘图,因为太逼真,被(bèi)大家当成真事传播了。
不过仔细观察可以发现,活动发(fā)起者提供的照(zhào)片中(zhōng)有个很大的漏洞可以发现(xiàn)并(bìng)非真人,而是AI绘图,那(nà)便是图片中(zhōng)女性的(de)手指部分有的存在异常。
有行业人(rén)事表(biǎo)示(shì):“现(xiàn)在因为手(shǒu)指部分的绘(huì)画(huà)算(suàn)法(fǎ)比(bǐ)较复杂,AI还不太会画人的(de)手,但最新看(kàn)到(dào)的图(tú)片已(yǐ)经(jīng)有越来(lái)越完美的AI模型出(chū)现,以后可能(néng)就完全没(méi)有漏洞了。”
类(lèi)似的(de)AI作图诈骗在(zài)国外也(yě)已有发生(shēng)。据英(yīng)国广播(bō)公(gōng)司报道,土耳其地震期间,有Tiktok用户使用AI合(hé)成了儿童受灾(zāi)的假(jiǎ)照片发布到(dào)网络,以此诱骗(piàn)善(shàn)良的人(rén)打赏“捐助”从而实(shí)施诈骗(piàn)。
目前随着技术发(fā)展,AIGC已经能做出真人照片(piàn)般的绘(huì)图效(xiào)果(guǒ),如果这(zhè)样的图片被用来诈骗(piàn),将非常可怕。
此外AIGC还引发(fā)了很多担忧,一方面,批判者(zhě)认为AI在“学习(xí)”了大(dà)量前人的(de)作品之(zhī)后,其创作没有任何情绪(xù)和灵魂,难(nán)以和人类的艺术创作相提并论。
另一方面(miàn),AIGC背后的版(bǎn)权、目(mù)前都并没(méi)有得到有效的解决,还有AIGC会不(bù)会代替(tì)人类“至高无上”的(de)创(chuàng)意。
马斯克也强(qiáng)调,人工智能(néng)的(de)安全(quán)问题需要得到重视,太晚(wǎn)就来(lái)不(bù)及了。
03
AIGC下(xià)一站(zhàn)除了视频,c上标3下标5怎么算公式,c上标2下标5怎么算ng>还有(yǒu)远方(fāng)
技术都是(shì)有两(liǎng)面性的(de),潜(qián)在的(de)危害并不能掩(yǎn)盖其光辉的贡献(xiàn)。现在看来,人工智(zhì)能技术将是第四(sì)次工业革命的核心驱动力量,将创造新的增长奇迹。
过去一年,人工智能在技术和(hé)商业层面(miàn)都有了巨大进展,AI绘画就是人工智(zhì)能(néng)技术发生方(fāng)向性改变的(de)一(yī)个(gè)代表。其下一站或许就是视频。
此(cǐ)前(qián),Meta和谷(gǔ)歌(gē)先后发布(bù)了几条引爆(bào)科技圈的短视频。这些视频引发关注并非内容做(zuò)得多优秀,反而都非(fēi)常简单(dān),比如(rú)一匹正在喝水的(de)马(mǎ),一只画画(huà)的玩具熊,或者(zhě)一段骑(qí)摩托车的第一视角录像(xiàng),随(suí)便(biàn)一(yī)个有(yǒu)手机的人(rén)都(dōu)可以随手(shǒu)录下一段。
但(dàn)这些(xiē)短视频(pín)的创作方式非常简单(dān),创作(zuò)者仅仅需要向AI输入一(yī)段(duàn)话,甚至只(zhǐ)是(shì)说一下要求(qiú),AI就可以根据需要生成一段视频。
谷歌发布(bù)的(de)两个(gè)AI生成视频分(fēn)别来自于Imagen Video和Phenaki,前者主要(yào)突出的是高清,与Meta的Make-A-Video没有太多的差别。
在Make-A-Video公布了AI生成的视频后,AI圈就(jiù)已经玩了一波梗,一个能够做出更高清(qīng)视频的AI还(hái)不足以在短时间内戳中兴奋点。
Phenaki更加令人震惊的(de)地(dì)方在于(yú),它可以制作出(chū)超(chāo)过2分钟(zhōng)的连贯的也(yě)有确切内容的视频(pín),这(zhè)才是真正让人们感到惊(jīng)喜的(de)地方。因(yīn)为无(wú)论AI生成的视频多么高清,也只能(néng)是为内容生(shēng)产者(zhě)提供一(yī)个灵感(gǎn),一个素(sù)材(cái),一个过场(chǎng)动画(huà)。
不过能(néng)够(gòu)制作出有具(jù)体剧情内容的视频就意味(wèi)着,一(yī)些视频(pín)创作由AI代(dài)替人工完(wán)成已经初步有了可(kě)能(néng)。
当(dāng)下(xià)AI的发展速度已经(jīng)超过大(dà)部(bù)分人的想象。内容产业的本质(zhì)是供给创造需求,AIGC作为全新的内容生产方式,可以为内容产业(yè)带来更新的内容风格、更快的生产速度,更(gèng)低的生产成本(běn),这无疑会驱动(dòng)内容产业的(de)大爆发。
除(chú)了AI绘图(tú)、视频,AIGC技术还能应用(yòng)于音乐、代码(mǎ)、机器人动作等(děng)多种(zhǒng)内容形式的(de)生(shēng)成。不难发现该项技术不仅在游戏等行业能得到有效应用,对(duì)于下(xià)一代互(hù)联网各种(zhǒng)元(yuán)素(sù)的构建亦(yì)有关键意义。
从商业化的角度来看,文化娱乐(lè)、教育、传媒等诸多领域,本身就对基于(yú)AI的可(kě)视化(huà)内容(róng)有强烈需求。
因此(cǐ),AI绘画及视(shì)频(pín)或不(bù)是结果,而只(zhǐ)是AI进程中的一块(kuài)重要拼图,有望在技术更新的加(jiā)持(chí)下实现更大的应用(yòng)价值。
AI从理解内(nèi)容,走向了可(kě)以(yǐ)生(shēng)成内容(róng),甚至能够创(chuàng)造出独立价值和独(dú)立(lì)视角的内(nèi)容。AIGC的再次出(chū)圈,更代表着未来的(de)先进生产力(lì)即将到来(lái)。
04
紧抓(zhuā)大模(mó)型与算(suàn)力,牢固AIGC底座
从技术(shù)的发展也可以看出,在语言大模(mó)型(xíng)、图像大模型之(zhī)后,多模态大模型已(yǐ)经成(chéng)为了新的趋势(shì)。
大模型被誉为当(dāng)前人工智能发展的智能底座,是全(quán)球(qiú)竞争最(zuì)激烈的研究方向(xiàng)之一,包括谷歌、亚马逊、百度、阿里、腾(téng)讯等(děng)众多头部企业都在竞相(xiāng)发力。
不(bù)过(guò)训练(liàn)大模(mó)型的确(què)价(jià)格不(bù)菲,以(yǐ)国盛证券发(fā)布的《ChatGPT需(xū)要多少(shǎo)算力》报告估(gū)算(suàn),GPT-3训练一(yī)次的成本约为140万美元。而对于一些更大的LLM(大型语(yǔ)言(yán)模(mó)型(xíng)),训练成本则介于200万美元至1200万美元高价之间。
以ChatGPT在2023年1月的独立(lì)访客平均(jūn)数1300万(wàn)计算,其对(duì)应芯(xīn)片需(xū)求为3万多片英伟达A100 GPU,初始投入成本(běn)约为8亿美元,每日仅电费就在5万美元左右。
此外不论是ChatGPT还是AIGC,都离不开庞大算(suàn)力(lì)支(zhī)持。在(zài)关注(zhù)各类大模型(xíng)的发展同时,更(gèng)应该关注(zhù)算力网(wǎng)络的建设。
算(suàn)力网(wǎng)络正驱动(dòng)AI产(chǎn)业发展进入史诗级(jí)加速进(jìn)程,让AIGC及通用AI这一人工智能发展的终极目标离得更近。
因为算力可以对突(tū)破(pò)性(xìng)技术创(chuàng)新提供大力的(de)支持(chí)。这方面,多模态大模型是典型(xíng)。作为面向未来强人工(gōng)智能(néng)、通(tōng)用人工(gōng)智能(néng)的重要技(jì)术(shù)创新,多模(mó)态大模型已经(jīng)在人工智能(néng)领域提(tí)出(chū)了很(hěn)多年(nián),业界也有不少技术突破,但是,多模态大(dà)模型(xíng)进一步往下走(zǒu),算力需(xū)求呈几何式上升,一(yī)般的算力基础设施很(hěn)快将(jiāng)难以胜(shèng)任。
从图像、文字、语音单独一项的训(xùn)练,到双模态、三(sān)模态的跃迁,让(ràng)人(rén)工智能(néng)可以灵(líng)活(huó)应对不同模态的(de)转化、像人与世界交互一样自然(rán),这方面,由算力网(wǎng)络来驱动将有明(míng)显(xiǎn)优势。
此外,还有很多需要(yào)爆发式增(zēng)长的算(suàn)力来(lái)支撑的技术(shù)创新,将在人工智(zhì)能算(suàn)力(lì)网络支(zhī)撑(chēng)下快(kuài)速推进。
AIGC已经露出曙光,期(qī)待在大模型和大算力的支持下AIGC能持(chí)续颠覆内(nèi)容生产的方式(shì),将创造的边际成本降低(dī),让万众受益。
未经允许不得转载:连云港装饰公司,豪泽装饰 c上标3下标5怎么算公式,c上标2下标5怎么算
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了