算作又名感奋“赛博写手”的无名小编,在完成每天的职责之余,即是在各种Ai绘画社群与某鸟上冲浪,最近一段时刻ChatGPT的“Meme时刻”(即是常说的高光时刻)赫然还是畴昔了,与之陪同的Ai举座热度也运转下滑义务教育,莫得3月初期那种一刷信息流就全是Ai本色的“拥堵感”。
百度的Ai搜索指数
谷歌的Ai关节词全球搜索指数(这越南有点东西啊)
其实这亦然功德,任何特有簇新时间的“出生时刻”齐是惹东谈主祥和的,但思要着实有所成立,如故需要时刻的千里淀,哪怕是Ai时间的迭代是平凡科技家具的指数级倍数。比如最近,谷歌的2023 IO拓荒者大会上,剑指微软系(ChatGPT/Bing/copliot)的Palm2模子发布,不仅领有与GPT4相抗衡的言语才略,同期还打了一套Ai组合拳来维系谷歌科技龙头的地位。
图片源自互联网
PaLM 2模子有四个版块,按照大小从小到大辞别是Gecko、Otter、Bison和Unicorn。其中,轻量级的Gecko模子不错快速的在出动建造上运行,无需麇会集合。PaLM 2在越过100种言语的语料库上进行考研,因此它在照管多言语任务上阐扬优异,能融会、生成和翻译更紧密、千般化的文本。在一些基准评估中,PaLM 2部分收货致使越过了GPT-4。尽管PaLM 2的参数数目更少,但其性能却优于上一代PaLM模子。
谷歌bard对话模子逾越相比赫然,应该还是使用了PaLM 2模子
可见在短短的几个月中,由算法、算力组织起来的Ai机灵树还是从一棵小树苗长成一棵硕果累累的巨树,至于这棵树会不会成为异日东谈主类科技的“机灵之母”,如故要恭候与辩证地看待。
Midjourney丨Ai绘画
总结到标题上,最近在C站发现了一个运行在stable diffusion上的新模子,名字叫作念BRA(Beautiful Realistic Asians) V5直译为秀雅传神的亚洲东谈主,点击检察其成果像片,特地惊艳,不少用户展示出的作品齐能达到像片级别,于是我就下载尝试玩玩。
图片源自互联网
阐发该模子的创作家先容,该模子使用了轻便 3 个月的考研失败以及考研并吞的杀青。该作家是一位在新加坡的华东谈主,会说极少点汉文与日文。
使用Discord和该模子制作家相易一下使用心得
底下是我欺诈该模子投合一些特定的prompt产出的成果图片,部分图片由于原生精度与分辨率不及,我欺诈NVIDIA保举的ON1 Ai放大软件进行了分辨率膨大,群众不错来望望这些Ai产出的图片是否很具有迷惑性。
stable diffusion丨BRA V5义务教育
部分prompt:8k, best quality, masterpiece, ultra highres_1.2) Photo of Pretty Japanese woman in the style of paul rubens and rebecca guay
stable diffusion丨BRA V5
stable diffusion丨BRA V5
stable diffusion丨BRA V5
stable diffusion丨BRA V5
部分prompt:A beautiful woman is setting up a stall in the street market,beautiful face,cinematic, Faint side light,fine details, 8k,
stable diffusion丨BRA V5
stable diffusion丨BRA V5
stable diffusion丨BRA V5
部分prompt:A lovely girl typing in front of the office computer, beautiful, lovely face, shot with Nikon Z7 full frame camera, 50mm lens,
stable diffusion丨BRA V5
stable diffusion丨BRA V5
部分prompt:girl at the bus stop on a rainy day, no umbrella, getting wet, cute face, short haircinematic,Faint side light,fine details
stable diffusion丨BRA V5
stable diffusion丨BRA V5
部分prompt:Cute girl at the beach, short hair, smile, sunset, with a bow, half body, film style,cinematic,Faint side light,fine details, 8k
stable diffusion丨BRA V5
stable diffusion丨BRA V5
部分prompt:girl in supermarket, young girl, bangs, cute face, 50mm, F1.2, shot by Nikon camera, faded film style,Faint side light,
stable diffusion丨BRA V5
stable diffusion丨BRA V5
stable diffusion丨BRA V5
部分prompt:Snowy girl with a scarf covering her nose, big eyes, eyelashes, black pupils, F1.2, shot by Nikon camera, faded film style
stable diffusion丨BRA V5
部分prompt:Urban girl, city neon as background, city night view from high above, neon flashing, with love, short hair, wearing glasses
是不是感到很惊艳,不单是是屏幕前的群众,就算考研过千张Ai图片的我,当看到光辉、五官、步地与花样与像片险些无死别的Ai生图时亦然横蛮得不可,要知谈就在20天前咱们在作念《NVIDIA显卡Ai算力大比拼,思画Ai女友该何如选?》时画出的Ai女友也就只是长成这么:
天然也口角常楚楚动东谈主,但一眼就能以为这是Ai出图,在脸部与皮肤的生成上,Ai特地倾向给出特地无缺的“光辉成果”,让皮肤的脸色、光感齐处于绝佳状况,眼睛与嘴唇的细节照管也偏向于极致,眼妆与口红的色号也齐是使用了“婚典级别”,让图片中的女生天然光彩动东谈主,然则太过于“无缺”,少了真实感。
但在BRA V5中,在生成东谈主像时,Ai模子致使会刻意避让脸部的细节光辉,让图像中的脸部处于阴雨面或者侧光面,同期在脸上加入了不少“污点”,比如赫然的血管纹、痘痘、斑点等来增多东谈主像的真实感。
图片中的女生致使有昂首纹,肤色也相对更偏向真实,另外东谈主脸的骨骼结构也更偏向真东谈主
在该张中,女生的眼袋与斑点亦然相比赫然,同期不会出现Ai经典的假笑
相同的,脸部会出现一些血管纹、钤记等污点来衬托真实感
脸部会有赫然的高光与暗影区域,相宜在真实光辉与影相环境中的出图
这么的像片也奏效骗到了我的一又友们,天然他们还是给我打上了“我发的女生99%齐是Ai画的”标签,但依然这几组奏效唬到了不少东谈主。
看来,在可预料的异日,心爱好意思瞻念妹妹的男生们不仅要防过度好意思颜大法还要警惕Ai好意思女的以伪乱真,这也从侧面响应了,刻下的Ai生图时间的广泛,那么面前流行的stable diffusion和midjourney的Ai绘图软件到底是何如融会翰墨,然青年景这么的图片的呢?
stable diffusion丨BRA V5
接下来就来为群众揭开Ai绘画的玄机,但其中会触及无数的时间类名词,为了更绵薄群众的融会,我会用无数的譬如来代替。
教育时刻
使用过stable diffusion和midjourney的小伙伴齐应该明晰,Ai绘图齐一个从“暧昧到清楚”的经过,岂论是基于土产货的stable diffusion如故基于线上高性能处事器的midjourney。
这暧昧到清楚的经过即是刻下Ai绘画的主流技能-Diffusion model(扩散模子),简略点说,Ai绘画会先把图片进行“降维”然后考研,这个降维的经过很像是群众平素使用的榨汁机,将一个苹果放在榨汁机里去打碎了,形成苹果泥,然后吃一口,记着苹果泥的滋味,从而知谈这个滋味的果泥即是苹果。
Midjourney丨Ai绘画
而Ai则是将图片进行“嚼碎”(加噪点)来形成一组组的马赛克图片,这么的宅心是在有限的算力下尽可能地多学习几组图片,多生成几组图片。因为马赛克的数据值是精准图片的1/100致使1/1000.
那面前知谈了Ai是怎么快速学习图片的,那怎么生成呢?如故拿苹果泥例如,在咱们吃过了很多的果泥,比如苹果的、西瓜的、哈密瓜的、香蕉的,咱们即使蒙上眼睛,只需要通过极少点的果泥就能分辨这个生果,然后回复出来。
Midjourney丨Ai绘画
Ai亦然访佛类似的经过,通过无数的图片加噪点获得的马赛克图片,Ai也总结出了这个马赛克是猫、阿谁马赛克是狗之类的规章(具体逻辑相比深,不作念赘述)。那就不错通过马赛克来反向规复图像,这一步就叫作念Reverse diffusion 反向扩散。
那么,Ai是怎么融会咱们的言语,并阐发咱们的思法画出“咱们思要的姑娘姐”的呢?经过中需要将文本进行“分词器Tokenizer”然后进行“clip”再进行“镶嵌Embedding”,就不错让机器学习、意志到了!谢谢群众!
好了,不闹了。这些拗口且复杂的宗旨应该留给愈加专科的小伙伴去学习,咱们只需要知谈,Ai(非论是绘图的,如故GPT类型的)齐是通过将翰墨“降维”的方式来融会并学习,有点像是上述提到的“苹果泥”宗旨,Ai会将用户输入的文本拆分为更小的单位(词或字符),然后将分词后的文本调养成数学向量,这么模子身手更好地融会和照管。
Ai融会即是将文本碎屑化、数字化丨Midjourney丨Ai绘画
然后就要用到调养器模子(Transformer Model):这是一个大致照管序列数据(如文本)的深度学习模子。它通过捕捉文本中的依赖干系和高下文信息,为生成图像提供丰富的信息。类似于专科的言语学家来帮预计机照管文本的干系,比如用户输出“可儿的猫”,不至于出现“猫的爱可”这么的预计机识别错误。
调养器模子即是将成堆的拼图碎屑调养成一张张完整的拼图丨Midjourney丨Ai绘画
融会完文本,就到了画画的经过了,就要用到噪声画画这个宗旨,如同吃生果泥来辩认生果,噪声瞻望器(Noise Predictor):这一步欺诈调养器模子提供的信息,逐渐生成图像。通过迭代经过,噪声瞻望器会从简略的图像运转,渐渐细化细节。这即是为啥咱们看到的Ai绘画齐是从暧昧到清楚的经过。也像是一个画家阐发一段描画运转创作,先绘制大致笼统,然后抑止添加细节,直至完成一幅画作。
也不错融会为渐渐地去雕琢一块巨石丨Midjourney丨Ai绘画
接下来,我欺诈stable diffusion给群众展示一个姑娘姐的生成经过,
给Ai输入姑娘姐的关节词(prompt)
输入一定的特定咒语,比如什么高档渲染,8K渲染,HDR渲染之类的,还有一定的反面词,比如不要奇怪的手部,不要无理之类的。
运转绘图,获得杀青
要是在这经过中,咱们中断一下模子的进程就不错获得类似于带有噪点的图片
从绘图经过中,咱们不错看到绘图一运转的经过中,Ai即是先生成一个相比暧昧的东谈主物形象,一个大致的笼统,然后逐渐地去填充,在绘图进程46%的时候就不错初见东谈主物的雏形,后续齐是把东谈主物的细节进行修订修改。
stable diffusion丨BRA V5
这即是不错以伪乱果然姑娘姐的出生经过了,感敬爱敬爱的小伙伴不错尝试用SD来画我方心爱的姑娘姐形象,然则请守护的是,面前国内的部老实容平台还是运转针对Ai生图进行了扫描识别并下架部分涉嫌违章的本色。面前Ai领域的规章如故处于空缺阶段,是以针对版权保护等行径还莫得透顶上线。
stable diffusion丨BRA V5
但愿诸君在欺诈Ai用具的同期也要敬畏时间带来的冲击,我很心爱老黄在NVIDIA 2023大会上提到的“咱们处于Ai的iPhone时刻”,正如iPhone透顶颠覆了手机商场一般,咱们也需要辩证地看待Ai将会带来的改换。
时间莫得詈骂之分义务教育,是一把达摩克利斯之剑。