作者: | Tonade |
最后更新: | 2024年4月22日 |
文件类型: | CHECKPOINT TRAINED |
基本模型: | Pony |
模型版本: | v4 |
使用提示: | CLIP SKIP: 2 |
使用介绍
v4版本
这个版本使用了798张图片作为训练素材,并使用3090显卡训练了90个小时。这个版本相较于v3.5在某些prompt下的构图以及对于某些部位的刻画更加正确,比如手指部分的重影以及一些身体部位的重叠。在prompt方面,我还是以中等长度以及稍短长度的prompt作为主要的训练目标,毕竟谁都不喜欢写一长串的prompt才能生成质量好的图是吧?在去掉pony的美学得分的质量prompt后,图像的质量相比v3.5有很高的提升,出图的质量会偏向于更加平面而非立体的画面,更加接近于经典的动漫画风。对于图片数量对于ponyv6的微调效果的测试接近尾声,下一步就是从prompt的训练标签入手,尝试在pony有限的单次训练素材数量里面添加更多可调控的prompt(例如将美学评分加入进去,现在的训练逻辑还是用主流的质量词去覆盖掉pony的美学得分质量词),并且会持续增添合适的新训练素材,例如场景的训练素材以及更多的足部训练素材(v4的足部训练素材似乎有点少了)。
模型已经内置vae了,不需要额外添加vae
本模型完美支持由ponyv6为底模训练的模型,ani3,sdxl1.0的lora也能在某种程度上适配
pony是神,兼容性满分。本模型支持ani,pony的lora
必备前置效果词和ponydiffusion一样
positive:(score_9,score_8_up,score_7_up,score_6_up,score_5_up,score_4_up)
OR (score_9,score_8_up,score_7_up)
负面可加:
negative: (score_4,score_3,score_2,score_1),
也可以加正常的nai系负面词,例如:
negative: worst quality, bad hands, bad feet
训练须知:v1使用了94张,v2用了119张,v3用了348张,v3.5用了474张,nai3生成的图片,训练的lora融进底模进行微调,pony支持的画师tag都支持,使用两个以上的画师tag可能会导致背景崩溃,目前发现能生成原神的角色,其他的不知道了,对于这个模型我测试的也不多,惊叹于其对于nai3的画风复刻中。底模是T-anime-xl和ponyv6以及ani3的融合模型,并未发布。
使用的训练显卡是我自己的3090显卡,v1到v3分别使用了7小时,12小时,35小时,47小时
作品参照
Stable Diffusion提示词
score_9,score_8_up,score_7_up,1girl,solo,red eyes,black hair,long hair,looking at viewer,smile,fur trim,hair bun,bare shoulders,hair ornament,bangs,off shoulder,double bun,closed mouth,jacket,twintails,sleeveless,hand up,blurry,sidelocks,black jacket,long sleeves,from below,low angle,ground level,foot focus,good feet
Negative prompt: (score_4,score_3,score_2,score_1),ugly,bad feet,bad hands,
Steps: 25, ENSD: 31337, Size: 952x1192, Seed: 197370045, Model: T-ponynai3-v4, Version: v1.6.0, Sampler: Euler a, CFG scale: 7, Clip skip: 2, Model hash: d35b0492ea, Hires steps: 10, Hires upscale: 1.7, Hires upscaler: R-ESRGAN 4x+ Anime6B, Denoising strength: 0.3