微信扫一扫 分享朋友圈

已有 739 人浏览分享

[功能参数]    AI生成图像的Seed和gen_id、噪声的区别和用法解析

功能参数 2024-3-4 17:04:06739 0
关于seed、genid、和噪声我们以chatgpt为例,dalle3图像生成时它并不是一个完全随机放任不管的文件,每张图片生成后它都有一个序号,这个需要是唯一的,就像图1图2图3,这个序号的名字就叫gen_id。seed种子号它是一个图像生成时多用的算法,它包含了图像的风格元素,色彩,落笔的位置,轮廓,形状等,你可以获得这个图像的种子号,并且加以利用,种子生成时是随机的,这个风格元素的过程是依赖于噪声技术的影响的,在dalle3中它通常是代表了像素点,压缩采样,数字处理,数据传感等。噪声是一个不公开的数据,但你可以通过其它形式来调试它,我们再做一致性图像的时候通常会引用seed或genid,但这是不稳定的,而噪声技术则是底层的控制逻辑,如果会调试噪声那一定是高手。


图为 GPT 试图可视化的静态噪声图片,可以理解为它是图像生成的初始状态,他在根据提示词逐渐形成形状,色彩,纹理,光等元素,最终他会形成seed。


Chatgpt Dalle3-AI生成图像的Seed和gen_id、噪声的区别和用法解析(1)

以下是版主和一位泰国朋友共同研究的AI噪声报告,我们已经在国际的知名机构上进行发布,它现在已经开始在国际上传播。


AI 中的噪声简介
在生成式 AI 领域,“噪声”是指模型(例如 OpenAI 的 DALL-E)用作创建新内容的起点的随机输入。噪声是机器学习的基本概念,是随机性的种子,可促进生成模型输出的多样性。

噪声的作用
噪声不仅仅是一种混乱的存在;它也是一种存在。它是人工智能创造力的催化剂。当我们将噪声输入生成模型时,我们本质上是为它们提供了一张随机画布,它们可以在复杂的算法和训练数据的指导下从中绘制模式,以创建结构化且连贯的输出。

静态噪声与动态噪声参数
“静态噪声”是一个术语,可用于描述随机性的初始状态,即人工智能开始生成过程之前的固定起点。相比之下,动态噪声参数是那些可以在生成过程中进行操纵以影响结果、增加可变性或将创作引导到某些风格方向的参数。

AI 中噪声使用的演变
最初,GPT 和 DALL-E 等生成模型使用数字种子来引入可变性。然而,随着模型的发展,我们看到了使用更复杂形式的噪声的转变,其中可以包括各种字符串(字母、数字和符号),以增加生成内容的多样性。

对生生和创造力的影响
对于使用人工智能的创作者来说,控制噪声参数的能力意味着对生成图像的风格、纹理和细节有更大的影响。在生产中,这意味着更高效的工作流程,可以通过调整噪声参数来实现所需的更改,而不是从头开始生成过程。

案例研究和观察
在实践中,正如在生成一系列图像时所观察到的那样,调整噪声或提示细节可能会导致人工智能输出的显着变化。这种细致入微的控制使艺术家能够保持主题的一致性,同时引入新的叙事元素,正如一系列图像所证明的那样,即使内容发生显着变化,风格特征也得以保留。

结论和未来方向
随着人工智能的不断发展,我们可以预期噪声将在创作过程中发挥越来越复杂的作用。更直观的控制机制的潜力预示着艺术家和创作者与人工智能共同创造的未来,不仅使用噪音作为随机性来源,而且作为将他们的愿景绘制到数字画布上的画笔。

进一步研究
要更深入地研究噪声的技术方面及其在生成人工智能中的作用,请考虑探索 OpenAI 等机构的学术论文和研究。随着该领域的快速发展,对于任何希望在创造性工作中利用这些技术的人来说,通过信誉良好的来源获取信息至关重要。

本文是基于讨论的高级总结和分析,不包含任何特定来源的逐字内容。然而,对于那些对人工智能噪声机制及其实际应用的更多技术细节感兴趣的人来说,他们可以探索一系列定期记录该领域最新进展的学术和行业出版物。

这是噪声形成图像的中途,我们可以看到图像开始逐渐成型


Chatgpt Dalle3-AI生成图像的Seed和gen_id、噪声的区别和用法解析(2)

Chatgpt Dalle3-AI生成图像的Seed和gen_id、噪声的区别和用法解析(3)

我们经常会说 帮我引用seed:xxxx 或者参考genid来达到创建一致性图片的目的,但你有没有感觉到,这个说法是不可控的,它的结果像与不像你都无法改变什么,你只能抽卡说重新生成,但当你能够精确控制噪声的改变时,他会完全一致。


  • 联系我们
  • 邮箱:1992608358#qq.com(请把#改成@)
  • 微信:mianfeixueai
  • QQ客服 1992608358
  • 工作时间:周一至周五(早上9点至下午5点)
  • 微信公众平台

  • 扫描访问手机版

QQ|NIUBOYI ( 京ICP备17025393号 )|网站地图

GMT+8, 2024-10-23 01:56 , Processed in 0.037025 second(s), 39 queries .

POWERED BY NIUBOYIAI! 主理人:NIUBOYIAI  点亮哥

Copyright © 2001-2020, NIUBOYI AI.