AMZ123跨境卖家导航
拖动LOGO到书签栏,立即收藏AMZ123
首页跨境头条文章详情

现在的运营不懂点AI工具都不好意思说自己在做亚马逊,stable diffusion的第一课你不来看看吗?

1786
2023-06-09 18:59
2023-06-09 18:59
1786


想学习 stable diffusion 吗?这份初学者指南适用于零经验的新手,无论是对 stable diffusion 还是其他 AI 图像生成器一无所知。

你将获得 stable diffusion 的概述和一些基本的有用提示。

在本页面上尝试使用 stable diffusion AI。这是学习的最佳方式!

什么是 stable diffusion?

stable diffusion AI 是一种生成 AI 图像的潜在扩散模型。生成的图像可以像相机拍摄的照片一样逼真,也可以具有专业艺术家制作的艺术风格。

最好的部分是它是免费的-你可以在你的个人电脑上运行它。

如何使用 stable diffusion?

你需要给它一个描述图像的提示。例如:

姜饼屋,二三维模型,聚焦,白色背景,吐司,脆脆麦片

stable diffusion 会将这个提示转化为以下图像。你可以根据同一个提示生成任意多个变体。

stable diffusion 的优势是什么?

有类似的文本到图像生成服务,比如 DALLE 和 MidJourney。为什么选择 stable diffusion?stable diffusion 的优势包括:

开源:许多爱好者创建了免费的工具和模型。设计用于低功耗计算机:运行它是免费或廉价的。

stable diffusion 是免费的吗?

在你自己的Windows或Mac机器上运行时,stable diffusion是免费的。在线服务可能会收取适度的费用,因为有人需要为你提供运行所需的硬件。


尝试stable diffusion在线演示 理解stable diffusion的最佳方式是亲自尝试。


点击链接尝试在线跑一下图片:Stable Diffusion 2-1 - a Hugging Face Space by stabilityai

在上面的stable diffusion图像生成器中尝试一下。以下是四个简单的步骤。


  • 闭上眼睛 

  • 想象你想要制作的图像

  • 尽可能详细地用文字描述图像(为了获得最佳结果,请确保描述主题和背景,并使用大量形容词)

  • 将其写在下面的提示输入框中


你可以保持负面提示不变。


这是一些简单示例的提示列表,你可以尝试。


  • 一只可爱的西伯利亚猫在海滩上奔跑


  • van Gogh风格的机器人


  • 战斗的法国斗牛犬,数字艺术,吸引人,美丽,精细的细节,详细的面部,超精细的闭眼,神秘侠盗眼罩,ArtStation,环境光


切换模型以查看效果。你将在本指南的最后一部分了解有关模型的内容。


stable diffusionv1.5:官方基础模型。在各种风格中具有通用性。逼真视觉v2.0:擅长生成照片风格逼真的图像。任意风格v3.0:动漫风格。


你可能已经注意到图像可能会符合你的期望或差得太多。别担心,有很多方法可以改进图像。请继续阅读。

stable diffusion能做什么?


  1. 从文本生成图像 stable diffusion最基本的用法是将文本转化为图像(txt2img)。以下是使用stable diffusion可以生成的一些图像示例。


动漫风格


超写实风格





奇幻



  1. 从另一张图像生成图像


  2. 图像到图像(img2img)使用stable diffusion将一张图像转化为另一张图像。这个功能虽说现在还不够完善,但是训练好了对以后我们做电商 产品图片作用极大。



以下是将苹果图像转化为逼真照片的示例。


图像到图像根据输入图像和提示生成图像。


  1. 图像编辑 你可以使用修补技术(inpainting)来修复人工智能或真实图像的一部分。这与Photoshop的新生成填充功能类似,但是免费使用。



  2. 制作视频 使用stable diffusion制作视频有两种主要方法:(1)从文本提示制作和(2)从另一个视频制作。



从文本提示制作视频是一种流行的方式。你可能在社交媒体上见过其中之一。它看起来像这样。


第二种方法是使用stable diffusion对视频进行风格化处理。请参阅视频到视频的教程。



上面是原图像

生成后的图像

最好先掌握文本到图像和图像到图像,然后再深入研究。


如何使用stable diffusion?

在线生成器 对于绝对初学者,我建议使用上面提供的免费在线生成器或其他在线服务,搜索Stable Diffusion 2-1 - a Hugging Face Space by stabilityai(不能加链接,所以有兴趣的朋友自行搜索先玩一下)。你可以开始生成图像,无需进行繁琐的设置。


高级图形用户界面(GUI) 免费在线生成器的缺点是功能相当有限。


如果你已经用熟了在线生成器,可以使用更高级的图形用户界面(GUI)。你可以使用各种工具。以下是其中一些例子:


  • 高级提示技巧。

  • 使用修补技术修复图像的一小部分。

  • 根据输入图像生成图像(图像到图像)。

  • 通过给出指令来编辑图像。

AUTOMATIC1111 是一个流行的选择。可以参阅设置Google Colab云服务器的快速入门指南(下次文章讲一下怎样在谷歌云上使用stable diffusion)。如果你有适合的电脑,也可以在个人电脑上运行。请参阅Windows和Mac的安装指南(对电脑配置比较高,在本地安装也挺复杂的,不太建议安装在本地)。

如何构建一个好的提示(Prompt)?

要构建一个好的提示,有很多要学习的内容。但基本的方法是尽可能详细地描述你的主题。确保包含强有力的关键词来定义风格。

使用提示生成器是学习逐步过程和重要关键词的好方法。对于初学者来说,学习一组强有力的关键词及其预期效果是至关重要的。这就像学习新语言的词汇一样。你还可以在这里找到一个关键词和笔记的简短列表。

生成高质量图像的一个捷径是重复使用现有的提示。去提示集合中,选择一张你喜欢的图像,然后输入提示!缺点是你可能不明白为什么它会生成高质量的图像。阅读提示的说明,并修改提示来观察效果。

另外,可以使用像Playground AI这样的图像收集网站。选择一张你喜欢的图像,并重新构思提示。但是对于获得高质量提示来说,这可能就像大海捞针一样困难。

将提示视为一个起点,根据自己的需要进行修改。

构建好提示的经验法则 有两个原则:(1)详细和具体,(2)使用强有力的关键词。

详细和具体 

尽管人工智能取得了飞跃的进展,但stable diffusion仍然不能读懂你的思维。你需要尽可能详细地描述你的图像。


比如说,你想生成一张街景中的女性图片。一个简单的提示


a woman on street


会给你生成这样的图片:


嗯,也许你不想生成一位奶奶,但从技术上讲,这与你的提示相符。你不能怪stable diffusion...


所以,相反地,你应该写得更详细。


a young lady, brown eyes, highlights in hair, smile, wearing stylish business casual attire, sitting outside, quiet city street, rim lighting


看到了明显的差异。所以要努力提高你的提示构建技巧!


使用强有力的关键词 有些关键词比其他关键词更有影响力。例如:

  • 名人的名字(例如 Emma Watson) 

  • 艺术家的名字(例如 van Gogh) 

  • 艺术媒介(例如插图、绘画、摄影) 

谨慎使用它们可以引导图像朝着你想要的方向发展。


你可以在构建提示的基础知识中了解更多关于提示构建和示例关键词的内容。


想更简单些吗?就像做作业一样,你可以使用ChatGPT来生成提示!


那些参数是什么,我应该改变它们吗?大多数在线生成器允许你改变一组有限的参数。以下是一些重要的参数:


  • 图像大小:输出图像的尺寸。标准尺寸为512×512像素。将其改为纵向或横向尺寸可能会对图像产生重大影响。例如,使用纵向尺寸来生成全身图像。

  • 采样步骤:至少使用20个步骤。如果看到模糊的图像,可以增加步骤。

  • CFG比例:典型值为7。如果你希望图像更符合提示,请增加该值。

  • 种子值:-1会生成一个随机图像。如果你希望生成相同的图像,可以指定一个值。参考其他设置的建议。


stable diffusion相对midjourney可控性更佳,功能更强大,但是相对来说操作门槛也更高。不少绅士们都只把它用来生成美女图片,但是我想说用它来挣钱才是它最大的价值点。

免责声明
本文链接:
本文经作者许可发布在AMZ123跨境头条,如有疑问,请联系客服。
最新热门报告作者标签
Lazada菲律宾电子产品GMV增长11倍,消费者购物更理性
AMZ123获悉,近日,Lazada菲律宾公布的双十二大促数据显示,菲律宾消费者的网购行为正在发生明显变化,相比冲动型下单,消费者更重视商品质量、正品保障和长期使用价值。这一变化表明,电商平台在节日购物季中的角色,正从“低价促销渠道”转向承载高价值、强信任型消费的重要场景。从具体数据来看,电子产品成为本次12.12期间表现最突出的品类,成交总额(GMV)较日常水平增长11倍。美妆和家居品类在LazMall(官方认证品牌专区)同样实现显著增长。Lazada指出,越来越多菲律宾家庭通过电商平台购买电子产品,包括智能设备、娱乐系统及日用家电,选购决策更强调耐用性与可靠性。
摩尔多瓦拟对跨境包裹征税,欧洲监管持续收紧
AMZ123获悉,近日,欧洲摩尔多瓦政府正推进针对跨境电商包裹的新一轮监管与征税措施,重点对象包括Temu、Shein、AliExpress等电商平台。据了解,摩尔多瓦政府正在与财政部制定新的法律和税收框架,以应对近年来跨境包裹数量激增以及由此带来的安全与公平竞争问题。摩尔多瓦政府表示,当前跨境小额包裹几乎处于“零监管、零税收”的状态,已难以持续。随着跨境电商迅速扩张,政府必须对该领域进行规范调整,不仅涉及经济层面的税收问题,也包括包裹内容的安全监管。政府指出,摩尔多瓦现行制度下,大量低价值商品进入国内市场,却缺乏明确的法律基础和有效审查机制,这在长期内对摩尔多瓦国家经济秩序和消费者安全构成风险。
快时尚冲击本土产业,拉美多国计划调整关税政策
AMZ123获悉,近日,随着中国超快时尚平台在拉美市场的迅速扩张,阿根廷、墨西哥、巴西、智利等多国立法机构和政府部门正计划或已推出针对中国超快时尚平台的进口限制和税收措施,试图保护本土纺织与服装产业。在全球范围内,Shein在2022年底至2023年底期间上线的新产品数量达到150万款,而Zara约为4万款、H&M约为2.3万款。市场研究机构Sensor Tower的数据显示,2025年上半年,Temu在拉丁美洲的月活跃用户同比增长143%,达到1.05亿。低价、快速上新和跨境直邮模式,使这些平台在拉美市场迅速占据份额。在阿根廷,Shein的受欢迎程度在近两年迅速攀升,尤其是在政府大幅放松进口管制之后。
扎心了,超7成跨境人今年无年终奖
年终奖取消,公司岌岌可危,跨境人:今年太难了
跨境电商的入场券,变了
2025年,跨境电商仍在增长,但增长的方式已悄然改写——它不再均匀洒向每一个卖家,而是像一场“定向灌溉”,愈发向头部与合规能力强的卖家集中。平台数据揭示出这一分化:2025年1—9月,亚马逊中国卖家上新数量同比提升近25%;销售额达到200万、500万、800万美元的卖家数量增幅均超过20%;而销售额超过1000万美元的头部卖家,增幅接近30%。这不是简单的强弱分化,而是一次行业的深层迁移:平台正在亲手改写规则,把“可控”定为第一要义。随之而来的,是三条谁都绕不开的趋势——它们共同把跨境电商,从过去的“流量快跑”,推向了如今的“系统耐力赛”。
25-cv-15218,可食用野生花卉海报版权维权进行时,跨境卖家注意TRO冻结风险!
本案是keith律所代理Botanical Arts Press LLC 针对其于2025年8月14获得美国版权认证的VA 2-458-669作品发起的版权维权案件
美国圣诞节后预计迎来退货高峰,退货率或将高出35%
AMZ123获悉,近日,Adobe最新发布的假日购物数据分析显示,2025年假日季至今,美国消费者的退货行为较去年同期有所放缓,但整体趋势仍需谨慎看待。11月1日至12月12日,线上购物退货量同比下降2.5%;而在黑五周(Cyber Week)结束后的7天内,退货量仅同比下降0.1%,降幅明显收窄。Adobe指出,当前的退货下降并不意味着假日季整体退货压力减轻。按照历史规律,圣诞节后将迎来集中退货高峰。预计12月26日至12月31日期间,退货量将较11月1日至12月12日这一阶段高出25%至35%。根据2024年假日季数据,每8笔退货中就有1笔发生在这一6天内,Adobe预计这一趋势将在今年延续。
11月波兰电商平台流量排名出炉,Allegro重返第一
AMZ123获悉,近日,Mediapane最新的l数据显示,波兰电商平台的流量排名在11月出现变化。波兰本土电商平台Allegro以1919万名用户重新夺回波兰电商访问量第一的位置,超过Temu的1910万名用户,结束了此前数月Temu持续领先的局面。对比来看,10月Temu仍明显领先,当月其用户规模达到1976万人,而Allegro为1897万人。Temu自今年3月首次超越Allegro后,连续多月位居榜首,但两者之间的用户差距始终不大。除Allegro和Temu外,11月的第三名为电子产品零售商Media Expert,用户规模为1340万人,较10月的1164万人明显增长。
抢攻新兴蓝海,一批中国卖家已爆单!
你眼中的非洲,是什么样的?偏远、贫瘠、基建差……在这些刻板印象的束缚下,过去很长一段时间里,许多卖家对于非洲的认知都停留在“待开发的潜力股”上,因此鲜少有人在攻略新城池时考虑到非洲电商市场。然而士别三日,当刮目相看。如今去到非洲国家,这样的场景已十分普遍:尼日利亚拉各斯的街头,电商配送车穿梭在车流中,装载着从中国跨境而来的电子产品与时尚服饰;在肯尼亚内罗毕的社区,年轻人正在Jumia的橙色自提点前排起长队,领取他们通过手机订购的中国商品。 这片被误解的电商新大陆,正在成为藏金纳银的财富洼地。
新入口曝光!亚马逊广告后台新增 Prompts(提示词)功能
今日分享「结合数据高效优化老品广告」
亚马逊如何结合竞价,优化广告位置表现
在亚马逊平台的标品运营中,流量结构的精准布局是决定 ASIN 成长效率与成熟期收益的核心要素之一。标品(如标准化 3C 配件、家居日用品等)具有用户决策链路短、搜索意图明确的特征,其流量资源的分配需高度聚焦于高转化曝光位。本文将系统解析适用于标品成长 / 成熟期 ASIN 的流量结构”,明确其逻辑框架、落地步骤与效果验证,为新人卖家提供可复用的运营范式。一、模式 1 的核心定义与适配场景模式 1 是针对标品成长 / 成熟期 ASIN设计的流量结构策略,其核心特征为 “三角形流量布局”—— 即通过资源倾斜,将大部分流量集中于 “搜索结果首页首位” 这一核心曝光位。
2026,亚马逊卖家生存指南
面对亚马逊的透明化转型,卖家与其焦虑抱怨,不如主动调整策略,适应新的游戏规则:一、摒弃价格投机,坚守稳定定价告别 "今日涨价、明日打折" 的短视操作,将定价锚定在市场均价附近,保持长期稳定性。促销活动需提前做好长远规划,避免频繁波动的价格曲线被 Rufus 标记为 "不诚信"。稳定的价格不仅能获得算法青睐,更能积累品牌信任,形成长期复购。二、用自然语言重构 Listing 逻辑过去写 Listing 是为了给 A9 算法埋关键词,现在则要适配 Rufus 的对话式搜索逻辑。
25年健康品牌TOP10榜单出炉,功能型健康产品爆火
AMZ123获悉,近日,AI 市场研究平台 Spate 基于 Google、TikTok 和 Instagram 的搜索与互动数据,对健康品牌的年度热度变化进行了统计,整理出 2025 年最受关注、同比增长最快的十大健康品牌。随着“长寿”“功能性健康”等议题持续升温,线上健康消费品牌的关注度在2025年显著提升。这些品牌主要集中在营养补充、功能性食品、运动营养和情绪健康等领域,反映出消费者在压力管理、肠道健康、能量补充和整体健康管理方面的需求持续扩大。数据显示,2025 年热度排名第一的品牌为 Goli,其年度“人气指数”增长达 15 亿次,同比提升 217%。
美国圣诞节后预计迎来退货高峰,退货率或将高出35%
AMZ123获悉,近日,Adobe最新发布的假日购物数据分析显示,2025年假日季至今,美国消费者的退货行为较去年同期有所放缓,但整体趋势仍需谨慎看待。11月1日至12月12日,线上购物退货量同比下降2.5%;而在黑五周(Cyber Week)结束后的7天内,退货量仅同比下降0.1%,降幅明显收窄。Adobe指出,当前的退货下降并不意味着假日季整体退货压力减轻。按照历史规律,圣诞节后将迎来集中退货高峰。预计12月26日至12月31日期间,退货量将较11月1日至12月12日这一阶段高出25%至35%。根据2024年假日季数据,每8笔退货中就有1笔发生在这一6天内,Adobe预计这一趋势将在今年延续。
德国对Temu展开反垄断调查,定价机制受关注
AMZ123获悉,近日,据外媒报道,德国联邦卡特尔局(Bundeskartellamt)已正式对Temu德国母公司Whaleco Technology Limited启动反垄断调查,重点审查其在平台运营中是否存在限制卖家定价自由的行为。该公司注册地位于爱尔兰都柏林,此次调查源于德国零售协会(HDE)于今年4月向监管机构提交的正式投诉。调查核心为Temu是否违反德国及欧盟层面的“卡特尔禁令”。相关法律明确禁止具有竞争限制效果的协议或行为,若构成违法,最高可处以企业年度营业额10%的高额罚款。德国监管机构怀疑,Temu通过其卖家合作条款,对入驻卖家的价格制定施加不当限制,从而削弱市场竞争。
亚马逊走9810退税模式的灵魂拷问!
亚马逊走9810退税模式的灵魂拷问!
《亚马逊生活日用品类攻略手册》PDF下载
作为日常生活不可或缺的重要组成,生活百货品类覆盖范围广泛,包括家居用品、家具、车用配件、户外装备、园艺 工具、运动器材、家装用品、厨房、玩具以及宠物用品等众多领域。这类产品不仅是满足基本生活所需,更体现了人们对美好生活的向往和追求。
《掘金泰国-市场洞察与战略机遇报告2025》PDF下载
随着全球经济一体化的加速,泰国作为东盟的核心枢纽,凭借其独特的地缘优势庞大的消费市场以及持续优化的营商环境,成为众多企业战略布局的重要目标。本报告深入剖析泰国市场的政策红利、消费趋势、产业机遇以及合规挑战,旨在为有志于开拓泰国市场的中国企业提供行动指南,助力企业在东盟这片充满活力的土地上把握机遇、应对挑战、!实现可持续发展。
《2025欧美假日购物季营销指南》PDF下载
2025年美国假日购物季零售额预计同比仅增长1.2%,总销售额约1.359万亿美元,虽仍保持正增长,但为2009年以来最低增速,市场正在步入低增长的新常态。
《2025年跨境电商东南亚市场进入战略白皮书》PDF下载
东南亚电商,正以惊人的速度复刻中国电商高速增长的黄金时代。2024年东南亚电商GMV达到1284亿美元,短短5年涨幅超过3倍。全球电商2024年GMV增幅最快的十大市场中,东南亚独占四席。东南亚是拥有约6.7亿人口的广阔市场,在现今全球关税的不确定性大格局下,因其电商基建完善,利好的贸易政策,和更高的年轻人口占比,成为跨境卖家生意拓张焦点之一。
《2025年TikTok Shop玩具品类行业报告(欧美站)》PDF下载
分析TikTok Shop美国市场、英国市场、西班牙市场、墨西哥市场等主流市场点短视频及直播电商数据,选取TikTok与玩具爱好品类相关的内容进行分析报告。
《2025 洗护品类趋势与创新洞察》PDF下载
本报告独特价值:将消费者的“行为结果”据),揭示消费者深层心理动机、并能精准预判未来增长机会
《亚马逊双轨增长指南》PDF下载
亚马逊以“以客户为中心”为核心理念,通过整合B2B与B2C的全渠道服务,帮助卖家实现“一店双拓”-- 一次上架,同步触达个人消费者与企业买家,获得双重收益。同时,基于Direct to Buyer(直接触达买家)的模式,更能有效减少中间环节,提升利润空间与品牌掌控力。
《亚马逊全球线上商采趋势与区域洞察》PDF下载
随着全球企业数字化转型的深入推进,B2B商采有望成为下一个万亿级别的蓝海市场然而,中国卖家在开拓海外企业商采市场时往往面临着一个关键挑战:难以准确把握海外企业买家的商采行为和决策模式。这种认知偏差不仅影响了产品开发方向,也制约了市场拓展策略的制定。
AMZ123选品观察员
选品推荐及选品技巧分享。
AMZ123卖家导航
这个人很懒,还没有自我介绍
跨境学院
跨境电商大小事,尽在跨境学院。
跨境电商赢商荟
跨境电商行业唯一一家一年365天不断更的媒体!
欧洲电商资讯
AMZ123旗下欧洲跨境电商新闻栏目,专注欧洲跨境电商热点资讯,为广大卖家提供欧洲跨境电商最新动态、最热新闻。
侃侃跨境那些事儿
不侃废话,挣钱要紧!
亚马逊公告
AMZ123旗下亚马逊公告发布平台,实时更新亚马逊最新公告,致力打造最及时和有态度的亚马逊公告栏目!
跨境电商干货集结
跨境电商干货集结,是结合亚马逊跨境电商卖家交流群内大家在交流过程中最常遇到的问题,进行收集整理,汇总解答,将会持续更新大家当前最常遇见的问题。欢迎大家加入跨境电商干货集结卖家交流群一起探讨。
首页
跨境头条
文章详情
现在的运营不懂点AI工具都不好意思说自己在做亚马逊,stable diffusion的第一课你不来看看吗?
疯狂的站外推广
2023-06-09 18:59
1786


想学习 stable diffusion 吗?这份初学者指南适用于零经验的新手,无论是对 stable diffusion 还是其他 AI 图像生成器一无所知。

你将获得 stable diffusion 的概述和一些基本的有用提示。

在本页面上尝试使用 stable diffusion AI。这是学习的最佳方式!

什么是 stable diffusion?

stable diffusion AI 是一种生成 AI 图像的潜在扩散模型。生成的图像可以像相机拍摄的照片一样逼真,也可以具有专业艺术家制作的艺术风格。

最好的部分是它是免费的-你可以在你的个人电脑上运行它。

如何使用 stable diffusion?

你需要给它一个描述图像的提示。例如:

姜饼屋,二三维模型,聚焦,白色背景,吐司,脆脆麦片

stable diffusion 会将这个提示转化为以下图像。你可以根据同一个提示生成任意多个变体。

stable diffusion 的优势是什么?

有类似的文本到图像生成服务,比如 DALLE 和 MidJourney。为什么选择 stable diffusion?stable diffusion 的优势包括:

开源:许多爱好者创建了免费的工具和模型。设计用于低功耗计算机:运行它是免费或廉价的。

stable diffusion 是免费的吗?

在你自己的Windows或Mac机器上运行时,stable diffusion是免费的。在线服务可能会收取适度的费用,因为有人需要为你提供运行所需的硬件。


尝试stable diffusion在线演示 理解stable diffusion的最佳方式是亲自尝试。


点击链接尝试在线跑一下图片:Stable Diffusion 2-1 - a Hugging Face Space by stabilityai

在上面的stable diffusion图像生成器中尝试一下。以下是四个简单的步骤。


  • 闭上眼睛 

  • 想象你想要制作的图像

  • 尽可能详细地用文字描述图像(为了获得最佳结果,请确保描述主题和背景,并使用大量形容词)

  • 将其写在下面的提示输入框中


你可以保持负面提示不变。


这是一些简单示例的提示列表,你可以尝试。


  • 一只可爱的西伯利亚猫在海滩上奔跑


  • van Gogh风格的机器人


  • 战斗的法国斗牛犬,数字艺术,吸引人,美丽,精细的细节,详细的面部,超精细的闭眼,神秘侠盗眼罩,ArtStation,环境光


切换模型以查看效果。你将在本指南的最后一部分了解有关模型的内容。


stable diffusionv1.5:官方基础模型。在各种风格中具有通用性。逼真视觉v2.0:擅长生成照片风格逼真的图像。任意风格v3.0:动漫风格。


你可能已经注意到图像可能会符合你的期望或差得太多。别担心,有很多方法可以改进图像。请继续阅读。

stable diffusion能做什么?


  1. 从文本生成图像 stable diffusion最基本的用法是将文本转化为图像(txt2img)。以下是使用stable diffusion可以生成的一些图像示例。


动漫风格


超写实风格





奇幻



  1. 从另一张图像生成图像


  2. 图像到图像(img2img)使用stable diffusion将一张图像转化为另一张图像。这个功能虽说现在还不够完善,但是训练好了对以后我们做电商 产品图片作用极大。



以下是将苹果图像转化为逼真照片的示例。


图像到图像根据输入图像和提示生成图像。


  1. 图像编辑 你可以使用修补技术(inpainting)来修复人工智能或真实图像的一部分。这与Photoshop的新生成填充功能类似,但是免费使用。



  2. 制作视频 使用stable diffusion制作视频有两种主要方法:(1)从文本提示制作和(2)从另一个视频制作。



从文本提示制作视频是一种流行的方式。你可能在社交媒体上见过其中之一。它看起来像这样。


第二种方法是使用stable diffusion对视频进行风格化处理。请参阅视频到视频的教程。



上面是原图像

生成后的图像

最好先掌握文本到图像和图像到图像,然后再深入研究。


如何使用stable diffusion?

在线生成器 对于绝对初学者,我建议使用上面提供的免费在线生成器或其他在线服务,搜索Stable Diffusion 2-1 - a Hugging Face Space by stabilityai(不能加链接,所以有兴趣的朋友自行搜索先玩一下)。你可以开始生成图像,无需进行繁琐的设置。


高级图形用户界面(GUI) 免费在线生成器的缺点是功能相当有限。


如果你已经用熟了在线生成器,可以使用更高级的图形用户界面(GUI)。你可以使用各种工具。以下是其中一些例子:


  • 高级提示技巧。

  • 使用修补技术修复图像的一小部分。

  • 根据输入图像生成图像(图像到图像)。

  • 通过给出指令来编辑图像。

AUTOMATIC1111 是一个流行的选择。可以参阅设置Google Colab云服务器的快速入门指南(下次文章讲一下怎样在谷歌云上使用stable diffusion)。如果你有适合的电脑,也可以在个人电脑上运行。请参阅Windows和Mac的安装指南(对电脑配置比较高,在本地安装也挺复杂的,不太建议安装在本地)。

如何构建一个好的提示(Prompt)?

要构建一个好的提示,有很多要学习的内容。但基本的方法是尽可能详细地描述你的主题。确保包含强有力的关键词来定义风格。

使用提示生成器是学习逐步过程和重要关键词的好方法。对于初学者来说,学习一组强有力的关键词及其预期效果是至关重要的。这就像学习新语言的词汇一样。你还可以在这里找到一个关键词和笔记的简短列表。

生成高质量图像的一个捷径是重复使用现有的提示。去提示集合中,选择一张你喜欢的图像,然后输入提示!缺点是你可能不明白为什么它会生成高质量的图像。阅读提示的说明,并修改提示来观察效果。

另外,可以使用像Playground AI这样的图像收集网站。选择一张你喜欢的图像,并重新构思提示。但是对于获得高质量提示来说,这可能就像大海捞针一样困难。

将提示视为一个起点,根据自己的需要进行修改。

构建好提示的经验法则 有两个原则:(1)详细和具体,(2)使用强有力的关键词。

详细和具体 

尽管人工智能取得了飞跃的进展,但stable diffusion仍然不能读懂你的思维。你需要尽可能详细地描述你的图像。


比如说,你想生成一张街景中的女性图片。一个简单的提示


a woman on street


会给你生成这样的图片:


嗯,也许你不想生成一位奶奶,但从技术上讲,这与你的提示相符。你不能怪stable diffusion...


所以,相反地,你应该写得更详细。


a young lady, brown eyes, highlights in hair, smile, wearing stylish business casual attire, sitting outside, quiet city street, rim lighting


看到了明显的差异。所以要努力提高你的提示构建技巧!


使用强有力的关键词 有些关键词比其他关键词更有影响力。例如:

  • 名人的名字(例如 Emma Watson) 

  • 艺术家的名字(例如 van Gogh) 

  • 艺术媒介(例如插图、绘画、摄影) 

谨慎使用它们可以引导图像朝着你想要的方向发展。


你可以在构建提示的基础知识中了解更多关于提示构建和示例关键词的内容。


想更简单些吗?就像做作业一样,你可以使用ChatGPT来生成提示!


那些参数是什么,我应该改变它们吗?大多数在线生成器允许你改变一组有限的参数。以下是一些重要的参数:


  • 图像大小:输出图像的尺寸。标准尺寸为512×512像素。将其改为纵向或横向尺寸可能会对图像产生重大影响。例如,使用纵向尺寸来生成全身图像。

  • 采样步骤:至少使用20个步骤。如果看到模糊的图像,可以增加步骤。

  • CFG比例:典型值为7。如果你希望图像更符合提示,请增加该值。

  • 种子值:-1会生成一个随机图像。如果你希望生成相同的图像,可以指定一个值。参考其他设置的建议。


stable diffusion相对midjourney可控性更佳,功能更强大,但是相对来说操作门槛也更高。不少绅士们都只把它用来生成美女图片,但是我想说用它来挣钱才是它最大的价值点。

咨询
官方微信群
官方客服

扫码添加,立即咨询

加群
官方微信群
官方微信群

扫码添加,拉你进群

更多
订阅号服务号跨境资讯
二维码

为你推送和解读最前沿、最有料的跨境电商资讯

二维码

90% 亚马逊卖家都在关注的微信公众号

二维码

精选今日跨境电商头条资讯

回顶部