Computertechnik AI-Bildgeneratoren fürs Rollenspiel

Mit der kostenlosen Webversion von stable diffusion krieg ich jedenfalls nicht so gute Bilder hin. Ist das mit der Version anders?
Bisher geht für mich eigtl nix über Midjourney. Aber meine Coins sind alle. Ich müsste jetzt subscriben
 
Ich hab nur die V2 probiert und die hat kaum Einstellungen, zu der verlinkten Version hab ich mir Video angeguckt und fand das sehr beeindruckend.

Man kann viel zielgerichteter Dirigieren als bei Midjourney. Ich hab aber keine Ahnung wieviel "offline"das wirklich ist, wenn nan z. B. eigene Bilder bearbeiten will (sollte mal testweise den Stecker ziehen).

Bsp Video
 
Da Nightcafe.studio jetzt in der Basisversion komplett kostenlos ist, hab ich die letzten Tage ziemlich damit herumgespielt. Ich nenn das Ergebnis mit etwas Wohlwollen einfach mal "Concept Art". 😁

(Hinweis: Das Hintergrundbild entstammt dem "Worlds Without Number Art Pack".)
 
@Doc-Byte darf ich fragen (bzw. ne Antwort bekommen) wie viel Aufwand du da reinsteckst?

Ich habe schon gesehen, dass die meisten Modelle sehr gut mit generischen Fantasyfiguren (insofern man keine Ganzkörperdarstellung braucht) klar kommen.
Aber ich z.b. mache Bilder für Monster aus Tieren und die Ergebnisse sind meist ne Katastrophe.
 
Also in manchen Fällen scheint es credits zu kosten, in anderen dann wieder nicht ???

Jepp. Bei Nightcafe.studio kann man mit Stabel Diffusion jetzt 1 Bild mit kurzer Laufzeit kostenlos generieren. Will man mehr(ere) Bilder gleichzeitig, mit längerer Laufzeit (mEn völlig unnötig) oder ggf. mit mehr als einem Startbild erzeugen, kostet das weiterhin Credits. Mit etwas Geduld kann man also recht viele kostenlose Bilder erzeugen. Es werden halt immer wieder mal ein paar Minuten Zwangspause verhangen, wenn man zu schnell oder zu oft hintereinander Bilder generiert, aber die sind eigentlich nie länger als vielleicht fünf Minuten.

@Doc-Byte darf ich fragen (bzw. ne Antwort bekommen) wie viel Aufwand du da reinsteckst?

Das kann ich pauschal gar nicht sagen. Seitdem die Basisfunktion kostenlos ist, unternehm ich natürlich deutlich mehr Anläufe pro Motiv. Für einfache Motive vielleicht im Schnitt irgendwas zwischen 20 und 50? Inklusive der Bilder, wo ich mit Stable Inpainting nur Details verändern will. Manche Bilder sind aber auch Glücks- oder Zufallstreffer, die deutlich weniger Anläufe gebraucht haben. Und für mindestens ein Motiv hab ich sicherlich weit über 100 Anläufe gebraucht, bis ich mit einem Motiv halbwegs zufrieden war. Aber das war echt ein Sonderfall.

Zeitlich kann ich das auch schwer sagen, weil ich das auch gerne mal so nebenher mache. Wenn die Beschreibung einmal eingegeben ist, muss ich ja oft nur noch immer wieder auf "generieren" klicken. Und ich werde langsam auch besser darin, meine Vorstellungen so zu formulieren, dass die KI damit was anfangen kann bzw. "versteht", was ich will.

Aber generell gesprochen, hab ich - seit der kostenlosen Basisfunktion - fast jeden Abend wenigstens ein paar Bilder generiert. Ich muss dazu aber auch sagen, dass ich in den letzten Tagen ganz konkret das Artwork von meinem DIY RPG überarbeitet habe. Nachdem ich damit jetzt im Prinzip fertig bin, werde ich sicherlich auch die Aktivität bei Nightcafe deutlich zurückfahren. Nur meine täglichen freien Credits werde ich mir weiterhin abholen bzw. durch Voten verdienen und bei dem einen oder anderen täglichen Contest mache ich sicherlich auch spaßeshalber mal mit.

Ich habe schon gesehen, dass die meisten Modelle sehr gut mit generischen Fantasyfiguren (insofern man keine Ganzkörperdarstellung braucht) klar kommen.
Aber ich z.b. mache Bilder für Monster aus Tieren und die Ergebnisse sind meist ne Katastrophe.

Hast du da mal ein Beispiel für? Täte mich rein aus Neugier interessieren. :)
 
doc-byte schrieb: "Es werden halt immer wieder mal ein paar Minuten Zwangspause verhangen, wenn man zu schnell oder zu oft hintereinander Bilder generiert, aber die sind eigentlich nie länger als vielleicht fünf Minuten."
danke, das erklärt einiges!!

Meinst du mit Anläufen denn einen Neustart oder das "evolven" eines Bildes?

hier wäre ein Beispiel mit einigen Varianten (stable diff. 2.1)
man sieht, dass es Fotos von Raben genommen hat, kann im Flug aber wohl die Form nicht korrekt interpretieren.

die red glowing eyes habe ich mehrfach ausprobiert, dass versteht SD überhaupt nicht.

@Skar: gerne, ich nehme mal ein konkretes, was ich in meinem Setting nutze. (ich hab vor buchstäblich 15min die Links aus Midjourney gelöscht und weiß auch nicht, wie man im OpenAI channel was wiederfindet, deswegen kann ich dir den Prompt und die Ergebnisse nicht mehr zeigen.
ich versch's mal aus dem Gedächtnis
prompt: a furious baboon-like monster with pitch-black ruffled hair and red glowing eyes; jumping-out from the undergrowth in pouring rain; jaded green and teal colours; vector-style

also im Endeffekt ein Pavianmonster. Der Vektor-Stil ist wichtig (und Midjourney und SD verstehen das auch), da ich selbst Bilder mit Inkscape mache.

Ich habe auch die open Source WebUI von Stable Diffusion auf der Platte, aber damit brauchbare Ergebnisse in bestimmten Bereichen zu bekommen, erscheint noch schwieriger (außerdem braucht mein PC ca. 15 Min. für 4 Bilder, da RADEON Karten nicht unterstützt werden :p).
 
Zuletzt bearbeitet:
hier ist eins der Bilder nachbearbeitet mit Maske. Es WIRD besser, aber noch nicht zufriedenstellend. Man sieht auch welche Probleme es mit dem leuchtenden Auge zu haben scheint. Vielleicht bin ich ja auch nur zu ungeduldig und man muss wirklich 100 mal dran rumwerken, deswegen frage ich:
 
Meinst du mit Anläufen denn einen Neustart oder das "evolven" eines Bildes?

Sowohl als auch. Ich starte teilweise stumpf mehrere Bilder mit unverändertem Promt (springe aber zwischen den Sampling Methoden hin und her) oder ändere den Promt leicht ab. Wenn mir ein Bild nur in Details nicht gefällt, versuche ich es dann mit Inpainting zu optimieren. Ich hab aber festgestellt, dass das nur eine begrenzte Zahl von Versuchen funktioniert, weil mit jedem Mal der Teil, der eigentlich nicht geändert werden soll, immer "matschiger" wird.

hier wäre ein Beispiel mit einigen Varianten (stable diff. 2.1)
man sieht, dass es Fotos von Raben genommen hat, kann im Flug aber wohl die Form nicht korrekt interpretieren.

die red glowing eyes habe ich mehrfach ausprobiert, dass versteht SD überhaupt nicht.

Ehrlich gesagt bin selbst ich als Mensch nicht ganz sicher, was ich mir unter "a demonic murder of crows" vorstellen soll. 🤔

Ich hab den Promt mal leicht verändert: a swarm of demonic crows with red glowing eyes over a bleak autumn forest with an isolated crow in the middle; cold colors; dark fantasy; ev... - AI Generated Artwork
 
@Skar: gerne, ich nehme mal ein konkretes, was ich in meinem Setting nutze. (ich hab vor buchstäblich 15min die Links aus Midjourney gelöscht und weiß auch nicht, wie man im OpenAI channel was wiederfindet, deswegen kann ich dir den Prompt und die Ergebnisse nicht mehr zeigen.
Wiederfinden kannst du die hier: https://www.midjourney.com/showcase/recent/
Erst werden alle angezeigt. Dann unten links anmelden, dann kannst du deine Bilder sehen. Und zu eigentlich jedem Bild (auch aus denen der Community) kannst du dir über die 3 Punkte den Prompt, den Seed oder den ganzen Command ziehen.
 
prompt: a furious baboon-like monster with pitch-black ruffled hair and red glowing eyes; jumping-out from the undergrowth in pouring rain; jaded green and teal colours; vector-style
Okay, der Prompt liefert ja schon Vorzeigbares. Aber wo willst du konkreter hin?

Ganz abgesehen davon, hätte ich den Prompt eher in dieser Richtung geschrieben: baboon monster, angry face expression, black fur, red eyes, jump attack, claws, full body action pose, rainforest in background, green color scheme, highly detailed vector-style

(Wobei ich die Ergebnisse da auch nicht unbedingt besser finde. :) )
 
recent bring mir leider nix, ist schon einen Monat her. Und wenn ich mich bei Midjourney selbst suche, dann findet es nur die beiden ERSTEN Posts vom letzten Jahr (lol).

A murder of crows ist ein bestehender Begriff, den versteht MJ und SD auch. Hab dasselbe aber auch mit "swarm" probiert. Interessanterweise hast du aber nun eines mit den entsprechenden Augen. Sieht ganz OK aus.

Kannst du mir den ganzen prompt nennen, sehe nur einen Teil?

@Skar
anbei meine Ergebnisse von "damals". Das erste Bild nehme ich evtl. für mein Settingbuch. Das war aber scheinbar ein Glücksfall, konnte das dann nie wieder gleich gut hinkriegen bei MJ (hab's aber auch nicht Wochenlang versucht). Man sieht auch welche Probleme es mit Händen und Füßen hat, ist bei Menschen auch so.
Hoffe die kriegen das in den Griff.

Also ihr würdet bei Prompts eher mehr Kommas und stichwörter und weniger Sätze benutzen..
 

Anhänge

  • FalkdR_a_furious_baboon_like_monster_with_pitch-black_fuzzy_hai_fdbca008-ed4c-4929-aec2-95f43a...png
    FalkdR_a_furious_baboon_like_monster_with_pitch-black_fuzzy_hai_fdbca008-ed4c-4929-aec2-95f43a...png
    1,4 MB · Aufrufe: 4
Also ihr würdet bei Prompts eher mehr Kommas und stichwörter und weniger Sätze benutzen..
Kommas bringen nichts. Ich strukturiere dafür nur für mich. Und ich nutze kurze Beschreibungselemente. Ich finde dann wird es etwas präziser.

Du kööntest auch Liedtexte als Prompt nehmen. Aber das wird dann schon recht blumig interpretiert und nicht so fokussiert, finde ich.

Womit du arbeiten kannst sind Multiprompts. Ein Beispiel:
baboon monster::1 jump attack::1
Das sind dann 2 (oder mehr) Prompts in einem Bild, die in einer Gewichtung untergebracht werden (hier beides 1).
 

Anhänge

  • Skar72_a_furious_baboon-like_monster_with_pitch-black_ruffled_h_8bf9c659-e334-4f14-b59b-30c948...png
    Skar72_a_furious_baboon-like_monster_with_pitch-black_ruffled_h_8bf9c659-e334-4f14-b59b-30c948...png
    1,1 MB · Aufrufe: 1
  • Skar72_a_furious_baboon-like_monster_with_pitch-black_ruffled_h_238ecaac-8dc1-4642-bb01-57bb8b...png
    Skar72_a_furious_baboon-like_monster_with_pitch-black_ruffled_h_238ecaac-8dc1-4642-bb01-57bb8b...png
    1,3 MB · Aufrufe: 1
  • Skar72_a_furious_baboon-like_monster_with_pitch-black_ruffled_h_ac052ca8-d953-45c1-81d1-88c91d...png
    Skar72_a_furious_baboon-like_monster_with_pitch-black_ruffled_h_ac052ca8-d953-45c1-81d1-88c91d...png
    1,2 MB · Aufrufe: 1
  • Skar72_a_furious_baboon-like_monster_with_pitch-black_ruffled_h_d933f78b-24aa-428a-9f8c-73f142...png
    Skar72_a_furious_baboon-like_monster_with_pitch-black_ruffled_h_d933f78b-24aa-428a-9f8c-73f142...png
    1,4 MB · Aufrufe: 1
  • Skar72_baboon_monster_angry_face_expression_black_fur_red_eyes__9ab99269-3fc1-4c84-ae02-4c63eb...png
    Skar72_baboon_monster_angry_face_expression_black_fur_red_eyes__9ab99269-3fc1-4c84-ae02-4c63eb...png
    1 MB · Aufrufe: 2
  • Skar72_baboon_monster_angry_face_expression_black_fur_red_eyes__04727573-795f-4ac0-9c45-77346c...png
    Skar72_baboon_monster_angry_face_expression_black_fur_red_eyes__04727573-795f-4ac0-9c45-77346c...png
    1.022,4 KB · Aufrufe: 2
  • Skar72_baboon_monster_angry_face_expression_black_fur_red_eyes__b354d9d0-e43f-42c2-b3bc-27615e...png
    Skar72_baboon_monster_angry_face_expression_black_fur_red_eyes__b354d9d0-e43f-42c2-b3bc-27615e...png
    1,3 MB · Aufrufe: 1
Kannst du mir den ganzen prompt nennen, sehe nur einen Teil?

"a swarm of demonic crows with red glowing eyes over a bleak autumn forest with an isolated crow in the middle; cold colors; dark fantasy; evening; detailled vector-style"

Ich verwende übrigens normalerweise wenige bis keine Kommas in der Beschreibung, weil ich festgestellt habe, dass Nightcafe die als Wörter zählt und damit weniger echte Wörter für die Bildbeschreibung zur Verfügung stehen.

Ganz abgesehen davon, hätte ich den Prompt eher in dieser Richtung geschrieben: baboon monster, angry face expression, black fur, red eyes, jump attack, claws, full body action pose, rainforest in background, green color scheme, highly detailed vector-style

Den hab ich mal 1:1 in Nightcafe geworfen:


Und dann aus Spaß mal mit ein paar Parametern, wie ich sie für meine Star Reeves Bilder verwenden würde:


"a humanoid baboon monster with angry face expression black fur and red eyes jump attack claws full body action pose rainforest in background green color scheme futuristic clothes sience fiction fantasy concept art movie poster hyperrealism matte painting digital art digital illustration 8K resolution bokeh HDR anime comic art"

Würde ich als einen der berühmten 1st Try Zufallstreffer betrachten, wobei der übernommene Teil der Beschreibung sicher auch zum Ergebnis beigetragen hat, denn so exakt habe ich meine Promts eignetlich nie formuliert. :unsure:

Hier noch mehr Ergebnisse:


Ähm... sorry, bin irgendwie in den Flow geraten. :oops: Aber das hier finde ich ziemlich cool, wenn auch absolut nicht das, was du suchst.

 
Der Affe mit dem Clip Gürtel ist geil :X3:.gut zu wissen, dass nicht nur ich Quatsch bekomme.


finde aber witzig, wie ihr aus starkem Regen sofort Rainforest gemacht habt:LOL:.

Diese lustigen comic Bilder hab ich auch oft bekommen.
Mit Angry bekommt man auch was anderes als Furious, weil das im englischen ne ganz andere Bedeutung hat. Angry ist oft auch einfach grimmig.
 
Ich find den Stil der Vector-Grafiken überhaupt nicht schön. Und da hier ja auch andere mitlesen, mal ein paar Bilder, was ich sonst so in dieser Woche mit Midjourney gemacht habe. :) Da geht nämlich deutlich mehr als das da oben. ;)

Bilder ausgelagert nach hier: Computertechnik - [AI] ungefiltert: Charakterbilder
 
Zuletzt bearbeitet:
Zurück
Oben Unten