top of page
Obrázek autoraAnna Poborska

Kouzla Aladinovy lampy: AI v životě fotografa a jak ji ochočit



Programy, založené na umělé inteligenci, které momentálně mění způsob naší interakce se světem, již nevratně vstoupily do našich životů. Můžete v nich tvořit texty, hudbu, fotografie, a dokonce i videa. Jelikož se náš časopis věnuje fotografii, zaměříme se zde právě na vizuální oblast. Mezi hlavní hráče na trhu umělé inteligence patří Midjourney, Dall-E a nový program od Adobe. Jsou jich již stovky, trh je velmi pružný a dynamický, a proto není ani tak důležitá samotná značka programu, ale jeho mechanismus. A tyto mechanismy, i když mají určité rozdíly, jsou si přesto podobné...


Text a vygenerované obrázky: Oleg Yakovlev | Přeložila: Galina Gordeeva


OLEG JAKOVLEV je 38letý rusko-izraelský umělec. Má vzdělání v psychologii, urbanistice, výtvarném umění a designu. Hlavními tématy jeho zájmu jsou identita, autenticita, jazyk a realita.


Hlavním způsobem komunikace s umělou inteligencí je text (prompt). Ve světě fotografie to může zpočátku trochu mást, ale když se nad tím zamyslíme hlouběji, zjistíme, že pokaždé když fotíme, jsme nuceni odpovědět si na otázku: CO fotografuji? A v tomto okamžiku prázdný řádek promptu představuje jednoduchou pravdu – co tedy chceš?

AI dokáže všechno, bez jasného požadavku nic. Tento jednoduchý moment může být jak inspirující, tak i frustrující. Fotografové dvacátého století byli zvyklí schovávat se za techniku: „podívejte se na zrno tohoto filmu“, „tento fotograf čísluje všechny své otisky“, „tento fotí jen na prošlý film“... Silný zásah přinesla digitální fotografie, a mimo- chodem, tehdy také mnozí říkali, že to není skutečná fotografie, že snímač není totéž, co film, že úprava v editoru je fejk a podobně. Oheň na střeše vyvolal i samotný zrod fotografie: tehdy byli poníženi a uraženi malíři, kteří právě dosáhli fotografické přesnosti zobrazení reality. Zato po vynálezu fotografie se malířství konečně osvobodilo a prakticky už nemělo potřebu se zabývat dokumentární fixací reality.



Svoboda a zodpovědnost (ani jedna nemá meze) je to, co nám nabízí umělá inteligence. Nyní je možné vymyslet jakýkoli obraz a zrealizovat jej během pár vteřin – bez tun vybavení, asistentů, modelů, smluv. Realita už není potřeba. Tento fakt je stejně inspirující jako znepokojující. Vysvětlím to na příkladu z vlastní praxe.



Mnoho let fotím mužské akty. Z kulturních a jiných důvodů je vždy a všude těžké najít vhodné modely. Ještě složitější je získat svolení k publikaci. A najednou mám před sebou prázdný řádek promptu: během několika minut mohu vizualizovat to, co jsem léta toužil nafotit. Jakási inflace vizuality, ve které je nyní možné vše... no, vlastně ne, protože umělou inteligenci stvořili lidé a lidé mají rádi hranice.



Kulturní fenomén

Jsme zvyklí věřit fotografii. A této důvěry se všichni budeme muset vzdát, a čím dříve, tím lépe. Je zajímavé, že fotografie vždy byla jakousi černou skříňkou: ačkoliv se mechanický proces zachycení světla může zdát naivní a nevinný, je náchylný k subjektivitě.

Obyvatelé Evropy od třicátých let minulého století dobře vědí, čeho je cenzura diktatury schopná a jak elegantně lze odstranit nepohodlné osoby z fotografií – jako by nikdy neexistovaly.



Možná právě tento moment, fenomén fotografie jako kolektivní paměti, musíme prožít: už nikdy to nebude takové jako dřív. Můžete požádat umělou inteligenci, aby vytvořila fotografii křídových jeskyní, prérií, mrakodrapů, šťastné rodiny, vojáka z první světové války, koťátka, Fordovy továrny, a nikdy nebudete moci s jistotou říci, že tento kousek reality na planetě neexistuje nebo neexistoval – natolik realistický bude výsledek. Hranice mezi reálným a metareálným se zde začíná znatelně chvět a téměř rozplývat: možná se stejnou posvátnou hrůzou a úžasem naši předkové před téměř dvěma stoletími pozorovali zjevování obrázku na světlocitlivém materiálu...



Psychologický aspekt

Po ponoření se do světa AI jsem svůj foťák odložil, přestože jsem předtím fotil bez přestávky více než 20 let. Ležel, zaprášený a nepotřebný, v rohu a používal jsem ho pouze jako činku při cvičení.

Umělá inteligence vtahuje: kolik nocí jsem věnoval upřesňujícím dialogům, nudným detailům: chci tohle, takto, tady. Třel jsem tuto kouzelnou Aladinovu lampu až do mozolů a opotřebovaných kláves: „Ó, zroď mi můj sen, obraz, který se léta mihotal někde za hranicemi vědomí!“ A jednou jsem se přesytil: „ano, AI umí všechno. A co umíš ty?


Politický a právní aspekt

Sociální sítě již zavedly označení „Vytvořeno umělou inteligencí“. Samozřejmě to často nefunguje správně a moji přátelé, umělečtí fotografové jsou naštvaní, když jsou jejich pracně vyfocené „reálné“ snímky označovány jako vytvořené v AI. Jak mají zpravodajské agentury ověřovat vizuální obsah? Stále jednoduše věříme klamům a vygenerovaná fotografie mrtvého dítěte může vést k masakru ve skutečnosti.

Umělou inteligenci vytvářejí lidé. A lidé mají rádi hranice. Proto jsou cerbeři cenzury v programech umělé inteligence ještě přísnější než v běžných sociálních sítích. Násilí, erotika, sex – to všechno vám program nedovolí vytvořit, pokud nezačne vyloženě bláznit (ale výsledek bude spíše nechutný a děsivý). Mocná technologie je uměle omezována puritánskými metodami – ale jsem si jistý, že se za chvilku objeví specializované programy pro tvorbu (například) porna na požádání: lidské potřeby se dají omezit, ale zničit je nelze.


Vliv na průmysl

Trh profesionální fotografie se brzy změní. Zatímco dokumentární žánry (svatby, děti, reportáže, zpravodajství) pravděpodobně přežijí, oblast „představivosti“ zcela přebere AI generace. Proč utrácet desítky tisíc dolarů za snové surrealistické focení, když můžete napsat pár promptů a dostat hodně muziky za málo peněz?

Již existují desítky soutěží zaměřených na AI-vytvořené obrázky, a těch za pár let vzniklo více, než vzniklo fotografií během poloviny dvacátého století. I když pracujete s „reálným“ světem, například se zabýváte rodinným focením, stojí za to se naučit pracovat s umělou inteligenci, abyste mohli vygenerovat referenční obrázky. Ať chcete, nebo ne, AI programy se brzy stanou každodenním nástrojem, a to nejen ve fotografickém průmyslu.



META ZÁVĚR

Fotografie je vizuální jazyk, to je to nejdůležitější, co AI odhaluje. My, lidé, myslíme slovy, pojmy, obrazy a pomocí umělé inteligence můžeme tyto myšlenky přímo extrahovat z naší hlavy bez pomoci komplikovaných a drahých přístrojů. Hlavním nástrojem fotografa je jeho mozek, a proto AI pouze usnadňuje úkol předání nápadu. Zbývá jen soustředit se a vybrat z nekonečného množství možností ten obraz, který odráží váš vnitřní impuls. Totální svoboda – lákavá a děsivá zároveň.



TVOŘÍME SPOLU S MIDJOURNEY

V posledních verzích AI programů je kromě textového promptu možné použít i referenční obrázky – což značně rozšiřuje a zjednodušuje způsoby práce. Základní myšlenka je taková: dobrý prompt je jako poezie – musí být přesný, stručný a upřímný. Někteří se snaží AI ovládat dotazy, které připomínají podrobnou právní stížnost, výsledek bývá obvykle zklamáním. AI program není otrok ani fotoaparát, ale spoluautor, i když ne vždy úplně střízlivý. Proto je lepší mu nabídnout téma, náznak, náčrt – a hned se ukáže v tom nejlepším světle. Až poté můžete pečlivě dopracovávat výsledek: přibližovat nebo zobecňovat, měnit detaily, vybírat verze příběhu. Je to fascinující cesta, která vede k vytouženým nádherným výsledkům.


Práci s AI vysvětlím na příkladu Midjourney. V tuto chvíli je to nejdynamičtější a nejšikovnější AI program na vizuální tvorbu. Bohužel, nemůžete pracovat hned na webu (až po vytvoření 1000 obrázků). Práci je třeba začít přes server Discord. Jak to udělat?


1.dRegistrace na Midjourney

Zaregistrujte se na webu Midjourney a zaplaťte si předplatné (nejjednodušší zkušební stojí 12 dolarů měsíčně).


2. Registrace na Discord

Zaregistrujte se na Discordu, připojte tam server Midjourney a pozvěte na svůj server Midjourney Bot, který bude generovat obrázky podle vašeho zadání.


3. Můžete začít

Hlavní příkaz pro bota je /imagine a po něm můžete napsat prompt: teoreticky v jakémkoli jazyce, ale nejlepší je angličtina.


4. Specifikace výběru

Po obdržení prvních výsledku můžeme: buď zvětšit (Upscale) některou ze 4 variant, nebo vytvořit variace (Variations) každého náhledu. Už zde nás to tlačí k iterativní práci.



5. Jakmile jsme vybrali variantu, můžeme:

  • Vytvořit hi-res (Upscale (Subtle))

  • Vytvořit hi-res s kreativními změnami (Upscale (Creative))

  • Vytvořit variace: v podstatě je to návrat k předchozímu kroku se 4 obrázky, ale již na základě vybraného (Vary (Subtle))

  • Vytvořit velmi odlišné variace vzdálené od originálu (Vary (Strong))

  • Změnit fragment obrázku (Vary (Region)) – k tomu je třeba vybrat pomocí lasa nebo obdélníkového ořezu požadovaný fragment a napsat, co je třeba v něm změnit. 

  • Zoom Out 2x – „odjezd“ 2x (dokončení obrázku na okrajích)

  • Zoom Out 1,5x – totéž

  • Custom Zoom – možnost zoomu do 2x (zoom out 5x není možný za jeden krok)

  • Make Square – vytvořit čtvercový obrázek, tedy doplnit ho shora-dolů nebo zprava-doleva.



6. Použití zoomu

Provedl jsem zoom-out 1,5x – a dále musím znovu vybrat ze 4 variant – a hned je vidět, kde AI pokulhává (rukávy). Proto vybírám třetí obrázek.



7. Opravení chyb

Zaznamenal jsem chybu na hrudi a využil funkci Vary (Region) – prompt jsem neměnil – v tom případě program jednoduše nabídne několik možností nahrazení „blízkých kontextu“.



8. Nabídka nových variant

Po opravě mi AI nabídla 4 varianty – abych je lépe prohlédl, stačí kliknout na náhled. Mezi nimi není zásadní rozdíl, chyba na hrudníku zmizela, takže vybírám libovolnou variantu a znovu provádím Zoom Out 1,5x.



9. Výběr obrázku

První obrázek mi přijde realističtější, znovu provádím Zoom Out 1,5x.



10. Vygenerování nového Zoom-out

 Zde vidíme, že se AI zamotala v rukou a nohách. Zatím je to typické, ale během několika měsíců tyto chyby zmizí. Můžeme udělat tři věci:

  • Zastavit se u předchozí iterace, kde je obrázek realistický.

  • „Léčit“ obrázek pomocí funkce Vary (Region) – ale někdy je to velmi zdlouhavý a pečlivý proces.

  • Požádat Midjourney, aby znovu vygeneroval Zoom Out – tedy kliknout na modrou ikonu se šipkami (Obnovit). Zkusím to udělat právě takto.


11. Opravené končetiny

Jak vidíme, nová iterace je mnohem realističtější. Vybírám 4. variantu a hned provádím Zoom Out 1,5x.



12. Pozor na ruce

Na této velikosti bych se asi zastavil (vybral jsem 3. variantu). Pomocí Vary (Region) opravím některé drobnosti, ale je důležité neuhlazovat obrázek: právě některé detaily běžného prostředí činí umělé vygenerované obrázky fotorealistickými.



13. Opravení pozice rukou

Protože se pravá ruka pořád nepřiblížila realitě, rozhodl jsem se jednat radikálně: vrátit se o krok zpět a použít funkci Vary (Subtle) na celý obrázek: tím „ztratíme“ naši postavu, ale zachováme příběh, kompozici, dokonce i barvu kalhot, a zároveň osvěžíme pohled na obrázek.


14. Úprava pozadí

Vezmu druhou variantu, ale s ní je také potřeba pracovat (nelíbí se mi lampa z hlavy, trochu divná hruď a staromódní košile) – budu to opravovat pomocí Vary (Region).



15. Výsledná oprava hrudníku

Už je to mnohem lepší. Hrudník se mi líbí na druhém obrázku, zbývá tam opravit světla (Vary (Region)).



16. Konečný výběr

Pak trochu doladím rukávy, aby nebyly tak přilnavé a máme hotovo! Vybírám verzi č. 2.



ZÁVĚR

Tím bych to asi uzavřel. V zaměření na detaily, snaze neotupit pohled, vědomém ořezávání, osvětlování, práci s barvami – ve všech těchto ohledech je práce s AI podobná fotografování, jenže nyní zdroj surového materiálu není realita, ale nekonečný archiv otisků této reality, ze kterého umělá inteligence generuje nové obrazy. Samozřejmě s vaší pomocí!


58 zobrazení0 komentářů

Comments


bottom of page