Ez a cikk azután indult, hogy követtem egy online vitát arról, hogy egy 35 mm-es vagy egy 50 mm-es objektív egy full frame fényképezőgépen a normál emberi látással egyenértékű látómezőt ad. Ez a bizonyos vita azonnal belemerült a szem mint kamera és lencse optikai fizikájába – érthető összehasonlítás, hiszen a szem egy elülső elemből (a szaruhártyából), egy rekeszgyűrűből (a szivárványhártya és a pupilla), egy lencséből és egy érzékelőből (a retinából) áll.
A szemgolyó optikai fizikájával kapcsolatban ide-oda dobált lenyűgöző matematika ellenére a vitának nem igazán volt logikai értelme, ezért magam is sokat olvastam a témában.
A cikknek nem lesz közvetlen haszna abból, hogy kirohanjon és jobb fényképeket készítsen, de talán érdekesnek találja. Az is lehet, hogy hihetetlenül unalmasnak fogod találni, ezért előbb a konklúziómat mondom el neked, két Garry Winogrand-idézet formájában:
A fénykép illúziója annak szó szerinti leírása, ahogy a kamera “látta” az idő és a tér egy darabját.
A fényképezés nem a fényképezett dologról szól. Hanem arról, hogyan néz ki az a dolog lefényképezve.
Az egész kutatás során, amely arról szólt, hogy az emberi szem olyan, mint egy fényképezőgép, valójában azt tanultam meg, hogy az emberi látás nem olyan, mint egy fénykép. Bizonyos értelemben megmagyarázta nekem, hogy miért találok olyan gyakran egy fényképet sokkal szebbnek és érdekesebbnek, mint magát a tényleges jelenetet.
A szem mint kamerarendszer
Felületesen nézve elég logikus a szemet egy kamerához hasonlítani. Megmérhetjük a szem elülső és hátsó hosszát (kb. 25 mm a szaruhártyától a retináig), és a pupilla átmérőjét (2 mm összehúzódva, 7-8 mm kitágulva), és ezekből a mérésekből lencseszerű számokat számolhatunk.
A szem fókusztávolságára azonban különböző számokat találunk. Egyesek a szem anatómiai struktúráinak fizikai méréseiből származnak, mások optometriai számításokból, mások figyelembe veszik, hogy a szemlencse és maga a szem mérete változik a különböző izmok összehúzódásával.
Összefoglalva azonban az egyik általánosan idézett szem fókusztávolság 17 mm (ezt az optometriai dioptriaértékből számítják). Az általánosan elfogadott érték azonban 22mm és 24mm között van (a szem fizikai fénytöréséből számítva). Bizonyos helyzetekben a fókusztávolság valójában hosszabb is lehet.
Mivel ismerjük a hozzávetőleges fókusztávolságot és a pupilla átmérőjét, viszonylag könnyen kiszámítható a szem rekesznyílása (f-stop). Egy 17 mm-es gyújtótávolság és egy 8 mm-es pupilla esetén a szemgolyónak f/2,1-es lencseként kell működnie. Ha 24 mm-es gyújtótávolságot és 8 mm-es pupillát használunk, akkor f/3,5-nek kell lennie. A csillagászatban több tanulmányt is végeztek az emberi szem f-stopjának tényleges mérésére, és a mért szám f/3,2 és f/3,5 között van (Middleton, 1958).
Ebben a pontban valószínűleg mindketten, akik eddig olvastak, elgondolkodtak azon, hogy “Ha a szem fókusztávolsága 17 vagy 24 mm, miért vitatkozik mindenki azon, hogy a 35 mm-es vagy 50 mm-es objektívek látószöge megegyezik-e az emberi szemével?”
Az ok az, hogy nem a szem mért fókusztávolsága határozza meg az emberi látás látószögét. Erre alább részletesebben is kitérek, de a lényeg az, hogy a retinának csak egy része dolgozza fel a fő képet, amit látunk. (A fő látási területet a vizuális figyelem kúpjának nevezzük, a többi, amit látunk, a “perifériás látás”).
Kutatások megmérték a vizuális figyelem kúpját, és azt találták, hogy az körülbelül 55 fok széles. Egy 35 mm-es full frame fényképezőgépen egy 43 mm-es objektív 55 fokos látószöget biztosít, tehát ez a gyújtótávolság pontosan ugyanolyan látószöget biztosít, mint amilyennel mi, emberek rendelkezünk. A fenébe is, ha ez nem félúton van a 35mm és az 50mm között. Tehát az eredeti vita véget ért, a 35 mm-es tükörreflexes fényképezőgépek tényleges “normál” objektívje nem 35 mm és nem is 50 mm, hanem a kettő között félúton van.
A szem nem kamerarendszer
Az eredeti vitára adott válasz birtokában békén hagyhattam volna a dolgokat, és elsétálhattam volna egy újabb, meglehetősen haszontalan aprósággal, amivel az online barátaimat ámulatba ejthetem. De NOOoooooo. Amikor egy csomó munkám van, amit el kell végeznem, szinte mindig úgy találom, hogy inkább eltöltök még néhány órát az emberi látásról szóló cikkek elolvasásával.
Észrevehetted, hogy a fenti részből kimaradt néhány szem-kamera analógia, mert amint túllépsz a rekesz és a lencse egyszerű mérésein, a többi összehasonlítás már nem illik olyan jól.
Nézzük a szem érzékelőjét, a retinát. A retina majdnem ugyanolyan méretű (32 mm átmérőjű), mint egy full frame fényképezőgép érzékelője (35 mm átmérőjű). Ezután azonban szinte minden más.
A retina és a fényképezőgép érzékelője közötti első különbség meglehetősen nyilvánvaló: a retina a szemgolyó hátsó felülete mentén ívelt, nem pedig lapos, mint a fényképezőgép szilíciumérzékelője. A görbületnek van egy nyilvánvaló előnye: a retina szélei körülbelül ugyanolyan távolságra vannak a lencsétől, mint a középpontja. Egy lapos érzékelőnél a szélek távolabb vannak a lencsétől, a középpont pedig közelebb. Előny a retinának – jobb “sarokélességgel” kell rendelkeznie.
Az emberi szem is sokkal több pixellel rendelkezik, mint a fényképezőgéped, körülbelül 130 millió pixellel (ti 24 megapixeles fényképezőgép-tulajdonosok most szerénynek érzitek magatokat?). Azonban a szem pixeleinek csak kb. 6 milliója kúp (ami színt lát), a maradék 124 millió csak fekete-fehéret lát. De megint előny a retina. Nagy előnye van.
De ha tovább nézzük, a különbségek még hangsúlyosabbá válnak…
A fényképezőgép érzékelőjén minden egyes pixel szabályos rácsmintázatban helyezkedik el. Az érzékelő minden négyzetmilliméterén pontosan ugyanannyi és ugyanolyan mintázatú pixel található. A retinán van egy kis központi, kb. 6 mm átmérőjű terület (a makula), amely a szem fotoreceptorainak legsűrűbb koncentrációját tartalmazza. A makula központi része (a fovea) sűrűn tele van kizárólag kúp (színérzékelő) sejtekkel. A makula többi része e központi, “csak színt érzékelő” terület körül pálcikákat és kúpokat egyaránt tartalmaz.
A makula 1 mm-es négyzetben körülbelül 150 000 “pixelt” tartalmaz (ezt hasonlítsuk össze az 5DMkII vagy a D3x 35 mm x 24 mm-es érzékelőjén elterülő 24 000 000 000 pixellel), és ez biztosítja a “központi látást” (a fent említett 55 fokos látókúpot). Mindenesetre a látómezőnk központi része sokkal nagyobb felbontóképességgel rendelkezik, mint a legjobb fényképezőgép.
A retina többi része sokkal kevesebb “pixellel” rendelkezik, amelyek többsége csak fekete-fehér érzékelésű. Ez biztosítja azt, amit általában “perifériás látásnak” tekintünk, azokat a dolgokat, amelyeket “a szemünk sarkában” látunk. Ez a rész nagyon jól érzékeli a mozgó tárgyakat, de nem nyújt elegendő felbontást ahhoz, hogy például egy könyvet elolvassunk.
Az emberi szem teljes látómezeje (az a terület, amelyen mozgást látunk) 160 fok, de a látókúpon kívül nem igazán tudunk részleteket felismerni, csak nagyjából formákat és mozgást.
Az emberi szem előnyei a kamerával szemben egy kicsit csökkennek, ahogy elhagyjuk a retinát és visszamegyünk az agy felé. A kamera minden egyes pixel adatát az érzékelőről egy számítógépes chipre küldi, hogy azt képként dolgozza fel. A szemnek 130 millió érzékelője van a retinában, de a látóideg, amely az érzékelők jeleit az agyba továbbítja, csak 1,2 millió rostból áll, így a retina adatainak kevesebb mint 10%-a jut el az agyba egy adott pillanatban. (Ez részben azért van így, mert a retinában lévő kémiai fényérzékelőknek időbe telik, amíg stimulálás után “feltöltődnek”. Részben azért, mert az agy amúgy sem tudna ennyi információt feldolgozni.)
És persze az agy sokkal másképp dolgozza fel a jeleket, mint egy fényképezőgép. Ellentétben egy fényképezőgép szaggatott zárkattintásaival, a szem egy állandó tápvideót küld az agynak, amit feldolgoz azzá, amit látunk. Az agy egy tudatalatti része (az oldalsó geniculáris mag, ha tudni kell) összehasonlítja a két szem jeleit, a legfontosabb részeket 3 dimenziós képpé állítja össze, és továbbküldi az agy tudatos részének képfelismerésre és további feldolgozásra.
A tudatalatti agy jeleket küld a szemnek is, a szemgolyót kissé pásztázó mintázatban mozgatja, hogy a makula éles látása áthaladjon az érdekes tárgyon. Néhány töredék másodperc alatt a szem valójában több képet küld, és az agy ezeket egy teljesebb és részletesebb képpé dolgozza fel.
A tudatalatti agy is visszautasítja a beérkező sávszélesség nagy részét, és az adatoknak csak egy kis töredékét küldi tovább a tudatos agynak. Ezt bizonyos mértékig irányíthatod: például most éppen a tudatos agyad azt mondja az oldalsó geniculáris magnak, hogy “csak a központi látásból küldj nekem információt, koncentrálj azokra a gépelt szavakra a látómező közepén, mozogj balról jobbra, hogy el tudjam olvasni őket”. Hagyd abba az olvasást egy pillanatra, és anélkül, hogy mozgatnád a szemed, próbáld meg megnézni, mi van a perifériás látómeződben. Egy másodperccel ezelőtt még nem “láttad” azt a tárgyat a számítógép monitorától jobbra vagy balra, mert a perifériás látás nem jutott el a tudatos agyba.
Ha koncentrálsz, még a szemed mozgatása nélkül is, akkor legalább meg tudod mondani, hogy a tárgy ott van. Ha azonban tisztán akarod látni, akkor egy másik agyi jelet kell küldened a szemednek, ami a vizuális figyelem kúpját áthelyezi arra a tárgyra. Figyeld meg azt is, hogy nem tudod egyszerre elolvasni a szöveget és látni a perifériás tárgyakat – az agy nem képes ennyi adatot feldolgozni.
Az agy még nem végzett, amikor a kép elérte a tudatos részt (az úgynevezett látókéreg). Ez a terület erősen kapcsolódik az agy memóriarészeivel, lehetővé téve a képen lévő tárgyak “felismerését”. Mindannyian átéltük már azt a pillanatot, amikor látunk valamit, de egy-két másodpercig nem ismerjük fel, hogy mi az. Miután felismertük, azon tűnődünk, hogy mi a fenéért nem volt azonnal nyilvánvaló. Azért, mert az agynak a másodperc tört része kellett ahhoz, hogy hozzáférjen a képfelismeréshez szükséges memóriafájlokhoz. (Ha még nem tapasztaltad ezt, várj még néhány évet, majd fogsz.)
A valóságban (és ez nagyon is nyilvánvaló) az emberi látás videó, nem fényképezés. Még akkor is, amikor egy fényképet bámulunk, az agy több “pillanatfelvételt” készít, miközben a fókuszközpontot a kép fölé mozgatja, egymásra helyezi és összerakja őket a végső képgé, amit érzékelünk. Nézzünk néhány percig egy fényképet, és rájövünk, hogy a szemünk tudat alatt végigvándorolt a képen, áttekintést szerezve a képről, itt-ott részletekre fókuszálva, és néhány másodperc múlva rájövünk néhány olyan dologra, ami első pillantásra nem volt nyilvánvaló.
Szóval, mi a lényeg?
Nos, van néhány megfigyelésem, bár ezek messze vannak a “melyik objektív látómezeje hasonlít leginkább az emberi látáshoz?”-tól. Ezek az információk elgondolkodtattak azon, hogy mitől vagyok annyira lenyűgözve egyes fényképektől, és mitől nem annyira másoktól. Nem tudom, hogy ezek közül a megfigyelések közül bármelyik igaz-e, de érdekes gondolatok (legalábbis számomra). Mindegyik egy tényen alapul: amikor igazán tetszik egy fénykép, egy-két percig nézegetem, hagyom, hogy emberi látásom végigpásztázza, megragadom belőle a részleteket, vagy esetleg elgondolkodom a nem látható részleteken.
A “normál” látószögben (35 mm-től 50 mm-ig) készített fényképek úgy tűnik, hogy méretüktől függetlenül megőrzik vonzerejüket. Még az ilyen gyújtótávolsággal készített webméretű képek is megőrzik a felvétel lényegét. Az alábbi (35mm-nél készült) felvétel sokkal részletesebb, ha nagyméretű képen nézzük, de a lényeg még kicsiben is nyilvánvaló. Talán az agy feldolgozása jobban felismeri a normál látómezőben látott képet. Talán azért, mert mi, fotósok hajlamosak vagyunk tudat alatt hangsúlyozni a kompozíciót és a témákat egy “normál” látószögű fényképen.”
A fenti fotó egy másik dolgot mutat be, amire mindig is kíváncsi voltam: vajon a fekete-fehér fotózás iránti rajongásunk és szeretetünk azért következik be, mert ez egyike azon kevés lehetőségeknek, amikor a makulánkban lévő sűrű kúp (csak színes) receptorok kénytelenek szürkeárnyalatos képet küldeni az agyunknak?
Talán az agyunk csak a tónusokat és a textúrát szereti nézni, anélkül, hogy a színes adatok eltömítenék a szemgolyó és az agy közötti szűk sávszélességet.
A “normál szögű” felvételekhez hasonlóan a tele- és makrófelvételek is gyakran remekül mutatnak kis méretű nyomatokon vagy webes méretű JPG-ken. Van egy 8 × 10-es elefántszem és egy hasonló méretű makrónyomat egy pókról az irodám falán, amelyek még a szoba másik végéből is remekül néznek ki. (Legalábbis számomra nagyszerűen néznek ki, de észre fogod venni, hogy az irodámban lógnak. A házban néhány más helyen is felakasztottam őket, és tapintatosan azt mondták, hogy “nem igazán illenek a nappali bútoraihoz”, úgyhogy talán nem mindenkinek tűnnek olyan nagyszerűnek.)
Nincs nagyszerű kompozíció vagy más tényező, ami vonzóvá tenné számomra ezeket a képeket, de ettől függetlenül lenyűgözőnek találom őket. Talán azért, mert az emberi látásom még kis méretben is meglátja a fényképen azokat a részleteket, amelyeket egy elefántot vagy pókot “szabad szemmel” nézve sosem látnék.”
Másrészt, amikor egy jó nagylátószögű vagy tájképi felvételt készítek, aligha vesződöm azzal, hogy webméretű grafikát tegyek közzé vagy kisnyomatot készítsek (és ehhez a cikkhez nem is fogok hozzáfogni). Azt akarom, hogy NAGYON kinyomtassák. Azt hiszem, talán azért, hogy az emberi látásom végigpásztázhassa a képet, és kiszűrhesse azokat az apró részleteket, amelyek a kicsinyített méretben teljesen elvesznek. És minden alkalommal, amikor nagyméretű lenyomatot készítek, még egy olyan helyszínről is, ahol már tucatszor jártam, olyan dolgokat veszek észre a fényképen, amelyeket soha nem láttam, amikor személyesen ott voltam.
Talán az a “videó”, amit az agyam készít, miközben a lenyomatot pásztázza, sokkal több részletet ad, és sokkal kellemesebbnek találom, mint amit a fénykép kompozíciója adna, amikor kicsiben nyomtatják (vagy amit akkor láttam, amikor ténylegesen ott voltam a helyszínen).
És talán a tudatalatti “pásztázás”, amit a látásom végez a fényképen, magyarázza, hogy az olyan dolgok, mint a “harmadok szabálya” és a szelektív fókusz miért vonzza a szememet a fénykép bizonyos részeire. Talán mi, fotósok egyszerűen rájöttünk, hogyan dolgozza fel az agy a képeket, és a gyakorlati tapasztalatok révén kihasználtuk ezt, anélkül, hogy az összes tudományt ismernénk.
De azt hiszem, az egyetlen igazi következtetésem a következő: egy fénykép NEM pontosan az, amit a szemem és az agyam látott a helyszínen. Amikor egy jó felvételt készítek, az valami más és valami jobb, mint amit Winogrand mondott a fenti két idézetben, és ebben az idézetben is:
Látsz valamit, ami történik, és rácsapsz. Vagy azt kapod, amit láttál, vagy valami mást – és amelyik jobb, azt nyomtatod ki.”
A szerzőről: Roger Cicala a LensRentals alapítója. Ez a cikk eredetileg itt jelent meg.
Image credits: My eye up close by machinecodeblue, Nikh’s eye through camera’s eye from my eyes for your eyes 🙂 by slalit, Schematic of the Human Eye by entirelysubjective, My left eye retina by Richard Masoner / Cyclelicious, Chromatic aberration (sort of) by moppet65535