Denna artikel startade efter att jag följde en diskussion på nätet om huruvida ett 35 mm- eller 50 mm-objektiv på en fullformatkamera ger ett synfält som är likvärdigt med normalt mänskligt synfält. Den här specifika diskussionen fördjupade sig omedelbart i den optiska fysiken hos ögat som en kamera och en lins – en förståelig jämförelse eftersom ögat består av ett främre element (hornhinnan), en öppningsring (iris och pupill), en lins och en sensor (näthinnan).

Trots all imponerande matematik som kastades fram och tillbaka när det gäller ögonglobens optiska fysik verkade diskussionen inte riktigt logiskt logisk, så jag läste själv en hel del om ämnet.
Det kommer inte att finnas någon direkt nytta av den här artikeln som gör att du kan springa ut och ta bättre fotografier, men du kanske tycker att den är intressant. Du kan också tycka att den är otroligt tråkig, så jag ger dig min slutsats först, i form av två citat från Garry Winogrand:

Ett fotografi är illusionen av en bokstavlig beskrivning av hur kameran ”såg” ett stycke tid och rum.

Fotografin handlar inte om det som fotograferas. Det handlar om hur det ser ut när det fotograferas.

I grund och botten, när jag gjorde all denna forskning om hur det mänskliga ögat är som en kamera, var det jag egentligen lärde mig att människans syn inte är som ett fotografi. På ett sätt förklarade det för mig varför jag så ofta tycker att ett fotografi är mycket vackrare och intressantare än vad jag tyckte om själva scenen.

Ögat som kamerasystem

Översiktligt sett är det ganska logiskt att jämföra ögat med en kamera. Vi kan mäta ögats längd framifrån och bakåt (ca 25 mm från hornhinnan till näthinnan) och pupillens diameter (2 mm sammandragna, 7-8 mm vidgade) och beräkna linsliknande siffror utifrån dessa mätningar.

Du kommer dock att hitta en del olika siffror som anges för ögats brännvidd. Vissa är från fysiska mätningar av ögats anatomiska strukturer, andra från optometriska beräkningar, vissa tar hänsyn till att ögats lins och ögats storlek i sig förändras med sammandragningar av olika muskler.

För att sammanfatta är dock en vanligt angiven brännvidd för ögat 17 mm (detta är beräknat från det optometriska dioptrivärdet). Det mer allmänt accepterade värdet är dock 22 mm till 24 mm (beräknat utifrån fysisk refraktion i ögat). I vissa situationer kan brännvidden faktiskt vara längre.

Då vi känner till den ungefärliga brännvidden och pupillens diameter är det relativt enkelt att beräkna ögats bländare (f-stop). Med en brännvidd på 17 mm och en pupill på 8 mm bör ögongloben fungera som en f/2,1-lins. Om vi använder en brännvidd på 24 mm och en pupill på 8 mm bör den vara f/3,5. Det har faktiskt gjorts ett antal studier inom astronomin för att faktiskt mäta det mänskliga ögats f-stop, och den uppmätta siffran är f/3,2 till f/3,5 (Middleton, 1958).

I det här läget har båda ni som läst så här långt förmodligen undrat ”Om ögats brännvidd är 17 eller 24 mm, varför bråkar då alla om huruvida 35 mm- eller 50 mm-objektiv har samma synfält som det mänskliga ögat?”

Anledningen till detta är att den uppmätta brännvidden för ögat inte är det som bestämmer synvinkeln för det mänskliga ögat. Jag kommer att gå in mer i detalj på detta nedan, men huvudpoängen är att endast en del av näthinnan bearbetar huvudbilden som vi ser. (Området för huvudseendet kallas den visuella uppmärksamhetskonen, resten av det vi ser är ”perifert seende”).

Studier har mätt den visuella uppmärksamhetskonen och funnit att den är ungefär 55 grader bred. På en 35 mm fullformatskamera ger ett 43 mm objektiv en synvinkel på 55 grader, så den brännvidden ger exakt samma synvinkel som vi människor har. Fan om det inte är halvvägs mellan 35 mm och 50 mm. Så det ursprungliga argumentet är avslutat, det faktiska ”normala” objektivet på en 35 mm-spegelreflexkamera är varken 35 mm eller 50 mm, det ligger halvvägs däremellan.

Ögat är inte ett kamerasystem

När jag hade fått svaret på den ursprungliga diskussionen kunde jag ha låtit bli att prata om saken och gått därifrån med ännu en ganska värdelös trivialitet att arkivera bort för att förvåna mina vänner på nätet med. Men NEJ! När jag har en massa arbete som behöver göras, upptäcker jag att jag nästan alltid väljer att tillbringa ytterligare ett par timmar med att läsa fler artiklar om människans syn.

Du kanske har märkt att man i avsnittet ovan utelämnade en del av analogierna mellan öga och kamera, för när man väl har kommit förbi de enkla mätningarna av bländare och lins, passar resten av jämförelserna inte så bra.

Tänk på ögats sensor, näthinnan. Näthinnan är nästan lika stor (32 mm i diameter) som sensorn på en fullformatkamera (35 mm i diameter). Efter det är dock nästan allting annorlunda.

Näthinnan i ett mänskligt öga

Den första skillnaden mellan näthinnan och din kameras sensor är ganska uppenbar: näthinnan är böjd längs ögonglobens bakre yta, inte platt som kiselsensorn i kameran. Krökningen har en uppenbar fördel: näthinnans kanter är ungefär lika långt från linsen som centrum. På en platt sensor är kanterna längre bort från linsen och centrum närmare. Fördel näthinnan – den borde ha bättre ”hörnskärpa”.

Det mänskliga ögat har också mycket fler pixlar än din kamera, cirka 130 miljoner pixlar (känner ni ägare av 24-megapixelkameror er ödmjuka nu?). Endast cirka 6 miljoner av ögats pixlar är dock kottar (som ser färg), resterande 124 miljoner ser bara svartvitt. Men fördel näthinnan igen. Big time.

Men om vi tittar vidare blir skillnaderna ännu tydligare…

På en kamerasensor är varje pixel utplacerad i ett regelbundet rutmönster. Varje kvadratmillimeter av sensorn har exakt samma antal och mönster av pixlar. På näthinnan finns det ett litet centralt område, ungefär 6 mm brett (makula) som innehåller den tätaste koncentrationen av fotoreceptorer i ögat. Den centrala delen av makula (fovea) är tätt packad med endast kottceller (färgkänsliga celler). Resten av makula runt detta centrala ”bara-färg”-område innehåller både stavar och tappar.

Makula innehåller cirka 150 000 ”pixlar” i varje kvadrat på 1 mm (jämför det med 24 000 000 pixlar utspridda över en sensor på 35 mm x 24 mm i en 5DMkII eller D3x) och ger oss vår ”centrala syn” (den 55-graders kotte för visuell uppmärksamhet som nämns ovan). Hur som helst har den centrala delen av vårt synfält mycket större upplösningsförmåga än till och med den bästa kameran.

Resten av näthinnan har mycket färre ”pixlar”, varav de flesta endast är svartvita sensorer. Den ger det som vi vanligtvis betraktar som ”perifer syn”, det vi ser ”i ögonvrån”. Denna del känner av rörliga objekt mycket väl, men ger inte tillräcklig upplösning för att till exempel läsa en bok.

Det totala synfältet (området där vi kan se rörelser) för det mänskliga ögat är 160 grader, men utanför den visuella uppmärksamhetshinken kan vi inte riktigt känna igen detaljer, utan bara breda former och rörelser.

Det mänskliga ögats fördelar jämfört med kameran minskar lite när vi lämnar näthinnan och reser tillbaka mot hjärnan. Kameran skickar varje pixels data från sensorn till ett datorchip för bearbetning till en bild. Ögat har 130 miljoner sensorer i näthinnan, men synnerven som överför dessa sensorers signaler till hjärnan har bara 1,2 miljoner fibrer, så mindre än 10 % av näthinnans data skickas till hjärnan vid varje givet ögonblick. (Delvis beror detta på att de kemiska ljussensorerna i näthinnan tar ett tag att ”ladda upp” efter att ha blivit stimulerade. Delvis för att hjärnan ändå inte skulle kunna bearbeta så mycket information.)

Och naturligtvis bearbetar hjärnan signalerna mycket annorlunda än en fotokamera. Till skillnad från en kameras intermittenta slutarklick skickar ögat hjärnan ett konstant videoflöde som bearbetas till det vi ser. En undermedveten del av hjärnan (den laterala genikulära kärnan om ni måste veta) jämför signalerna från båda ögonen, sätter ihop de viktigaste delarna till 3D-bilder och skickar dem vidare till den medvetna delen av hjärnan för bildigenkänning och vidare bearbetning.

Den undermedvetna hjärnan sänder också signaler till ögat, som flyttar ögongloben en aning i ett skanningsmönster så att den skarpa synen i makula rör sig över ett objekt av intresse. Under några bråkdelar av sekunder skickar ögat faktiskt flera bilder, och hjärnan bearbetar dem till en mer komplett och detaljerad bild.

Den undermedvetna hjärnan avvisar också en stor del av den inkommande bandbredden och skickar bara en liten del av sina data vidare till den medvetna hjärnan. Du kan kontrollera detta i viss utsträckning: till exempel säger din medvetna hjärna just nu till den laterala genikulära kärnan ”skicka mig endast information från det centrala synfältet, fokusera på de maskinskrivna orden i mitten av synfältet, förflytta dig från vänster till höger så att jag kan läsa dem”. Sluta läsa för en sekund och utan att flytta ögonen försök se vad som finns i ditt perifera synfält. För en sekund sedan ”såg” du inte det där föremålet till höger eller vänster om datorskärmen eftersom det perifera synfältet inte förmedlades till den medvetna hjärnan.

Om du koncentrerar dig, även utan att röra ögonen, kan du åtminstone se att föremålet finns där. Om du vill se det tydligt måste du dock skicka en annan hjärnsignal till ögat som flyttar den visuella uppmärksamhetskonen över till det föremålet. Lägg också märke till att du inte kan både läsa texten och se de perifera objekten – hjärnan kan inte bearbeta så mycket data.

Hjärnan är inte klar när bilden har nått den medvetna delen (som kallas den visuella hjärnbarken). Detta område har en stark koppling till minnesdelarna i hjärnan, vilket gör att du kan ”känna igen” objekten i bilden. Vi har alla upplevt det där ögonblicket när vi ser något, men inte känner igen vad det är under en sekund eller två. När vi väl har känt igen det undrar vi varför i hela världen det inte var uppenbart direkt. Det beror på att det tog hjärnan en bråkdel av en sekund att få tillgång till minnesfilerna för bildigenkänning. (Om du inte har upplevt detta ännu, vänta bara några år, det kommer du att göra.)

I verkligheten (och detta är mycket uppenbart) är människans syn video, inte fotografi. Även när man stirrar på ett fotografi tar hjärnan flera ”ögonblicksbilder” när den flyttar fokuscentrum över bilden, staplar och sätter ihop dem till den slutgiltiga bild som vi uppfattar. Titta på ett fotografi i några minuter och du kommer att inse att ditt öga omedvetet har rört sig över bilden, fått en överblick över bilden, fokuserat på detaljer här och där och, efter några sekunder, insett vissa saker om den som inte var uppenbara vid första anblicken.

Så vad är poängen?

Ja, jag har några observationer, även om de ligger långt ifrån ”Vilket objektiv har ett synfält som liknar det mänskliga synfältet mest?”. Denna information fick mig att tänka på vad som gör att jag är så fascinerad av vissa fotografier och inte så mycket av andra. Jag vet inte om någon av dessa observationer är sanna, men de är intressanta tankar (åtminstone för mig). Alla bygger på ett faktum: när jag verkligen gillar ett fotografi ägnar jag en minut eller två åt att titta på det, låta min mänskliga syn skanna av det, fånga detaljerna från det eller kanske undra över de detaljer som inte syns.

Fotografier tagna i en ”normal” betraktningsvinkel (35 mm till 50 mm) verkar behålla sin attraktionskraft oavsett storlek. Även bilder i webbstorlek som tagits med denna brännvidd behåller essensen av bilden. Fotot nedan (taget på 35 mm) har mycket mer detaljer när det ses i en stor bild, men essensen är uppenbar även när det är litet. Kanske är hjärnans bearbetning mer bekväm med att känna igen en bild som den ser i sitt normala synfält. Kanske beror det på att vi fotografer tenderar att omedvetet betona komposition och motiv i ett fotografi med ”normal” betraktningsvinkel.

Fototot ovan visar på något annat som jag alltid har funderat på: uppstår vår fascination och kärlek till svartvitt fotografi för att det är ett av de få sätt på vilka de täta kägelreceptorerna (som bara har färg) i vår makula tvingas skicka en bild i gråskala till vår hjärna?

Kanske gillar vår hjärna att titta på bara ton och textur, utan att färgdata täpper till den smala bandbredden mellan ögat och hjärnan.

Likt bilder med normalvinkel ser tele- och makrofotografier ofta bra ut i små utskrifter eller JPG-filer i webbstorlek. Jag har en 8 × 10-bild av ett elefantöga och en liknande makroutskrift av en spindel på min kontorsvägg som till och med från andra sidan rummet ser bra ut. (Åtminstone ser de bra ut för mig, men du kommer att märka att de hänger på mitt kontor. Jag har hängt upp dem på ett par andra ställen i huset och har taktfullt fått höra att ”de passar verkligen inte till vardagsrumsmöblerna”, så de kanske inte ser så bra ut för alla.)

Det finns ingen fantastisk komposition eller andra faktorer som gör att dessa foton är attraktiva för mig, men jag finner dem fascinerande ändå. Kanske för att min mänskliga syn även i liten storlek kan se detaljer i fotografiet som jag aldrig skulle kunna se när jag tittar på en elefant eller en spindel med ”blotta ögat”.

Å andra sidan, när jag får ett bra vidvinkel- eller landskapsfoto bryr jag mig knappt ens om att lägga upp en grafisk bild i webbstorlek eller göra en liten utskrift (och jag tänker inte börja för den här artikeln). Jag vill ha den tryckt i storformat. Jag tror kanske att det är så att min mänskliga syn kan skanna igenom bilden och plocka fram de små detaljerna som går helt förlorade när den är nedskalad. Och varje gång jag gör ett stort utskrift, även av en scen som jag har varit på ett dussintal gånger, lägger jag märke till saker i fotografiet som jag aldrig har sett när jag var där personligen.

Kanske den ”video” som min hjärna gör när jag skannar av utskriften ger mycket mer detaljer och jag tycker att det är mer tilltalande än vad kompositionen av fotot skulle ge när det skrivs ut i liten skala (eller som jag såg när jag faktiskt var på platsen).

Och kanske förklarar den undermedvetna ”scanning” som min syn gör över ett fotografi varför saker som ”tredjedelsregeln” och selektivt fokus drar mitt öga till vissa delar av fotografiet. Kanske har vi fotografer helt enkelt kommit på hur hjärnan bearbetar bilder och dragit nytta av det genom praktisk erfarenhet, utan att känna till all vetenskap.

Men jag antar att min enda riktiga slutsats är denna: ett fotografi är INTE exakt vad mitt öga och min hjärna såg på platsen. När jag får en bra bild är det något annat och bättre, som Winogrand sa i de två citaten ovan, och även i det här citatet:

Du ser något som händer och du slår på det. Antingen får du det du såg eller så får du något annat – och det som är bättre trycker du.

Om författaren: Roger Cicala är grundaren av LensRentals. Den här artikeln publicerades ursprungligen här.

Bildkrediter: Mitt öga på nära håll av machinecodeblue, Nikhs öga genom kamerans öga från mina ögon för dina ögon 🙂 av slalit, Schematisk bild av det mänskliga ögat av entirelysubjective, Mitt vänstra ögats näthinna av Richard Masoner / Cyclelicious, Kromatisk aberration (typ av) av moppet65535

Lämna ett svar

Din e-postadress kommer inte publiceras.