લગભગ એક વર્ષ પહેલાં રિલીઝ થયેલ, OpenAI નું GPT-4o નવી સુવિધાઓ સાથે રિફાઇન લોન્ચ કર્યું છે. જે નવીનતમ ઇમેજ જનરેશન છે. AI મોડેલ ઉચ્ચ-ગુણવત્તાવાળી, વિગતવાર છબીઓ જનરેટ કરી શકે છે અને જ્યાં સુધી તમે તમારા મગજમાં જે છબી બનાવી રહ્યા હતા તે ન મળે ત્યાં સુધી તેમને સુધારવા માટે તમારી કુદરતી ભાષાની સૂચનાઓનું પાલન કરી શકે છે.
તમે જાણો છો કે જૂના AI મોડેલો ટેક્સ્ટ સાથે કેવી રીતે સંઘર્ષ કરતા હતા.
ઇમેજ જનરેશન સામાન્ય રીતે ટેક્સ્ટ પ્રોમ્પ્ટ દાખલ કરવાથી શરૂ થાય છે, પછી તમે મૂળ પ્રોમ્પ્ટને રિફાઇન કરીને છબીને રિફાઇન કરે છે. GPT-4o અલગ રીતે કામ કરે છે. તમે તેને એક છબી માટે પૂછો છો, પછી તેને શું બદલવું તે કહો છો, પછી તેને વધુ વસ્તુઓ બદલવા માટે કહો છો અને જ્યાં સુધી તમને તમારું પરિણામ ન મળે ત્યાં સુધી ટ્રાય કરતા રહો છો. તમને જણાવી દઈએ કે નીચે મુજબ તેના કેટલાક ઉદાહરણો છે.
તમે આ છબીઓ બનાવનારા પ્રોમ્પ્ટ્સની તપાસ કરવા માટે નીચેની સ્રોત લિંકને અનુસરી શકો છો. નોંધ કરો કે OpenAI એ કેટલીક ચેરી પિકિંગ કરી હતી. ઘણી બધી છબીઓ “બેસ્ટ ઓફ 2” અથવા તો “બેસ્ટ ઓફ 8” પણ હતી, તેથી મોડેલને તેને યોગ્ય રીતે મેળવવા માટે થોડા પ્રયાસોની જરૂર હતી. તેમ છતાં, પરિણામો ખૂબ પ્રભાવશાળી લાગે છે અને UI જેટલું સરળ છે.
GPT-4o શરૂઆતથી શરૂ કરી શકે છે અથવા તે તમે આપેલી છબીને સુધારી શકે છે. અહીં, વપરાશકર્તા તેને બિલાડીનો ફોટો આપે છે અને AI ને તેને ડિટેક્ટીવ ટોપી અને મોનોકલ આપવા માટે કહે છે. પછી વપરાશકર્તા છબીને રિફાઇન કરવા માટે આગળ વધે છે, તેને એવી વસ્તુમાં ફેરવે છે જે RPG માંથી સ્ક્રીનશોટ હોઈ શકે છે.
તમે બહુવિધ છબીઓથી પણ શરૂઆત કરી શકો છો અને દરેક છબીમાંથી ઘટકોને અંતિમ પરિણામમાં એકીકૃત કરી શકો છો. OpenAI કહે છે કે GPT-4o વિગતવાર સૂચનાઓનું પાલન કરવામાં ઉત્તમ છે – તે ટ્રિપ થયા વિના એક દ્રશ્યમાં 10-20 વિવિધ ઑબ્જેક્ટ્સને હેરફેર કરી શકે છે.
GPT-4o સંપૂર્ણ નથી અને OpenAI એ સ્વીકારનાર પ્રથમ છે. ક્યારેક, તે છબીઓને તળિયે કાપી નાખે છે, આભાસ હજુ પણ એક સમસ્યા છે, 10-20 થી વધુ વસ્તુઓ સાથે કામ કરવું મુશ્કેલ હોઈ શકે છે, બિન-લેટિન અક્ષરો સાથે ટેક્સ્ટ રેન્ડર કરવા માટે પણ વધુ કામની જરૂર પડે છે.