Meta Self-Play SWE-RL SSR: આર્ટિફિશિયલ ઇન્ટેલિજન્સ (AI) ના ક્ષેત્રમાં દુનિયાની મોટી કંપનીઓ જ્યારે જનરેટિવ AI ના એડવાન્સ પ્રોજેક્ટ પર કામ કરી રહી છે, ત્યારે Meta એ ગજબની સિદ્ધિ હાંસલ કરતા એક એવી સિસ્ટમ રજૂ કરી છે જે AI ને પોતાની જાતે જ કોડિંગ શીખવી રહી છે. Meta ના ફંડામેન્ટલ AI રિસર્ચ ડિપાર્ટમેન્ટે Self-Play SWE-RL (SSR) નામની AI સિસ્ટમ લોન્ચ કરી છે. તે માનવીય ડેટા અથવા GitHub રિપોઝીટરી પર નિર્ભર થયા વિના પોતાની જાતે કોડ બનાવે છે, તેમાં બગ (ભૂલ) નાખે છે અને પછી પોતે જ તે બગ સુધારે છે.
પહેલા સમજો કે કેમ મહત્વનું છે આ રિસર્ચ
આ રિસર્ચનો હેતુ એ છે કે AI કોઈ પણ માનવીય મદદ વગર સોફ્ટવેર એન્જિનિયરની જેમ કામ કરી શકે. આનાથી સોફ્ટવેર ડેવલપમેન્ટની પ્રક્રિયા માત્ર ઝડપી જ નહીં, પણ વધુ ચોક્કસ પણ બનશે. તેની મદદથી કંપનીઓ મોટા પાયે સેલ્ફ-લર્નિંગ એજન્ટ્સ બનાવી શકશે, જે બગ, ટેસ્ટિંગ, ડીબગિંગ જેવા કામો પોતે જ સંભાળશે.
arXiv.org પર પબ્લિશ થયેલા આ રિસર્ચમાં Meta ની સાથે યુનિવર્સિટી ઓફ ઇલિનોય અર્બાના (Illinois Urbana) અને કાર્નેગી મેલોન (Carnegie Mellon) યુનિવર્સિટીના નિષ્ણાતોએ કામ કર્યું છે. જો આ સિસ્ટમ વ્યવહારિક રીતે સફળ થાય છે, તો ભવિષ્યમાં પ્રોગ્રામિંગ એજ્યુકેશન અને સોફ્ટવેર ઇન્ડસ્ટ્રી બંને પર તેની અસર થશે, કારણ કે ત્યારે કોડ લખવો અને સુધારવો એ માનવીય કામ નહીં, પરંતુ AI ની એક પાયાની ક્ષમતા બની જશે.
કેવી રીતે કામ કરે છે SSR સિસ્ટમ?
SSR સિસ્ટમમાં એક જ લાર્જ લેંગ્વેજ મોડલ (LLM) બે અલગ-અલગ ભૂમિકાઓ ભજવે છે – એક ‘બગ ઇન્જેક્ટર’ અને બીજું ‘બગ સોલ્વર’. જ્યારે મોડલ ઇન્જેક્ટરની ભૂમિકામાં હોય છે, ત્યારે તે જાણીજોઈને કોડમાં ભૂલ નાખે છે – જેમ કે કોઈ લાઇન હટાવવી, લોજિક બદલવું અથવા જૂના ફેરફારને દોહરાવવો. જ્યારે આ જ મોડલ સોલ્વર તરીકે કામ કરે છે, ત્યારે તે તે જ ભૂલોને ઓળખીને સાચો કોડ તૈયાર કરે છે. આ પ્રક્રિયાને વારંવાર દોહરાવીને AI પોતે નવા કોડિંગ પેટર્ન અને ઉકેલો શીખે છે.
આ આખી ટ્રેનિંગ ઓપન-સોર્સ રિપોઝીટરી અને Docker સેન્ડબોક્સ એન્વાયરમેન્ટ્સમાં કરવામાં આવી, જેથી મોડલ સુરક્ષિત રીતે પ્રયોગ કરી શકે અને વાસ્તવિક કોડબેઝથી શીખી શકે. ઓપન-સોર્સ રિપોઝીટરી એવું પબ્લિક કોડ સ્ટોર છે જેને કોઈ પણ જોઈ શકે, વાપરી શકે અને સુધારી શકે છે, જ્યારે Docker સેન્ડબોક્સ એન્વાયરમેન્ટ એ સુરક્ષિત અને અલગ જગ્યા હોય છે જ્યાં તે કોડને સિસ્ટમને નુકસાન પહોંચાડ્યા વગર ચલાવીને પરખી શકાય છે.
પરંપરાગત સિસ્ટમથી કેટલો ફેરફાર?
અત્યાર સુધી AI કોડિંગ એજન્ટ્સ માણસોએ લખેલા ડેટા પર ટ્રેન થતા હતા. આ સિસ્ટમ્સની ક્ષમતા મર્યાદિત હતી કારણ કે મોડલ તે જ ઉદાહરણો પરથી શીખતા હતા જે પહેલેથી અસ્તિત્વમાં છે. SSR આ નિર્ભરતા ખતમ કરે છે. આ સિસ્ટમ જૂના ડેટાની જગ્યાએ પોતે નવી સમસ્યાઓ શોધે છે અને પોતે જ તેના ઉકેલો પણ શોધે છે.
Meta ના જણાવ્યા અનુસાર, SSR એ લોકપ્રિય SWE-Bench Verified અને SWE-Bench Pro બેન્ચમાર્ક પર જૂના રેકોર્ડ તોડી નાખ્યા છે. Verified ટેસ્ટમાં તેણે અગાઉની સર્વશ્રેષ્ઠ સિસ્ટમ કરતા ૧૦.૪ પોઈન્ટ વધુ મેળવ્યા, જ્યારે Pro ટેસ્ટમાં ૭.૮ પોઈન્ટ આગળ રહ્યું. આ પ્રદર્શન તે મોડલો કરતા પણ શ્રેષ્ઠ રહ્યું જે મોટા પાયે માનવીય ડેટા પર ટ્રેન કરવામાં આવ્યા હતા.

