Meta Self-Play SWE-RL SSR: હવે AI પોતે જ શીખશે કોડિંગ! Meta એ રજૂ કરી ક્રાંતિકારી 'સેલ્ફ-પ્લે' સિસ્ટમ, જાણો સોફ્ટવેર જગતમાં શું થશે ફેરફાર

Meta Self-Play SWE-RL SSR: આર્ટિફિશિયલ ઇન્ટેલિજન્સ (AI) ના ક્ષેત્રમાં દુનિયાની મોટી કંપનીઓ જ્યારે જનરેટિવ AI ના એડવાન્સ પ્રોજેક્ટ પર કામ કરી રહી છે, ત્યારે Meta એ ગજબની સિદ્ધિ હાંસલ કરતા એક એવી સિસ્ટમ રજૂ કરી છે જે AI ને પોતાની જાતે જ કોડિંગ શીખવી રહી છે. Meta ના ફંડામેન્ટલ AI રિસર્ચ ડિપાર્ટમેન્ટે Self-Play SWE-RL (SSR) નામની AI સિસ્ટમ લોન્ચ કરી છે. તે માનવીય ડેટા અથવા GitHub રિપોઝીટરી પર નિર્ભર થયા વિના પોતાની જાતે કોડ બનાવે છે, તેમાં બગ (ભૂલ) નાખે છે અને પછી પોતે જ તે બગ સુધારે છે.

Contents

પહેલા સમજો કે કેમ મહત્વનું છે આ રિસર્ચ
કેવી રીતે કામ કરે છે SSR સિસ્ટમ?
પરંપરાગત સિસ્ટમથી કેટલો ફેરફાર?

પહેલા સમજો કે કેમ મહત્વનું છે આ રિસર્ચ

આ રિસર્ચનો હેતુ એ છે કે AI કોઈ પણ માનવીય મદદ વગર સોફ્ટવેર એન્જિનિયરની જેમ કામ કરી શકે. આનાથી સોફ્ટવેર ડેવલપમેન્ટની પ્રક્રિયા માત્ર ઝડપી જ નહીં, પણ વધુ ચોક્કસ પણ બનશે. તેની મદદથી કંપનીઓ મોટા પાયે સેલ્ફ-લર્નિંગ એજન્ટ્સ બનાવી શકશે, જે બગ, ટેસ્ટિંગ, ડીબગિંગ જેવા કામો પોતે જ સંભાળશે.

- Advertisement -

arXiv.org પર પબ્લિશ થયેલા આ રિસર્ચમાં Meta ની સાથે યુનિવર્સિટી ઓફ ઇલિનોય અર્બાના (Illinois Urbana) અને કાર્નેગી મેલોન (Carnegie Mellon) યુનિવર્સિટીના નિષ્ણાતોએ કામ કર્યું છે. જો આ સિસ્ટમ વ્યવહારિક રીતે સફળ થાય છે, તો ભવિષ્યમાં પ્રોગ્રામિંગ એજ્યુકેશન અને સોફ્ટવેર ઇન્ડસ્ટ્રી બંને પર તેની અસર થશે, કારણ કે ત્યારે કોડ લખવો અને સુધારવો એ માનવીય કામ નહીં, પરંતુ AI ની એક પાયાની ક્ષમતા બની જશે.

કેવી રીતે કામ કરે છે SSR સિસ્ટમ?

SSR સિસ્ટમમાં એક જ લાર્જ લેંગ્વેજ મોડલ (LLM) બે અલગ-અલગ ભૂમિકાઓ ભજવે છે – એક ‘બગ ઇન્જેક્ટર’ અને બીજું ‘બગ સોલ્વર’. જ્યારે મોડલ ઇન્જેક્ટરની ભૂમિકામાં હોય છે, ત્યારે તે જાણીજોઈને કોડમાં ભૂલ નાખે છે – જેમ કે કોઈ લાઇન હટાવવી, લોજિક બદલવું અથવા જૂના ફેરફારને દોહરાવવો. જ્યારે આ જ મોડલ સોલ્વર તરીકે કામ કરે છે, ત્યારે તે તે જ ભૂલોને ઓળખીને સાચો કોડ તૈયાર કરે છે. આ પ્રક્રિયાને વારંવાર દોહરાવીને AI પોતે નવા કોડિંગ પેટર્ન અને ઉકેલો શીખે છે.

- Advertisement -

આ આખી ટ્રેનિંગ ઓપન-સોર્સ રિપોઝીટરી અને Docker સેન્ડબોક્સ એન્વાયરમેન્ટ્સમાં કરવામાં આવી, જેથી મોડલ સુરક્ષિત રીતે પ્રયોગ કરી શકે અને વાસ્તવિક કોડબેઝથી શીખી શકે. ઓપન-સોર્સ રિપોઝીટરી એવું પબ્લિક કોડ સ્ટોર છે જેને કોઈ પણ જોઈ શકે, વાપરી શકે અને સુધારી શકે છે, જ્યારે Docker સેન્ડબોક્સ એન્વાયરમેન્ટ એ સુરક્ષિત અને અલગ જગ્યા હોય છે જ્યાં તે કોડને સિસ્ટમને નુકસાન પહોંચાડ્યા વગર ચલાવીને પરખી શકાય છે.

પરંપરાગત સિસ્ટમથી કેટલો ફેરફાર?

અત્યાર સુધી AI કોડિંગ એજન્ટ્સ માણસોએ લખેલા ડેટા પર ટ્રેન થતા હતા. આ સિસ્ટમ્સની ક્ષમતા મર્યાદિત હતી કારણ કે મોડલ તે જ ઉદાહરણો પરથી શીખતા હતા જે પહેલેથી અસ્તિત્વમાં છે. SSR આ નિર્ભરતા ખતમ કરે છે. આ સિસ્ટમ જૂના ડેટાની જગ્યાએ પોતે નવી સમસ્યાઓ શોધે છે અને પોતે જ તેના ઉકેલો પણ શોધે છે.

- Advertisement -

Meta ના જણાવ્યા અનુસાર, SSR એ લોકપ્રિય SWE-Bench Verified અને SWE-Bench Pro બેન્ચમાર્ક પર જૂના રેકોર્ડ તોડી નાખ્યા છે. Verified ટેસ્ટમાં તેણે અગાઉની સર્વશ્રેષ્ઠ સિસ્ટમ કરતા ૧૦.૪ પોઈન્ટ વધુ મેળવ્યા, જ્યારે Pro ટેસ્ટમાં ૭.૮ પોઈન્ટ આગળ રહ્યું. આ પ્રદર્શન તે મોડલો કરતા પણ શ્રેષ્ઠ રહ્યું જે મોટા પાયે માનવીય ડેટા પર ટ્રેન કરવામાં આવ્યા હતા.