Foundation Model AI - फाउंडेशन मॉडल एआई का क्या मतलब है?

फाउंडेशन मॉडल एक गहन शिक्षण एल्गोरिदम है जिसे सार्वजनिक इंटरनेट से निकाले गए बहुत बड़े डेटा सेट के साथ पूर्व-प्रशिक्षित किया गया है।

संकीर्ण कृत्रिम बुद्धिमत्ता (संकीर्ण एआई) मॉडल के विपरीत, जिन्हें एक ही कार्य करने के लिए प्रशिक्षित किया जाता है, फाउंडेशन मॉडल को विभिन्न प्रकार के डेटा के साथ प्रशिक्षित किया जाता है और ज्ञान को एक कार्य से दूसरे कार्य में स्थानांतरित कर सकते हैं। इस प्रकार के बड़े पैमाने के तंत्रिका नेटवर्क को एक बार प्रशिक्षित किया जा सकता है और फिर विभिन्न प्रकार के कार्यों को पूरा करने के लिए इसे ठीक किया जा सकता है।

फाउंडेशन मॉडल को बनाने में लाखों डॉलर खर्च हो सकते हैं क्योंकि उनमें सैकड़ों अरब हाइपरपैरामीटर होते हैं जिन्हें सैकड़ों गीगाबाइट डेटा के साथ प्रशिक्षित किया गया है। हालाँकि, एक बार पूरा होने पर, विभिन्न प्रकार के असतत कार्यों को स्वचालित करने के लिए प्रत्येक फाउंडेशन मॉडल को असीमित संख्या में संशोधित किया जा सकता है।

Foundation model step by step


आज, कृत्रिम बुद्धिमत्ता अनुप्रयोगों को प्रशिक्षित करने के लिए मूलभूत मॉडल का उपयोग किया जाता है जो प्राकृतिक भाषा प्रसंस्करण (एनएलपी) और प्राकृतिक भाषा पीढ़ी (एनएलजी) पर निर्भर होते हैं। लोकप्रिय उपयोग के मामलों में शामिल हैं:

 

  • BERT - किसी शब्द के संदर्भ को निर्धारित करने के लिए एक साथ बाएं से दाएं और दाएं से बाएं दिशाओं में पाठ को संसाधित करके कृत्रिम बुद्धिमत्ता कार्यक्रमों को पाठ में अस्पष्ट शब्दों के संदर्भ को समझने में मदद करता है। BERT का मतलब ट्रांसफॉर्मर्स से द्विदिश एनकोडर प्रतिनिधित्व है।
  • GPT-3 - ऐसे पाठ का निर्माण करने के लिए गहन शिक्षण एल्गोरिदम का उपयोग करता है जो किसी इंसान द्वारा लिखा गया प्रतीत होता है। GPT-3, जिसका उपयोग अक्सर वेबसाइटों पर उत्पाद विवरण और समाचार सारांश तैयार करने के लिए किया जाता है, का मतलब जेनरेटिव प्री-ट्रेंड ट्रांसफार्मर 3 है।
  • DALL-E 2 - प्राकृतिक भाषा में विवरण से यथार्थवादी चित्र और कला बनाने के लिए "प्रसार" नामक प्रक्रिया का उपयोग करता है। DALL-E 2, WALL-E और साल्वाडोर डाली का एक चित्र है।

 

फाउंडेशन मॉडल एआई की व्याख्या करता है

उम्मीद की जाती है कि फाउंडेशन मॉडल बड़ी उद्यम कंपनियों के लिए एआई परियोजनाओं को निष्पादित करना आसान और सस्ता बना देंगे। मशीन लर्निंग मॉडल को प्रशिक्षित करने के लिए उच्च प्रदर्शन वाले क्लाउड जीपीयू पर लाखों डॉलर खर्च करने के बजाय, कंपनियां पूर्व-प्रशिक्षित डेटा का उपयोग कर सकती हैं और विशिष्ट कार्यों के लिए मॉडल को ट्यून करने पर अपना ध्यान (और बजट) केंद्रित कर सकती हैं।

हालाँकि, फाउंडेशन मॉडल के आलोचकों को चिंता है कि इस प्रकार के अनुकूलन योग्य "बड़े पैमाने पर-न्यूरल-नेटवर्क-इन-ए-कैन" में बहुत अधिक डेटा का उपयोग होता है और इसमें इतनी गहरी सीखने की परतें होती हैं कि एक इंसान के लिए यह समझना असंभव है कि कैसे एक संशोधित मॉडल ने एक विशिष्ट आउटपुट की गणना की। इस प्रकार की ब्लैक बॉक्स भेद्यता, गलत सूचना प्रसारित करने या जानबूझकर मशीन पूर्वाग्रह पेश करने के लिए डिज़ाइन किए गए डेटा विषाक्तता हमलों के लिए जोखिम में फाउंडेशन मॉडल छोड़ देती है।

ब्लूम और सीआरएफएम

ब्लूम (बिगसाइंस लार्ज ओपन-साइंस ओपन-एक्सेस मल्टीलिंगुअल लैंग्वेज मॉडल) हगिंग फेस नामक समुदाय-संचालित मशीन लर्निंग (एमएल) प्लेटफॉर्म के स्वयंसेवकों द्वारा बनाया गया एक महत्वपूर्ण फाउंडेशन मॉडल है। इस मॉडल को बनाने वाले स्वयंसेवकों की टीम ने इस बारे में विवरण साझा किया है कि मॉडल को किस डेटा पर प्रशिक्षित किया गया था और इष्टतम प्रदर्शन निर्धारित करने के लिए किन मानदंडों का उपयोग किया गया था।

शोधकर्ता उम्मीद कर रहे हैं कि क्योंकि ब्लूम का ओपन-एक्सेस लार्ज लैंग्वेज मॉडल (एलएलएम) ओपनएआई और गूगल फाउंडेशन मॉडल के समान ही प्रदर्शन करता है, यह रोबोटिक प्रोसेस ऑटोमेशन (आरपीए) और अन्य प्रकार के संकीर्ण एआई से परे कई अलग-अलग प्रकार के अनुप्रयोगों में एआई अपनाने को प्रोत्साहित करेगा। .

ब्लूम मॉडल, जिसमें 176 बिलियन पैरामीटर शामिल हैं और 11 सप्ताह तक प्रशिक्षित किया गया था, अब जनता के लिए उपलब्ध है और इसे हगिंग फेस वेबसाइट के माध्यम से एक्सेस किया जा सकता है। ब्लूम 46 मानव भाषाओं और 13 प्रोग्रामिंग भाषाओं में पारंगत है।

 

फाउंडेशन मॉडल पर अनुसंधान के लिए स्टैनफोर्ड सेंटर

स्टैनफोर्ड यूनिवर्सिटी के सेंटर फॉर रिसर्च ऑन फाउंडेशन मॉडल्स (सीआरएफएम) के शोधकर्ता यह भी अध्ययन कर रहे हैं कि कैसे फाउंडेशन मॉडल जिम्मेदार एआई के सिद्धांतों का समर्थन करते हुए एआई अपनाने में तेजी लाने की क्षमता रखते हैं।

सीआरएफएम वेबसाइट के अनुसार, अनुसंधान केंद्र का मुख्य फोकस फाउंडेशन मॉडल के प्रशिक्षण और मूल्यांकन के लिए कठोर सिद्धांत विकसित करना है।

स्टैनफोर्ड इंस्टीट्यूट फॉर ह्यूमन-सेंटर्ड आर्टिफिशियल इंटेलिजेंस (HAI) की एक नई पहल, सेंटर फॉर रिसर्च ऑन फाउंडेशन मॉडल्स (CRFM) ने 23-24 अगस्त, 2021 तक फाउंडेशन मॉडल्स पर कार्यशाला की मेजबानी की। इन उभरती प्रौद्योगिकियों के अवसरों, चुनौतियों, सीमाओं और सामाजिक प्रभाव पर चर्चा करने के लिए विविध दृष्टिकोण और पृष्ठभूमि

Post a Comment

0 Comments