आज की दुनिया में AI यानी आर्टिफिशियल इंटेलिजेंस का दूसरा नाम बन चुका है ChatGPT. स्कूल के बच्चों से लेकर बड़े-बड़े प्रोफेशनल्स तक, हर कोई इसका इस्तेमाल कर रहा है. हम सब GPT-3, GPT-4 और अब GPT-5 के बारे में तो खूब बातें करते हैं, लेकिन क्या आपने कभी सोचा है कि इसके नाम में ही छिपे GPT का आखिर मतलब क्या है?
यह सिर्फ तीन अक्षर नहीं हैं, बल्कि यह उस पूरी टेक्नोलॉजी का राज खोलते हैं जिसने दुनिया को बदल कर रख दिया है. आइए, आज ChatGPT के नाम का ही पोस्टमॉर्टम करते हैं और इस राज से पर्दा उठाते हैं.
GPT में तीन अक्षर, जिनमें से प्रत्येक टेक्नोलॉजी की कार्यक्षमता के एक महत्वपूर्ण बात को बताता है. इसका अर्थ है ‘जेनरेटिव प्री-ट्रेन्ड ट्रांसफॉर्मर’ (Generative Pre-trained Transformer). इन तीन शब्दों को समझना यह जानने के लिए आवश्यक है कि यह AI आर्किटेक्चर इतना परिवर्तनकारी क्यों साबित हुआ है.
चलिए सबसे पहले ‘जेनरेटिव’ को समझते हैं. यही वह खासियत है जो GPT को पुराने AI से अलग करती है. पुराने सिस्टम आमतौर पर सिर्फ पहचानने (जैसे किसी तस्वीर में वस्तु को पहचानना) या भविष्यवाणी करने (जैसे स्टॉक की कीमत का अनुमान लगाना) तक ही सीमित थे. लेकिन GPT बनाने, यानी क्रिएट करने में माहिर है.
इसे ऐसे समझिए कि यह एक ऐसा स्टूडेंट नहीं है जो सिर्फ रट्टा मारता है, बल्कि एक ऐसा कलाकार है जो नई पेंटिंग बना सकता है. विशाल डेटा पर ट्रेंड होने के कारण, यह मानव भाषा के पैटर्न्स और बारीकियों को सीखता है, जिससे यह पूरी तरह से नया, स्वाभाविक लगने वाला कंटेंट तैयार कर पाता है. इसमें निबंध लिखना, कोड लिखना, ईमेल का जवाब देना और यहां तक कि कविता बनाना भी शामिल है.
अब आते हैं ‘प्री-ट्रेंड’ पर. इन मॉडल्स को किसी खास काम के लिए इस्तेमाल करने से पहले, उन्हें एक गहन ‘प्री-ट्रेनिंग’ से गुजारा जाता है. यह एक विशाल प्रक्रिया है जिसमें AI को हजारों किताबों, आर्टिकल्स, वेबसाइट्स और अन्य टेक्स्ट स्रोतों वाले विशाल डेटासेट खिलाए जाते हैं. इसे आप एक ऐसे किताबी कीड़े की तरह समझ सकते हैं जिसने दुनिया की लगभग सारी किताबें पढ़ रखी हैं.
इस व्यापक शुरुआती ट्रेनिंग के कारण, GPT मॉडल तुरंत बहुमुखी हो जाता है, जो जटिल रिसर्च को सारांशित करने से लेकर सामान्य ज्ञान के सवालों का जवाब देने तक, कई तरह के काम करने में सक्षम होता है, और इसके लिए उसे हर काम के लिए अलग से ट्रेनिंग की आवश्यकता नहीं होती.
और आखिर में, ‘ट्रांसफॉर्मर’. यह GPT का तकनीकी दिमाग है, वह वास्तुशिल्प नया विचार जिसने इसकी शक्ति को संभव बनाया. 2017 में Google के रिसर्चर्स द्वारा पेश किया गया, ट्रांसफॉर्मर मॉडल ने AI द्वारा भाषा को प्रोसेस करने के तरीके में क्रांति ला दी.
इसकी मुख्य विशेषता ‘अटेंशन मैकेनिज्म’ है, जो मॉडल को एक ही समय में पूरे टेक्स्ट को प्रोसेस करने और सबसे महत्वपूर्ण या प्रासंगिक शब्दों पर ध्यान केंद्रित करने की अनुमति देता है, चाहे वे वाक्य में कहीं भी हों. यह पुराने मॉडल्स की उस बड़ी सीमा को पार करता है जो टेक्स्ट को धीरे-धीरे, शब्द-दर-शब्द प्रोसेस करते थे और अक्सर लंबे पैराग्राफ में संदर्भ और सुसंगतता बनाए रखने के लिए संघर्ष करते थे.
GPT आर्किटेक्चर अब केवल टेक्स्ट तक ही सीमित नहीं है. अब यह मल्टीमॉडल AI में विकसित हो रहा है, जो न केवल टेक्स्ट, बल्कि इमेज, ऑडियो और वीडियो को भी समझने और जेनरेट करने में सक्षम है.
यह भी पढ़ें: WhatsApp का नया फीचर, अब अकाउंट से जुड़ेगा Facebook प्रोफाइल, जानें क्या होगा फायदा